TikTokの創業者が驚くべき新しい推論AIを発表

5,262 文字

TikTok’s Creator Just Revealed a Wild New Reasoning AI...
In this video, we dive deep into TikTok’s latest AI breakthrough: a revolutionary reasoning AI that promises to redefine...

TikTokの親会社が、私たちが知る「賢いマシン」の概念を根本から変えるかもしれない驚くべき新しい推論AIを発表しました。この新しい推論AIが何なのか、一緒に見ていきましょう。
すべては2024年9月、OpenAIが彼らの01モデルについて興奮するようなニュースを共有したことから始まりました。それが最初の火花でしたが、事態が本当に熱を帯びたのは2025年1月にDeepSeekが彼らのR1モデルを導入したときでした。
それ以来、人工知能の最大手プレイヤーたちが新たな種類のレースに真っ先に飛び込んでいるような感覚です。しかし今回は、単に最速または最も安価であることだけが目標ではありません。最も賢くあることが重要なのです。誰もがより明確に論理的に考えるように構築されたAIモデルの新しい波を追いかけています。
これらのモデルは回答を出すのに少し余分な時間がかかるかもしれませんが、それは彼らが慎重に物事を考え抜いているからです。最初に思いついたことをただ吐き出すのではなく、彼らは一旦立ち止まり、一歩下がって、思考の連鎖をたどり、さらに自分が出した結論を振り返り、言っていることが理にかなっているかどうか自己チェックします。
あたかもAIが自分と話してから、あなたと話すようなものです。何か賢いことを言うだけでなく、真実を語るようにしているのです。そして今、この賢い競争に大手の名前に加わったのが、TikTokを開発した中国のテック大手Byte Danceです。彼らは独自の貢献として「SeedThinking V1.5」を発表し、注目を集めています。
この新しい言語モデルは、特に科学、技術、数学、エンジニアリングなどの難しいテーマに関して頭脳明晰なジーニアスであることを目指しています。しかし、それだけに限らず、日常会話や話題にも同じ思慮深いアプローチで対応できるように構築されています。現時点では、SeedThinking V1.5はまだ人々がダウンロードしたり試したりできるものではありません。Byte Danceは、このモデルが誰でも自由に使用・調整できるようになるのか、それとも特別な条件下でのみ利用可能な状態に保たれるのかについてはまだ明らかにしていません。この技術へのアクセスに関して、どれほどオープンまたはクローズドな状態になるのかについては、まだ分かっていません。
しかし、まだ手に入れることはできなくても、祝うべきことがあります。それはByte Danceがモデルの仕組みについて垣間見ることができる技術論文を共有したことです。そしてこの論文は、単に退屈な数字や専門用語で満たされているわけではありません。それはフードの下で何が起きているのか、そしてこのモデルがどのような可能性を持っているのかについて明確なアイデアを私たちに与えてくれます。
これはこのモデルができることのほんの一部に過ぎません。なぜこれが高い評価を得ているのか、見続けてください。何がこれを際立たせたのでしょうか?MetaがLlama 4で世界を驚かせ、Mistralが彼ら独自のMixtralを導入したのとそう変わらず、Byte Danceは今、同じくらい強力なSeedThinking V1.5で前進しました。
このモデルを際立たせているのは、そのスマートな名前だけでなく、構築されたスマートな方法です。それは「Mixture of Experts(専門家の混合)」アーキテクチャとして知られるものに従っています。複雑に聞こえるかもしれませんが、その背後にあるアイデアはかなり天才的です。次のように考えてみてください。すべてを理解するために一つの脳を使う代わりに、このモデルは一緒に働く専門家のグループのように設計されています。
各専門家は自分の特別な分野に焦点を当て、タスクが入ってくると、最も適した専門家だけが手助けするために参加します。それは質問や仕事のニーズに応じて、完璧なドリームチームを形成するようなものです。そして、これは本当に賢いことです。SeedThinking V1.5は2000億のパラメータという巨大な脳力を持っていますが(これはAIが考えるのを助ける小さなノブやワイヤーのようなものです)、任意の瞬間には200億しか使用しません。
このようにして、鋭さを失うことなく、大量のエネルギーと時間を節約します。それは巨大な工具箱から毎回すべてを取り出す代わりに、ちょうど適切なツールを使用するようなものです。Byte DanceはGitHubで共有した詳細な報告書の中で、このモデルは明確に考え、思慮深い構造化された回答を与えるよう訓練されていると述べています。
それは急いで答えを口走るわけではありません。代わりに、一旦立ち止まり、息を整え、実際に意味のある応答をくれる賢い友人のようなものです。そして驚くべきことに、この努力の成果はすでに波紋を広げています。SeedThinking 1.5は競争に追いつくだけでなく、多くの面でリードしています。
それはすでに印象的だったDeepSeek R1より優れた性能を示し、Googleのブランドの新しいGemini 2.5 ProやOpenAIのO3 Mini High Reasonerのような巨人に追いつき始めています。そしてそれはかなり大きな出来事のように見えます。もう一つの興奮する部分は、このモデルがARC AGIベンチマークと呼ばれるものでどれだけうまく機能するかです。
このテストはAIの世界で非常に重要です。なぜなら、それは機械が人間のような一般的な知能—AIの世界で誰もが追いかけている究極の夢—にどれだけ近づいているかを見るためのものだからです。そして驚くべきことに、SeedThinking V1.5は単に良い成績を収めただけでなく、このベンチマークでGeminiとOpenAIのモデルの両方を実際に打ち負かしました。
それはテクノロジー界の最大のタレントショーでトップに立つようなものです。OpenAIの価値測定方法によると、このモデルはすでに今日の経済で最も重要な多くのタスクにおいて人間よりも優れた性能を発揮しています。このモデルがどのように他の競合相手より賢かったのか。SeedThinking V1.5はまだ強力なパンチを備えた小型サイズのモデルとして紹介されています。
一部の最大のAIモデルほど巨大ではありませんが、それでも困難なテストで十分に通用する結果を提供します。それは小さいかもしれませんが、強さと決意に満ちた小さなエンジンのようなものです。そして本当に特別なのは、過度に大きくも複雑でもなく、多くのことを達成できる方法です。SeedThinking V1.5は、最も困難なテストでの素晴らしい結果で波紋を広げています。
AIM 2024チャレンジで印象的な86.7%のスコアを獲得し、人気のあるコーディングサイトCode Forcesで55%のパス率を達成し、GPQA科学テストで77.3%に達しました。これらの成果は、特に深い思考とスマートな推論を必要とする問題を解決するとき、OpenAIのO3 Mini HighやGoogleのGemini 2.5 Proのような最高のモデルと同等の位置に置きます。
しかし、さらに興味深いのは、このモデルが単に難問、論理、または数学に優れているだけではないことです。より自由な形式や創造的なプロンプトのような難しい推論を含まないタスクでテストされたとき、それでも輝きました。
実際、人々がDeepSeek R1の回答とSeedThinking V1.5の回答の間で選択するよう求められたとき、SeedThinking V1.5は8%多く選ばれました。これは大きなことです。なぜなら、モデルが単に数学コンペティションだけでなく、さまざまな状況で賢く思慮深くなれることを示しているからです。さらに進めるために、Byte Danceのチームは、AIMのような通常のテストが少し簡単に感じ始めていることに気づきました。
そこで、彼らは「Beyond AIM」という全く新しいものを作りました。この新しいチャレンジは、モデルが単に解決策を暗記するのを防ぐことを目的とした、より巧妙な手選りの数学問題で構築されています。これはモデルがどれだけうまく考えることができるかを真にテストするために設計されています。彼らはまた、Beyond AIMとCode Forcesチャレンジセットの両方を公開し、AI全体のコミュニティが前進するのを助けることを計画しています。
このモデルの成功の背後には、特にトレーニングに使用されるデータに関する多くの慎重な計画があります。チームは監督付き微調整フェーズのために400,000のサンプルを厳選しました。そのうち300,000は主に科学、数学、コーディングの堅実な事実に基づく問題でした。残りの100,000はより遊び心があり想像力豊かで、創造的なストーリーテリングやキャラクターのロールプレイタスクが含まれていました。
次に、強化学習の段階で、彼らはデータを二つのバケットに分けました。最初には100,000の慎重に選ばれたSTEM質問と巧妙なパズルが含まれ、ほとんどが明確な答えを持ち、専門家によってレビューされたものでした。これらはエリートコンテストや最高レベルのリソースから来ました。2番目のグループは創造的で意見ベースのタスクに焦点を当てていました。
これらは、二つの可能な回答が比較され、より良いものが選ばれるペアワイズ報酬モデリングと呼ばれる賢い方法を使って判断されました。興味深いことに、数学はこのモデルの形成において大きな役割を果たしました。難問の80%以上が高度な数学のトピックから来ていたからです。また、数独やカードベースの数字ゲームのような頭の体操もありました。
そして、モデルが行き詰まったり退屈したりしないように、モデルが賢くなるにつれて難易度レベルが調整されました。ちょうど選手がより強くなり続けるために、バーをちょうど十分に上げ続ける良いコーチのように。なぜSeedThinking V1.5が頭脳のパワーをバランスさせることができるのか。SeedThinking V1.5の学習プロセスの中心には、強化学習と呼ばれる慎重に作られた方法があります。
しかしByte Danceは通常のアプローチだけを採用したわけではありません。彼らはモデルがより良く学び、途中で混乱しないようにするために、独自の特別なひねりを加えました。彼らはVapoとDepoと呼ばれる二つのスマートツールを考案しました。VAPOを冷静なガイドとして考えてください。それは見守り、フィードバックを与え、Dapoはモデルがさらなるステップを踏めるよう導くものです。
一緒に、彼らはモデルのバランスが保たれるようにします。特に段階的な深い思考を必要とする長く巧妙な問題を解決する際に。大手テック企業を率いたり、企業内のAIシステムを管理したりしている人々にとって、この新しいモデルは言語モデルの構築と使用について考える方法を変えるかもしれません。SeedThinking V1.5は推論、報酬学習、洗練のための異なる段階を持つモジュラー層で構築されているため、開発者にはモデルが成長し行動する方法を制御しながら、望むようにモデルを形作る自由がより多く与えられます。これは強力なAIツールを構築しようとしながらも、それらが制御不能になるのを防ぎたいチームにとって夢のようなことです。
本当に際立っているのは、Byte DanceがSeed VerifierとSeedThinking Verifierという二つの特別なツールを追加したことです。これらのツールは、特に答えが単に正しいか間違っているかではなく、解釈の余地がある場合に、モデルが正直で現実的であり続けるのを助けます。顧客と密接に働いたり、厳格なルールを扱ったりするビジネスにとって、この種の組み込み信頼システムは大きな違いを生みます。
それは企業が単に良いパフォーマンスを発揮するだけでなく、責任ある行動をするAI機能を導入できることを意味します。そして、時間との競争を続けていたり、リソースが少なかったりするチームにとっては、SeedThinking V1.5の冷静で着実な学習ペースが救世主となる可能性があります。Vapoのようなクレバーなツールやモデルがどの様に学習するタスクを選ぶかということの賢い方法が、全てのプロセスをより速く滑らかにします。
ここまで読んでいただけたなら、コメント欄であなたの考えを教えてください。より興味深いトピックのために、今画面に表示されているおすすめの動画をご覧ください。視聴いただきありがとうございました。

コメント

タイトルとURLをコピーしました