2025年のAI予測とOpenAIのo3について

6,531 文字

AI Predictions for 2025 & More on OpenAI's o3

AI PREDICTIONS are never easy but we give our thoughts on what will happen in 2025 and beyond as well as dive into OpenA...

今年も終わりに近づき、私たちは2025年のAI予測をお届けします。2025年は大きな年になるでしょう。そして誰がO2を完全にスキップすると予測したでしょうか？そうです、OpenAIが新しいモデル、基盤となる何かであるo3を発表しました。なぜそれが皆を興奮させているのか、お伝えしていきましょう。
2024年も終わりに近づき、ケビン、先週私たちはo3、OpenAIの新しいフロンティアモデルが予告されるのを目にしました。そしてもしかしたらGPTという命名法から離れ、何か新しいものに移行したのかもしれません。O2ではなくo3というのは奇妙です。彼らは他の製品への敬意を表して、という説明をしていましたが、実際にはイギリスの大手通信会社O2があるため、単純にO2をスキップしてo3に進むことにしたのです。
次のフロンティアモデルについて話していきましょう。論理的にはO2と呼ばれるべきかもしれませんが、通信会社への敬意を表して、そしてOpenAIの伝統的な命名センスの悪さにより、o3と呼ばれることになりました。予想通り、性能は向上しています。興味深いのは、o3ミニモデルでさえ、現在私たちがアクセスできるo1モデルをいくつかのベンチマークで上回っているということです。私たちは、スケーリングが向上し、推論の計算能力も向上すると予測していましたが、まさにその通りになっています。より高速に、より安価に、より高性能になっているのです。
o3の発表で最も興味深かったのは、最高計算バージョンが世界のAIの主要ベンチマークとして知られるArc AGIテストで85%のスコアを記録したことです。o3には低、中、高の3つの計算バージョンがあり、これは実際にどれだけの計算時間を投入するかを意味します。実際、Arc AGIの主催者の一人がライブストリームに登場し、この成果がいかに印象的かを語りました。Arc AGI バージョン1は、0%から5%に到達するのに5年かかりましたが、今日o3は低計算バージョンで75.7というスコアを達成し、新たな最高記録を打ち立てました。
ケブ、一般的に私たちはまだこれを手にしていません。現在レッドチーミング段階で、その後皆に公開されることになります。AIを進歩させようとしているわけではなく、単純な用途に使用している私たちのような一般ユーザーにとって、これが何を意味するのか見るのは非常に興味深いでしょう。
クリスマス翌日の今、来年何が起こるかについて予測するのはいい機会だと思います。少し前に傾向について話す回がありましたが、今は2025年に起こりそうないくつかのことを予測する価値があると思います。
私の最初の予測は、実は番組であまり話題にしてこなかった暗号通貨に関するものです。スーパードッグではありません。ちなみにそのトレーラーは良さそうですね。ジェームズ・ガンのスーパーマンに期待が持てそうです。
暗号通貨は、少なくとも来年前半はAIと結びつくと思います。そこでは多くの興味深いことが起きています。暗号通貨業界は非常に怪しい面もありますが、同時に開発者たちにとっては興味深い即時の資金源となり得ます。プロジェクトに投資できる可能性があるのです。AIのエッジケースの一部に暗号通貨が結びつくような世界が来ると思います。少なくとも最初の6ヶ月はそういった動きが増えるでしょう。暗号通貨のサイクルを理解している人なら、来年は暗号通貨にとって大きな年になる可能性があります。もちろん暴落する可能性もありますが、それが暗号通貨というものです。
これまで見てきたAIと暗号通貨の組み合わせについて、初心者向けに説明すると、ガビンは、AIがトークンに紐づいた何かの代わりにツイートしたり決定を下したりするような人格を持つということのようです。家族と休暇や新年を過ごしている人に、来年のAIと暗号通貨の関係をどう説明すればいいでしょうか？
基本的な説明としては、現在暗号通貨界隈では多くの人がAIエージェントについて話していますが、それは私たちが番組で話してきたような意味でのAIエージェントとは異なります。私たちが話してきたAIエージェントは、旅行の予約など、実際にあなたの代わりに何かを行うものです。この場合は本質的にAIの人格のことを指しています。
最も有名なのは、@TR_terminalというハンドルネームから生まれたgoat coinです。これは上下を繰り返していますが、多くの人が聞いたことがあるかもしれないfcoinも、Truth Terminalのツイートの一つに基づいています。つまり、LLMに接続されたAIの人格がツイートを行うというものでした。
現在では、もう少し興味深いことを試みる人々が出てきています。この放送が出る頃には詐欺である可能性もありますが（これは暗号通貨プロジェクト全般について理解すべき最も重要なことで、多くのプロジェクトがゼロになってしまうため、投資を推奨することはできません）、Yes No Errorという会社が立ち上がったばかりです。Mark AndreessenがXで、o1（現在はo3かもしれません）を使用して科学論文のエラーをチェックする会社を作るというアイデアについて尋ねていました。暗号通貨関係者とこのDoc氏が、これを行える単純なAIを作成し、このチェックの支払いに暗号通貨を使用するというシステムを構築しました。今後このような形態が増えていく可能性があります。
私にとって今年の終わりは、コーディングに関して個人的に非常に変革的でした。私たちはAIが工場の仕事を奪うと考え、倉庫労働者のことを嘆き、そしてクリエイターたちがメールやプロの文章、マーケティングコピーを書かれることにパニックになり、プログラマーたちは「まあ、私たちはここでコードを書いているから大丈夫」と思っていました。しかし実際には、他の何よりもコーディングが完全に解決される可能性があります。
番組で話してきたように、コードは動くか動かないかのどちらかです。より最適化されたり、より優雅だったり、より安全になる可能性はありますし、優れたコードを書くことには確かに芸術性があると思います。しかし、まったく何をしているのか分からない人、バスを運転する猫のような存在（音声版をお聞きの方には、私自身を指していることをお伝えします）である私でも、Code Codやコーディングエージェントを使用して、あらゆる種類の製品やインテグレーションを作ることができています。
AIの音声アシスタントにウェブをリアルタイムでクロールさせ、特定の方法で結果を返し、複数のデバイスに表示させる必要がある場合、数ヶ月前なら私は大きく肩をすくめ、その活動をどう説明すればいいのかさえ分からなかったでしょう。しかし今では自分で構築することができます。素晴らしいものは作れないかもしれませんが、とにかく作ることはできます。来年はこれが飛躍的に向上すると予想しています。
そしてそれがo3の最大のアップグレードの一つですよね。o3やo1をどう使うか分からないと言いますが、o3のコーディング能力は格段に優れています。ケビン、あなたの指摘で興味深いのは、最終的にコーディングはコーディングではなくなるかもしれないということです。単に欲しいものを要求すれば、コンピュータがそれを作るようになるかもしれません。コーダーであることは確かに役立ちますし、トップレベルのコーダーがすぐに仕事を失うとは言っていません。しかし、欲しいものを要求すれば、それを作ることができ、その後でそれをより良くし、調整し、修正する専門のコーダーを呼ぶ必要があるかもしれません。ただし、AIがそれも行える可能性があります。それは驚くべきことです。
ウェブサイトやソフトウェアスイート全体を「ワンショット」で作成するという概念が実際に現実になりつつあります。つまり、あなたや私、この番組を聴いている誰かが、ウェブサイトやモバイルアプリ、バックエンドに必要なものを平易な英語で要求すると、システムがそれを理解し、ドキュメントを作成し、コードを書き、自身のテストを作成し、自己改善を行うのです。
2025年はエージェントの年になると思います。これは年末の予想としては驚くべきものではありませんが、すでにそういったものが展開され始めています。基本的に、機械に高レベルのタスクを与えると、それを小さなタスクに分解し、自律的にそれらを実行し、自己改善を行い、準備ができたらあなたの電話に通知を送ったり、Alexaを鳴らしたり、電子レンジを鳴らしたりしてソフトウェアの準備ができたことを知らせる、ピザが再水和されたことを知らせる、それが私にとって2025年の約束です。
その通りです。私の次の大きな予測は、AIビデオと、AIビデオを使用して大規模なビデオプロジェクトを作成することに関するものです。私たちは両方とも「プロンプトからハリウッドへ」を信じており、それについて少し話し、トレンドのエピソードでも取り上げました。具体的には、Genesisという新しいプロジェクトが発表されました。まだ誰も実際に試していないと思いますが、これは本当に素晴らしいことを実現します。UnityやRealのような3Dエンジンの生成と、リアルな生成AIを組み合わせるのです。
このビデオをまだ見ていない人は、ショーノートにリンクを載せておくので、ぜひ見てみてください。ケブ、a16zが、AIビデオのピクサーがビデオゲーム界から生まれると予測していましたが、私にはこれがまさにそれに当てはまるように思えます。私たちはワールドビルディングについて多く話してきましたし、AIビデオが実際にはワールドシミュレーションであるという考えについても話してきました。
Genesisができると言っていることを見ると、私が読んだところでは計算処理は途方もないもので、一般の人々がすぐにアクセスできるようなものではありませんが、ハイネケンのボトルを示し、ボトルを流れる一滴の水滴にまでズームインできる素晴らしいビデオがあります。彼らによれば、これはすべて選択ごとにプロンプトで生成されているとのことです。
AIビデオツール群、そして最終的にはAIの世界創造ツールを手に入れることができれば、「プロンプトからハリウッドへ」は本当にもうすぐそこまで来ています。再度言いますが、このような会社は非常に高価なため、スタジオに売却される可能性がありますが、マーベル映画のVFXチームが200人ではなく5人のチームになるようなスタジオを想像してみてください。これが私にとって最も興味深いことの一つです。私の予測は、これらのシステムの一つがハリウッドのVFX業界に食い込み始め、主要な映画の制作方法を完全に変えてしまうということです。小規模な映画だけでなく、本当に大規模な映画にも影響を与えるでしょう。
ガブ、私もそういったものが、これまで見てきたテキストから動画や画像から動画へのツールと統合されていくのが見えます。「浜辺を走る馬が欲しい」と言って、蹄が砂を打つ音など、物理シミュレーションで正確にモデリングするために追加の計算コストを払うことができるようになるでしょう。これは非常にエキサイティングで魅力的です。
5年以内に「プロンプトからハリウッドへ」という予測について、私たちは野心的すぎると批判されましたが、間違っていたかもしれません。来年にも賞を受賞するようなショートフィルムが出てくるかもしれません。誰かがマントに何かを詰め込むでしょう。しかし、「プロンプトからハリウッドへ」に関してはAGIを定義していませんでした。完全にAIで生成されたCMがテレビに登場するのを見てきましたが、これで目標を達成したと言えるのでしょうか？それとも1時間45分の長さで、観客が1時間30分であればよかったと思うような何かが必要なのでしょうか？
AIビデオに関連して、もう一つ予測できることは、出力の一貫性についてです。すでにPikaの新しいリリースは、一貫した出力を生成するのが非常に優れていると言われています。主要なAIビデオモデルはすべて、個々のキャラクターを一貫して維持できるようにこれに焦点を当て始めると思います。それはかなり大きな進展のように感じます。
ケブ、次はフロンティアモデルに関する予測です。年末にo3を発表するのは興味深いことです。なぜなら、これらの企業の内部では常に次のものに取り組んでいることを私たちは知っているからです。フロンティアモデルについては、新しいMetaモデルが出ることも、新しいxAIモデルが出ることも分かっています。しかし、OpenAIとGeminiは選挙を待ってこれらのモデルを年末に発表したのだと思います。なぜなら、次のものを調理していたからです。来年第2四半期までには新しいフロンティアモデルが登場すると本当に予想しています。
これはビッグディールです。どれだけの改善があるか見るのは興味深いでしょう。o3のベンチマークはo1より25%しか優れていないため、これを新しいフロンティアモデルとは感じないという人もいるでしょう。しかし、しばらくはそういう状態が続くと思います。100倍も良くなるわけではありませんが、定期的に25%ずつ良くなっていけば、多くの人が考えるAGIに非常に近づいています。
大手企業について触れましたが、Anthropicを除外してしまいました。彼らは依然として多くの人が最高クラスと考えるコーディングモデルを持っています。しかし、新しいOpusや新しいSonnetが何をもたらすか見てみましょう。Mistralも無視すべきではありません。彼らも明らかに何かに取り組んでいます。そしてオープンソース化されることを願っています。Metaの新しいLlamaモデルについても触れましたが、彼らの推論モデルはどこにあるのでしょうか？きっと来るでしょう。業界全体で刺激的な進展が起きています。
AIと戦争についても触れておきましょう。暗い話題になりすぎないように簡単に触れるだけにしますが、OpenAIがAndrewとパートナーシップを結ぶという発表が次々と来ています。軍事技術は進歩すると思います。来年末までに家庭に二足歩行ロボットが入るかどうかは分かりませんが、選択肢としてはあるでしょう。ただし、多くの人が選ぶとは思いません。
最後になりましたが、重要なのは、AIによる新たな大規模な幻覚事象です。ニュージャージー上空やその他の場所でのUAP（未確認航空現象）について、私たちはポッドキャストであまり触れませんでしたが、これらの動画を生成して、どれだけ広がるか見るのは本当に楽しかったです。これが私たちの現在の活動です。
ケビン、年末なので白状しましょう。あれは全て私たちでした。私たちがUAPの正体だったのです。議会での討論を生成するのは本当に簡単で楽しいです。しかし、残念ながら来年は、私たちのように冗談で済ませられない誰かが、これらのツールを悪用する可能性があります。ガビン、その点について警鐘を鳴らしておきたいと思います。皆さん、注意が必要です。しかし、私たちのUAPネタは楽しんでいただけたと思います。
その通りです。面白いのは、UAPのような大規模な幻覚は、AIがなくても頻繁に起こるということです。それは明確にしておく必要があります。
さて、今日は短めのエピソードでした。皆さんにどれだけ感謝しているか、お伝えしたいと思います。YouTubeでいいねやサムズアップをお願いします。また、オーディオポッドキャストもご登録ください。来週は通常のエピソードでお会いしましょう。これは休暇シーズンということで短めのエピソードにしました。皆さんに本当に感謝しています。新年明けにお会いしましょう。良い休暇を、そして良いお年を。皆さん、お気をつけて。