OpenAIのDeep Researchに対する業界の反応 – "急激な離陸"

6,175 文字

The Industry Reacts to OpenAI's Deep Research - "Hard Takeoff"
Bring stories alive with AI characters: My Newsletter for Regular AI Updates 👇🏼 Links 🔗👉?...

Deep Researchが発表されてから24時間も経たないうちに、業界全体がその優秀さに驚愕しています。AIのリーダーたちは、これが離陸シナリオだと述べており、素晴らしいがん研究の支援など、複数の事例が挙がっています。そしてもちろん、Googleの何人かが「これ、私たちが考え出したものでは?」と顔を見合わせているようです。これら全てについて、今からご紹介していきましょう。
まず、Stability AIの創設者であるEmadの投稿を見てみましょう。私たちは明らかに知能の離陸シナリオにいます。AGIやASIなどは忘れてください。機械は近い将来、ほとんどのデジタル知識タスクをより速く、より優れた方法で、より安価に実行できるようになります。それらは互いに連携し、スケールアップし、失敗から学ぶことができます。その影響について考えたことはありますか?私は確実に考えていますし、皆さんにも考えていただきたいと思います。
彼が言う「離陸シナリオ」とは、Leopold Aschenbrenerが状況認識に関する論文で「知能爆発」と呼んだものを指しています。これはAGIに到達し、新しい知識を発見し、その知識を自身に適用することで再帰的な自己改善が可能になる時点のことです。私たちは間違いなく、今まさにその世界にいます。
これらのモデルによって新しい知識が発見されている例は、すでにいくつもあります。数日前、Simon Willisonの記事について投稿しましたが、彼は基本的にDeep Seekに自身の速度を改善する方法を考え出すよう促しました。すると実際に改善方法を見つけ出し、速度を2倍に向上させました。これはSimonが行ったのではなく、単にプロンプトを与えられただけで方法を見つけ出したのです。これが自己改善です。
物事がいかに急速に進んでいるかを示すために、New York TimesのテクノロジーコラムニストであるKevin Bruseの発言を紹介しましょう。「Humanity’s Last Exam」(非常に暗い名前のベンチマーク)について書いた時、トップのAIモデルは88.3%でした。現在は5つのモデルがそれを超え、最高のモデルは96.6%を達成しています。彼が指しているのは、ここに示されているDeep Researchです。わずか10日前の話です。
これはどのようにして実現されているのでしょうか?どうしてこれほど急速な進歩が可能なのでしょうか?それはDeep Seekの効果です。確かにOpenAIが最初に推論モデルを市場に投入しましたが(o1ファミリーモデル)、Deep Seekはそのパワーを世界に示しました。なぜならDeep Seekはオープンソースで、その技術を詳細に公開したからです。
Nathan Lambertは次のように述べています。強化学習は進化し続けています。OpenAIが最近リリースしたDeep Researchは、さまざまな分野にわたる困難なブラウジングと推論タスクにおいて、エンドツーエンドの強化学習を使用して訓練されました。
これこそが、Sam Altmanが「AGIへの直接的な道筋がある。やり方は分かっている。ただ構築するだけだ」と言った時に言及していたものでしょう。推論モデルと、ウェブ検索能力やPython環境内でのコード実行などのツールを組み合わせたものです。私たちはそれを発見し、今や誰もがそれを知っています。
ちなみに、これはOpenAIだけの話ではありません。誰もが知っているのです。Deep SeekがR1の論文を公開してくれたことに大きな敬意を表します。なぜなら今や誰もがそれを見て、まさにそれが方法だと理解し、そのアーキテクチャを反復して改善できるからです。
AI教授のEthan Molickは、私たちは「検索」の時代の終わりを迎え、今は「研究」の時代にいると述べる記事を発表しました。それが世界に対して実際に意味することについて、この記事からいくつかのハイライトをご紹介しましょう。
未来への手がかりは週末に静かに到来しました。私はAIにおける2つの並行的な革命について議論してきました。自律エージェントの台頭と、強力な推論機能の出現です。OpenAIのo1がローンチされて以来、これら2つの流れがついに、本当に印象的なものへと収束しました。人間の専門家の深さとニュアンスを持ちながら、機械の速度で研究を行うことができるAIシステムです。
そしてEthan Molickは、推論モデルとエージェントの組み合わせがいかに信じられないほど強力であるかについて語り続けます。彼はいくつかのプロンプトを与えてレポートを作成させ、そのレポートは素晴らしいものでした。さらに彼は続けます。
これを視点に入れると、両方の出力は通常、人間の努力が何時間もかかるような作業を表しています。OpenAIのシステムからはPhDレベルに近い分析が、Googleからは優秀な学部生レベルの作業が得られます。本当に信じられません。AIラボが構築しているピースが、単につながっているだけでなく、互いに作用し合っているのが分かり始めています。推論機能が知的能力を提供し、エージェントシステムが行動する能力を提供しています。
そして、これは私がしばらくの間アーキテクチャについて話してきた方法です。モデルは中核的な知能ですが、世界で効果的であるためには中核的な知能以上のものが必要です。実世界で実際に物事を行う能力が必要です。それがウェブから情報を収集することであれ、コードを書いて実行することであれ、他のツールで異なるデータベースにプラグインすることであれ、本当に何でもですが、それはエージェントに与えられるツールの形で提供されます。
このセグメントはRender AIによって提供されています。このような音楽ビデオがどのように作られているのか疑問に思ったことはありませんか?簡単な手順で、AIを使用して一貫したキャラクターを持つ独自の音楽ビデオを作成できます。render.aiにアクセスし、ログインして、ホームページにあるキャラクターを作成するか、参照顔画像を使用してキャラクターを使用します。ここでは「Emily」という新しいキャラクターを作成し、このキャラクターを使用して音楽ビデオを作成します。
始めるのに最も簡単な方法は、音楽ビデオバナーをクリックすることです。その後、MP3ファイルを選択し、テスト用のサンプルファイルを使用するか、コンピュータから独自のファイルをアップロードできます。または、Suoなどの他の音楽生成ツールを使用してアップロードすることもできます。そうすることで、完全なAI音楽ビデオを作成できます。次に、ビデオのテーマ、歌詞などを説明します。これがビデオの見た目を本当に決定づけます。その後、ビデオのキャラクターを選択し、生成ボタンを押すだけです。
これは作成された音楽ビデオの例で、キャラクターは全体を通して良く定義され、一貫性があります。このような音楽ビデオのための優れた一貫したキャラクター生成が必要な場合は、Renderを使用してください。render.aiで試してみてください。紹介リンクを下に掲載します。私の紹介リンクを使用していただけると幸いです。私が紹介したことを彼らに知らせることができます。このセグメントでパートナーシップを組んでくれたRenderに感謝します。
では、ビデオに戻りましょう。これはGP-QA Diamondというベンチマークで、最も難しいSTEM(科学・技術・工学・数学)の質問をテストするものです。Y軸は精度を、X軸は異なるモデルのリリース日を示しています。これが急激な離陸に見えないなら、何が急激な離陸なのか私には分かりません。
ここの青い線を見てください。これは自分の専門分野でGoogleを使用している人間のPhDです。つまり、すでにその分野でPhDを持っており、Googleを使用することができ、約82%のスコアを獲得しています。そしてそれはo1 Proでした。今や私たちはo3がそれを上回っています。これがどれほど驚くべきことなのか、多くの人は理解していないと思います。
Dave Shapiroもそれを指摘しました。これは今年最も重要なデータです。ほとんどの人はその意味を理解していません。私たちの何人かは理解しています。そして私は、このグラフが本当に何を意味するのかを内面化することを強くお勧めします。
PhDは自分の分野の最先端にいます。今や私たちには、人間のPhDよりも優れた性能を持つ一般化されたPhDがあります。そしてそれが研究を行い、人工知能に関する新しい知識を発見し、その新しい発見を自身に適用することを許可すると、それを再帰的な方法で行い、再帰的な自己改善を実現します。それを並行して作業する何百万ものエージェントで掛け合わせると、それが急激な離陸です。他に何があるでしょうか?
私たちがどこにいるのかについて、異論の余地はないと思います。もし異論があれば、コメントを下さい。私は常に間違いを認める用意があります。しかし、私たちがどこにいるのかは全く不明確ではないと思います。
ハイプの代表者Sam Altmanは言います。500ドルの価値のために50セントの計算コストです。ほとんどの人々と企業が何が起きているのか理解する前に、ここには大きな裁定取引の機会があります。
ここにDaria Unutmaka MDがいます(名前の発音を間違えていたらすみません)。彼はジャクソン研究所の加齢研究とがん免疫療法の生物医学科学者、人類免疫学者の教授です。大したことないですよね?
彼が言うには、金曜日からDeep Researchにアクセスしており、ノンストップで使用しているとのことです。科学研究、出版、法的文書、医学、教育において、私のテストでは絶対的なゲームチェンジャーですが、おそらく他の分野でも同様でしょう。私はただ驚愕しています。
そして同じ人物による続きの投稿です。今日、私は2つのがんのケースについてDeep Researchに支援を求めました。1つは私の専門分野内で、もう1つは少し専門外でした。両方のレポートは単純に完璧で、専門医のMDだけが書けるようなものでした。これがゲームチェンジャーだと言った理由があります。信じられません。
前回のビデオでも取り上げましたが、これはOpenAIのFilipe Millanです。彼はOpenAIの従業員で、妻が乳がんの手術(両側乳房切除術)を受けた後、化学療法が適切かどうかを判断するためにDeep Researchを使用した方法について説明しています。人生でこのような非常に恐ろしい状況にいて、人間の医師から複数の相反するアドバイスを受けている状況を想像してください。そして今、Deep Researchに行くことができます。
彼は、Deep Researchが今まで見たことのない研究を見つけ出し、妻の年齢、生物医学的マーカー、その他の詳細を説明できることを説明しています。そして妻に特化したカスタマイズされたレポートを返してくれます。本当に驚くべきことです。
そしてDeep Researchが彼に与えたこのアドバイスは、彼が独自に検証し、この非常に恐ろしい時期に彼と家族により大きな確信と安らぎを与えました。
このクリップでは、私たちの仲間であり、Forward Future AIニュースレターの投稿者でもあるChuboi(ちなみに、まだ購読していない方は是非購読してください)が、昨日のDeep Researchローンチからのサム・オルトマンの講演から、このクリップを取り上げています。そこでサム・オルトマンは、Deep Researchがすでに彼の見積もりによれば、経済的に価値のある仕事の一桁台のパーセンテージを達成できると話しています。
もしそれが聞き覚えがあるなら、OpenAIによるAGIの定義は、経済的に価値のある仕事のほとんどを実行できることです。一桁台のパーセンテージは多くないように聞こえるかもしれませんが、しかしそれは何兆ドルもの経済的価値のある仕事に相当します。それは世界全体です。
このクリップを見てください:「これは、私の推定ですが、世界の全ての経済的価値のあるタスクの一桁台のパーセンテージを実行できるシステムだと思います。これはAIにとって大きな一歩前進であり、エンタープライズAIに対するAltmanのビジョンを本当に理解することができます。これは消費者向けバージョンに過ぎません。より強力なものが来るでしょう。」
また、このビデオを通じて私が話してきたように、新しい知識を発見できるAIが来ています。そして私たちがそこにいるかどうかは別として、明らかに彼はハイプを少し抑えようとしていますが、確実にそこにいるように感じられます。そしてAIが新しい知識を発見できるようになれば、私たちは急激な離陸の段階にいます。
このクリップを見てください:「これは次のステップに過ぎません。さらに多くのものが来ます。これは知識の統合についてです。最終的にAIは新しい知識を発明することになるでしょう。そしてそれは素晴らしい一歩前進になると私たちは考えています。今日のエンタープライズの価値はすでにかなり強力ですが、繰り返しますが、私たちはさらにずっと先に進むつもりです。」
しかし、誰もが喜んでいるわけではありません。特にGoogleです。Googleの複数の人々が、製品自体とその機能だけでなく、文字通りの名前についても彼らをコピーしたと発言しています。それはDeep Researchと呼ばれており、Googleのdeep researchと同じ名前です。
ここにGeminiアプリのプロダクトマネージャーであるAroush Selvinがいます。彼はOpenAIの発表を再投稿し、「彼らはどこからそのアイデアを得たのだろう?」と述べています。
そしてOpenAIの発表に対して、Google AI StudioのリードプロダクトであるLogan Kilpatrickは「Deep Researchのプロダクト体験はかなり素晴らしいです。今すぐ試してください」と言っています。明らかに彼はGoogleのバージョンを指しています。Googleの製品と全く同じ名前を付けるなんて、何を考えていたのか面白いですね。
最後に、Sam Altmanは、Deep Researchは「お楽しみはこれだけではない」というものではないと述べています。金曜日にo1 miniをリリースし、日曜日にDeep Researchをリリースしましたが、それは彼が言及していた「お楽しみ」ではありませんでした。「これはo3 miniのお楽しみではありません。あと数日待ってください。」次は何が来るのでしょうか?
このビデオを楽しんでいただけたなら、いいね!と購読をご検討ください。次回のビデオでお会いしましょう。

コメント

タイトルとURLをコピーしました