OpenAIが最強のAIを公開 – Deep Researchと秘密のAIデバイス

4,634 文字

まず、OpenAIからの2つの重要なアップデートについてお話しします。最初に、最新フラグシップモデルo3をベースにした新しいAI駆動ツール、もしくはエージェントであるDeep Researchについて見ていきましょう。これは、すでに公開されているo3 miniではなく、本格的なo3モデルの初めての実用化となります。次に、Appleのアイコニックなプロダクトを手がけたデザインの天才、ジョニー・アイブとのコラボレーションによるAI特化型ハードウェアデバイスの開発計画についてお話しします。サム・アルトマンがリードするこのプロジェクトは、iPhoneが登場して以来の大きな技術革新となる可能性があります。
では、詳しく見ていきましょう。OpenAIがAIエージェントのDeep Researchを立ち上げました。現在のところ、ChatGPT Proのサブスクライバーが利用できます。サム・アルトマンによると、まずはProユーザーに月100クエリの制限付きで提供され、その後チームプランとエンタープライズプラン、さらに無料プランでも利用可能になる予定です。
このツールは、インターネット上での複数ステップにわたる研究タスクを処理できます。通常は、一般的なChatGPTやGPT-4を使って回答を得ますが、それは基本的にオンデマンドのQ&Aアプローチです。一方、Deep Researchはいわゆるエージェントとして、数百のソースを閲覧し、テキスト、画像、PDFなど見つけられるものを全て精査して、完全に文書化され、引用付きで論理的なレポートを返してくれます。
これは知識を合成する能力が新しい知識を生み出すための前提条件となるため、AGIへの次の大きな飛躍と呼ばれています。数分で高度な文献レビューができるというのは、まさにゲームチェンジャーです。
OpenAIのチーフプロダクトオフィサー、ケビン・W氏はワシントンDCでデモンストレーションを行い、例えばアルバート・アインシュタインについて、もしアインシュタインがエネルギー長官の上院指名候補者だったとして、その経歴や想定される面接質問などの詳細情報を得る方法を示しました。Deep Researchはそうしたデータを全て探し出し、一つの首尾一貫したレポートにまとめ、全ての情報源を引用して自分で確認できるようにします。
ChatGPTのインターフェースでは、メッセージ作成時にDeep Researchを選択するオプションが追加されました。都市生活に適した通勤用自転車の詳細な分析や、ストリーミングプラットフォームの徹底的な財務分析といったクエリを入力できます。データファイルやスプレッドシートを添付することも可能です。
実行ボタンを押すと、サイドバーが表示され、エージェントが実行している手順、アクセスしているソース、新しい情報に遭遇した際の方向転換などが表示されます。質問の規模に応じて5分から30分ほどかかりますが、通常のチャットと大きく異なる点は、処理中に離れることができることです。コーヒーを飲みに行くなど、非同期で研究が行われるため、バックグラウンドで作業が進みます。
完了すると通知があり、チャット内に最終的な詳細なリサーチアナリスト風のレポートが表示されます。OpenAIによると、将来的には画像、データの可視化、グラフやテーブルなども埋め込まれる予定です。
興味深い比較例として、テキストラベルとアイコンの両方を持つボタンと、アイコンのみまたはテキストのみのボタンの使いやすさの違いについて質問があった場合を見てみましょう。GPT-4の短い応答では「アイコンは曖昧になる可能性があるため、アイコンとラベルの組み合わせの方が一般的に分かりやすい」という程度の要約になりますが、Deep Researchは実際の研究を参照し、ユーザーエラー率の統計、高齢者の使用パターン、Nielsen Norman Groupの推奨事項、文化によるアイコンの解釈の違いなどを含む大規模な詳細分析を作成しました。最終レポートは、クライントや教授に提出できるような、注意深くキュレーションされた複数ページの文書のような仕上がりになりました。
また、「NFLのキッカーの平均引退年齢は？」という質問でもテストされました。GPT-4は、リーグの平均年齢が29歳程度という簡単な要約と一般的な統計を示しましたが、Deep Researchはその質問を深く掘り下げ、ジョージ・ブランダが48歳で引退し、アダム・ビナティエリとジョン・カーニーが46歳まで現役を続けたことなど、詳細な歴史的分析を提供しました。この位置は衝突が少ないため長くプレーを続けられることを分析し、結果として異なるデータセットを参照しながらNFLの平均キャリア期間について複数段落にわたる研究論文のようなものが作成されました。
これが大きな違いです。簡単な統計が欲しい場合は短い回答で十分ですが、引用付きでより大きな全体像を見たい場合は、まさにDeep Researchが真価を発揮します。
では、これを動かしているものは何でしょうか。ウェブブラウジング、データスクレイピング、分析、そして特に推論に最適化されたo3と呼ばれるOpenAIの新しいモデルシリーズの今後のバージョンです。このシステムは実際のタスクを使用したエンドツーエンドの強化学習でも訓練されました。つまり、文字通りウェブ検索、結果の読み取り、分析、矛盾が見つかった場合の方向転換などを練習したのです。また、Pythonを使用してデータを処理したり可視化を生成したりすることもできます。
Deep Researchは、専門家レベルのクエリがどの程度処理できるかを確認するため、100科目3,000問からなる「Humanity’s Last Exam」でテストされました。通常のGPT-4は3.3%の精度でしたが、Grok-2、Claude 3.5 Sonnet、Gemini Thinking等の他のモデル、そしてOpenAI o3 Miniが13%の精度を示す中、Deep Researchを動かしているものは26.6%まで上昇しました。これは大きな飛躍であり、全てマルチステップ、マルチサーチの研究を可能にしたことによるものです。
また、実世界の質問に対するパブリックベンチマークであるGiaについても言及があり、Deep Researchはそのリーダーボードで特に高度な難易度において優れた成績を収めたとのことです。モデルがオンラインで多くのツール呼び出しを行うことを許可された場合、合格率が上がるなど、様々な指標を追跡しています。より多くブラウズし考えれば考えるほど、成績が向上します。これはまさに人間の研究者が働く方法と同じです。少し読んで、何かが足りないことに気付き、別の情報を読み、参考文献をクロスチェックして最終化する、というような具合です。
OpenAIは、最終的にはウェブブラウジングを超えた機能を望んでいます。将来的には、サブスクリプションベースのソースや企業の内部データに接続し、プライベートなPDFも分析できるようになる予定です。長期的には、フライトの予約や購入などの実世界のタスクを処理する別のAIエージェント「Operator」と連携して動作することを想定しています。目標は、あなたのために考え、研究し、行動する完全に自律的なAIアシスタントの実現です。
ここまでがDeep Researchについての大きなアップデートでした。次に、ハードウェアに関するニュースです。サム・アルトマンは、AIとのユーザーインタラクションを変革するような何かを実現したいという願望を明確に示してきました。話題は、Appleの元チーフデザインオフィサーであるジョニー・アイブとのパートナーシップで設計される全く新しいハードウェアデバイスについてです。
噂によると、基本的にスマートフォンの代替を目指しているとのことです。これは大きな声明ですね。2007年にiPhoneが全てを変えたように、「iPhoneのような画期的な製品」と呼ばれています。私たちが知る限り、アイブはAirbnbのCEOであるブライアン・チェスキーによってアルトマンに紹介されました。このプロジェクトは、ローリン・パウエル・ジョブズのエマーソン・コレクティブによっても資金提供を受けているようです。2024年末までに最大10億ドルの資金調達が見込まれており、これは相当な規模の資本です。
最初のヒントでは、このデバイスはタッチスクリーンを搭載し、メッセージの要約、周囲のオブジェクトの識別、旅行の予約など、生成AIの強みを活かした機能を中心に展開される可能性が示唆されていました。通常は複数のアプリに依存するこれらの機能を、標準的なスマートフォンの通常のソフトウェアではなく、根本からAIプラットフォームとして設計されたデバイスで実現します。
GoogleやAppleもスマートフォンにAIを追加しているじゃないかと思うかもしれません。確かにGoogleはローカルの生成AI機能を搭載したPixelを持っており、AppleもApple Intelligence関連の機能を探求しています。しかし、アルトマンの視点からすると、真のAIデバイスを実現するには単なるソフトウェアのアドオン以上のものが必要かもしれません。
数年かかる可能性があると述べていますが、確実に開発は進行中です。アルトマンはかつて、生成AI向けハードウェアを開発していたHumane Incというスタートアップに投資していたことが分かっています。そこから生まれた「Humane AI H」というデバイスは賛否両論でした。人々はバグが多いと指摘し、「Rabbit R1」と呼ばれる別のデバイスも良い評価を得られませんでした。
AIハードウェア製品の開発は容易ではありませんが、ジョニー・アイブが参加することでデザインはより洗練されるでしょう。また、o3や将来のバージョンなどOpenAIの高度なモデルを活用し、タスクをローカルまたはクラウドで実行することも想定されています。iPhoneよりも社会的に干渉の少ないものを目指しており、おそらく画面を見つめる時間を減らし、より自然なインタラクションを実現する、ウェアラブルデバイスや音声を主なインターフェースとして使用するものになるかもしれません。
タイムラインは示されていませんが、サム・アルトマンから、プロトタイプを見るまでに数年かかる可能性があるという発言がありました。コストについては、人々はすでにスマートフォンにお金を払っているので、必ずしも安価ではないものの、プレミアムまたは中価格帯を検討しているとのことです。
以上が、OpenAIのDeep Researchと今後発売予定のAIハードウェアデバイスについてのアップデートでした。質問がある場合や、どちらかのトピックについてさらに詳しく知りたい場合は、コメントでお知らせください。次の動画ではDeep Researchに重要な部分の調査を任せるかもしれません。ご視聴ありがとうございました。AIニュースと分析をもっと見たい方は、いいねと登録をお願いします。また次回お会いしましょう。