
3,992 文字

人類は本当にAIの制御を失いつつあるのでしょうか。OpenAIのオペレーターエージェントが登場します。最近のブルームバーグの記事で、OpenAIが自律型AIエージェントの発表を準備していることが明らかになりました。その後、社内会議でOpenAIは、最も野心的なプロジェクトとなる「オペレーター」を発表しました。このAIはあなたのデジタルライフ、つまりコンピューター、メール、個人データなど、すべてを完全にコントロールします。
OpenAIのCEOであるサム・アルトマンも、次の大きなブレークスルーはエージェントになるだろうと述べています。彼は次のような例を挙げています。「人々がAIエージェントが代わりに行動するという話をする時、よく挙げられる例として、エージェントにレストランの予約をしてもらうというものがあります。OpenTableを使うか、レストランに電話するかのどちらかですね。確かに、それは少し面倒な作業を省けて便利かもしれません。
しかし、私が面白いと思うのは、人間ではできないことや、しないことができる世界です。例えば、1つのレストランに予約の電話をする代わりに、私のエージェントが300件のレストランに電話をかけて、私に最適な料理があるところや、特別なものが提供されているところを見つけ出すというのはどうでしょう。エージェントが300件も電話をかけるのは迷惑だと思うかもしれませんが、それぞれの300件の場所でエージェントが応対していれば問題ありません。人間にはできない並列処理が可能になるのです。これは些細な例ですが、人間の処理能力には限界があり、これらのエージェントにはそういった制限がないかもしれません。
しかし、私が思うにより興味深いカテゴリーは、レストランに電話をかけてくれるものではなく、優科な先輩社員のような存在です。プロジェクトで協力し合い、エージェントが2日や2週間の作業を上手くこなし、質問がある時だけあなたに連絡を取り、素晴らしい成果物を持って戻ってくるようなものです。」
しかし、彼が次に明かしたことは、AI業界の誰もが衝撃を受けるものでした。コードネーム「オペレーター」は2025年1月に発表される予定で、独立して作業を実行します。この発表の前に、OpenAIの最高製品責任者は「2025年はエージェントシステムが主流になる年になる」と発表していました。
私たちは制御を失いつつあるのでしょうか。OpenAIはまず研究プレビューとして、その後開発者ツールを通じてオペレーターを発表する予定ですが、一般消費者向けのリリースはまだ非公開のため、私たちは待つ必要があるかもしれません。オペレーターの最も素晴らしい点は、あなたの習慣から学び、好みに適応し、デジタル環境全体をカスタマイズすることです。
では、なぜ彼らはこれを急いでいるのでしょうか。それは、AIラボが大きなプレッシャーにさらされているからです。モデルはより高価になり、改良のペースは遅くなっています。そして彼らはブレークスルーを必要としています。AIの開発に注ぎ込んだ何十億ドルもの投資を正当化する革新的な製品として、ChatGPTの次を自律型エージェントに賭けているのです。
しかし、本当の疑問は、次に来るものに彼らは準備ができているのかということです。AIエージェントレース、AI支配をめぐるレースは新しい段階に入りました。誰もがチャットボットに注目している間、テック大手は密かにもっと強力なものを構築していました。
Anthropicが最初の一手を打ちました。彼らのAIシステム「Claude」は既にコンピューターを制御し、カーソルを動かし、リアルタイムでコードを書くことができます。すべてのクリック、すべてのキーストロークは人工知能によって実行されます。
「私はSamで、Anthropicの研究者の一人です。Compuは私たちが長らく重要になると感じていたものです。今日は、コンピューター使用の初期バージョンについて、そして私たちが有用だと考える代表的な例について説明します。
今日は簡単なデモをお見せします。この架空のデモでは、顧客である「アント・イクイップメント・カンパニー」がベンダーリクエストフォームの記入を依頼してきました。このフォームに必要なデータは私のコンピューター上のさまざまな場所に散らばっています。私たちが行うのは、Claudeにスプレッドシートを確認してもらい、イクイップメントが記載されているかどうかを確認し、なければCRMに移動してより多くの情報を探してもらうことです。
Claudeはこのデータを取得した後、フォームに記入し、ベンダーフォームに情報を転送します。最初に、Claudeは私の画面のスクリーンショットを撮り始め、アント・イクイップメント・カンパニーがスプレッドシートに実際には記載されていないことにすぐに気付きます。そこで最初に、CRMに切り替えて対象の企業を検索します。
幸運なことに検索にヒットし、Claudeはページをスクロールしながらフォームの記入に必要なすべての情報を探し始めます。その後、Claudeは私が何もする必要なく自律的に情報の転送を開始し、必要な情報をすべて記入して、フォームを提出します。この例は、人々が行わなければならない多くの単調な作業を代表するものです。これはAPIで利用可能で、人々に試してもらうことを楽しみにしています。今後数ヶ月でさらに良くなることが期待できます。」
しかし、これは始まりに過ぎませんでした。Googleもこのレースに12月リリース予定の謎のプロジェクトで応えました。さらに高度だと噂される彼らのエージェントは、OpenAIより先に市場に出る可能性があります。Microsoftも手をこまねいているわけではありません。彼らのコパイロットエージェントは既にビジネスの運営方法を変革しています。メール管理から複雑なデータ分析まで、すべてを処理するカスタムAIアシスタントです。エンタープライズ世界は注目しています。
しかし、OpenAIの最高製品責任者はさらに大きな変化が来ると見ています。2025年は全く異なるものになるでしょう。密室の中で、これらの企業は私たちが考えもしなかった境界を押し広げています。命令に応じるだけでなく、主導権を握り、決定を下し、独立して操作するAIエージェントを開発しています。
2025年1月がその始まりを告げます。OpenAIのオペレーターは研究プレビューとして、その後開発者向けのAPIを通じてデビューします。しかし、これは第一段階に過ぎません。私たちは来るべきものの一端を垣間見ています。複雑なタスクを実行するブラウザベースのエージェント、あなたの代わりに電話をかける音声システム、24時間365日デジタルライフを管理するバックグラウンドプロセスです。
かつてないほど高い賭け金が掛けられています。これらは人間とコンピューターの相互作用の未来に賭けられた数十億ドル規模のベットです。各企業は最初に、最高に、そしてすべてを変えようと競争しています。
現実を見てみましょう。最近の報告によると、OpenAIは課題に直面しています。AI言語モデルは開発の壁に突き当たっており、改良の効果は逓減しています。AI専門家のゲーリー・マーカスは警告します。「OpenAIやMicrosoftのような企業の法外な評価額は、大部分がLLMが人工汎用知能になるという考えに基づいています。しかし、そこには問題があります。事実の明示的な表現なしに、言語の統計だけを扱うシステムにおいて、幻覚には原理的な解決策がありません。」
AIラボはモデルの改良に何百万ドルも費やしていますが、得られる成果は小さくなり、コストは急上昇しています。ChatGPTが間違いを犯した場合、単にそれを無視することができます。しかし、あなたのコンピューターを制御するAIエージェントが間違いを犯した場合、それは違います。それは現実であり、危険なのです。
危険な未来。しかし、物事は変化しています。2025年1月、それがオペレーターが発表される時です。まず開発者に、そしてAPIを通じて。OpenAIの壁の向こうでは、彼らは複数のエージェントに取り組んでいます。ほぼ完成したブラウザベースのツール、あなたの代わりに電話をかけることができる音声対話システム、静かにデジタルライフを監視・管理するバックグラウンドエージェント。これらのピースがすべて、私たちがようやく理解し始めている方法で組み合わさっています。
課題があるにもかかわらず、アルトマンは現在のハードウェアでAGIは達成可能だと主張しています。200万人以上の人々が選挙関連の決定をChatGPTに委ねています。企業は何十億ドルもAI開発に注ぎ込んでいます。技術は進化しているだけでなく、加速しています。そしてOpenAIがその先頭に立っています。
しかし、私たちは準備ができているのでしょうか。あなたのコンピューター上で行うすべてのことを考えてみてください。そして今、それらすべてをAIが制御することを想像してください。自律型AIエージェントの時代は来るのではありません。既にここにあるのです。
その兆候は至る所に見られます。テック大手の戦略的な動き、加速する開発サイクル、より強力で自律的なシステムを作り出すためのレース。これは遠い未来の話ではありません。これは明日の、2025年1月の話です。
しかし、AIについて複雑な意見を持つ人物が一人います。ジェフリー・ヒントンはAIについていくつかの誤った見解を持っています。彼の考えを知りたい場合は、画面上の動画をクリックしてください。
コメント