
5,475 文字

OpenAIが2025年になぜ一般の人々が驚くことになるのかを説明しました。もしあなたがこの動画を見ていてAI業界にいる人なら、おそらく驚くことはないでしょう。しかし、Sam Altmanの最近のブログ投稿は非常に示唆的で、私自身も知らなかったことがいくつか明らかになりました。この動画ではAIに関する深い考察をしていきましょう。
Sam Altmanのブログの中で注目すべき点の1つがこれです。このページには3つの重要な声明がありますが、特に強調されているのは「2025年にはAIエージェントが”労働力に参加する”可能性がある」という部分です。ここで”労働力に参加する”が引用符で囲まれているのは、それが私たちと一緒に働き、企業の生産性を実質的に変えることを意味するからでしょう。
これは驚くべき声明です。なぜなら、これは初めて真の意味でのデジタル従業員が登場し、様々なビジネスにおける多くの単調な作業をこなすことができるようになることを示唆しているからです。ビジネスにおいて時間が解放されれば、その時間をより効果的に使うことができるようになります。
私は過去3年間、Sam Altmanのブログ投稿に注目してきましたが、彼の予測の多くは的中しています。主要なAI企業のCEOとして未来を予測し、方向性を見極めることが彼らの仕事であることを考えれば、それは当然かもしれません。過去数年間のAIの軌跡を見ると、2025年末が現在のソフトウェアと比べてどのようになっているか非常に興味深いところです。
さらに驚くべきことは、実際にすでにいくつかのAIエージェントが労働力として参加していることです。多くの企業で静かな革命が起きているのです。Klarna社のCEOは、700人分の従業員の役割を果たすカスタマーサポートエージェントを導入したことについて語っています。
多くのビジネスリーダーは、自社への実際の影響を問うていますが、これは小規模なものではない実践的な応用例です。実際に人間のエージェントよりも顧客満足度が高く、より速く、より質の高いサービスを提供し、大きな影響を与えています。しかし、社会や政治家もこれが10年後に変化するものではないことを認識する必要があります。社会への影響は今後数年で現れるでしょう。
彼の発言は的確です。現在、様々な種類のエージェントが展開されていることを多くの人は認識していません。彼が言及するカスタマーサポートエージェントは特に重要です。なぜなら、カスタマーサポートは非常に単調な作業であり、通常顧客は不満を抱えていて、すでにイライラしており、時には非常に不快な会話になることもあるからです。
11 Labsの新しい会話型AIエージェントを少しお見せしましょう。会話型AIエージェントの構築は以前は非常に複雑で多大なリソースを必要としましたが、もはやそうではありません。声を作成するか、広範な高品質ライブラリから最適なものを探してエージェントの構築を始めることができます。
最高のLLMの中から選択し、知識ベースをアップロードし、エージェントの目標とパーソナリティを定義することができます。あるいは、独自のサーバーを統合して完全なコントロールを取ることもできます。
これらのeエージェントが32の異なる言語で流暢な会話ができる能力は驚くべきものです。他の国でカスタマーサポートホットラインに電話をかけ、その言語を話せない場合でも、AIエージェントはあなたが話す言語に即座に流暢に翻訳できます。これはAIエージェントの素晴らしい機能です。
私個人としては、ワークフローエージェントが好きです。これはmake.comで、ChatGPTエージェントを11 Labsエージェントと接続して動画を作成することができます。これは私のコミュニティのために作成したものです。また、ビジネスのリード獲得を試みる場合、これらのワークフローエージェントを使用し、データが処理されると、Claude Haikuがすぐにデータを分析し、すべてのビジネス詳細をGoogleテーブルやMicrosoft Excelファイルに入力するリード獲得エージェントも作成しました。
私が紹介するエージェントにアクセスしたい場合は、ブループリントをインポートするだけです。これらのAIエージェントは、私のコミュニティのAIエージェントテンプレートセクションで利用可能です。毎週水曜日には、これらのAIエージェントを使ってお金を稼ぐユニークな方法を紹介し、毎週金曜日には誰も使っていない新しいAIツールの使い方を詳しく説明し、毎週日曜日にはAI業界で何が機能しているかを示すケーススタディをアカデミーで行っています。
もう1つ重要な点は、彼らが「優れたツールを人々の手に反復的に置くことが、広く分散した結果をもたらす」と考え続けているということです。これは2025年にこれらのツールをどのように展開するかについてのヒントを示しています。2025年はAIにとって画期的な年になるかもしれませんが、「反復的に」というこの言葉は、これらのツールが段階的にリリースされることを意味しています。
2〜3日前に作った動画で触れたように、AIは能力が急激に飛躍する不連続な発展をするのか疑問に思われていましたが、現在これらの企業がツールを展開している方法を見ると、誰にとっても非常にスムーズで緩やかな継続的な発展になりそうです。
また、エージェントについて話していた際、Google AI StudioのリードプロダクトでGemini APIとAGIを担当しているLogan Kilpatrickの発言に気付きました。彼は2025年がAIのビジョン機能が主流になる年であり、2026年がエージェントの年になると述べています。
これは興味深い点です。なぜなら、OpenAIは2025年をエージェントの年としていますが、GoogleなどのほかのAI企業は2026年をエージェントの年としているからです。これは、2026年が完全に自律的で信頼できるエージェントが登場する年となり、ブラウザエージェントのようなものは2025年に登場するということを意味していると思われます。
彼はこれについてさらに詳しく説明しています。「機能から広範な実用化までには12ヶ月のギャップがあり、ほとんどのビジョン関連のユースケースは今でも機能するが広く展開されていない」と述べています。さらに、「エージェントは10億人規模のスキルレベルにはもう少し作業が必要」とも述べています。
これは信頼性の問題を指しています。10億人規模というのは途方もない数の人々であり、10%の失敗率でさえ1億人以上が不完全なサービスを経験することになるからです。
これが興味深い理由は、GoogleがAIエージェント、特に完全に自律的なAIエージェントは2026年になると言っているのに対し、OpenAIが少し先を行っている可能性があるからです。さらに、競合他社であるAnthropicのCEOも最近のインタビューでエージェントについてより詳しく言及しています。
エージェントには一連のアクションを実行する必要があります。チャットボットと話すと、それは単に応答し、少しフォローアップするだけですが、エージェントは多くのアクションを取り、世界や人間との相互作用の結果を見て、さらなるアクションを取る必要があります。そして、その長い一連のアクションが実際に機能するためには、個々のアクションのエラー率が非常に低くなければなりません。
例えば、ロボットが家を建てるような場合、そこには何千ものアクションが含まれます。つまり、モデルはより信頼性が高くなる必要があり、個々のステップのエラー率を非常に低くする必要があります。その一部は規模から来るでしょう。エージェントが本当に機能するまでには、さらに1〜2世代の規模の拡大が必要です。
これは非常に正確な指摘です。Claudeの最新リリースのベンチマークを見ると、現在Claudeは生の知能という意味ではo1やo3ではありませんが、コンピュータを使用できる大規模言語モデルのフロンティアモデルとなっています。
これらのAIシステムを現実的なシナリオに置いて、エージェントとして機能させようとするToベンチマークを見ると、現在のモデルはそれほど良い性能を示していません。信頼性は彼らが改善する必要がある点です。最初の試行で46%という成功率で、試行回数が増えるにつれて結果は悪化していきます。
もちろん、様々なAIエージェントが存在し、他の企業も新しいフレームワークを導入する予定です。おそらく年末までには90%近くまで改善される可能性もありますが、最近のエージェントとして実際に優れたこれらのモデルは、エージェントとしての活動においてはそれほど良い結果を示していません。
これはOpenAIの戦略転換によるものかもしれません。GPTシリーズのAI改善率が鈍化していることを彼らも示唆しています。これは、GPTシリーズが鈍化しているという意味であり、今後の進歩は段階的なものになるということです。これはo1、o2、o3、あるいはo1シリーズ、推論シリーズと呼ばれるモデルの知能生産能力が急激に向上しないという意味ではありません。私が言っているのは、Claude 3.5やGPT-4oのようなGPTシリーズのモデルは能力の飛躍的な向上はないだろうということです。しかし、これらのモデルをエージェントの基盤として使用するのであれば、非常に優れたものである必要があります。
興味深いことに、Microsoftのビジネスおよびインダストリーコパイロット担当コーポレートバイスプレジデントは、来年の今頃までにはAIエージェントの完全なチームがあなたのために働くことになるだろうと述べています。これには、問題に気付く前にグリッチを修正するITエージェント、あなたが眠っている間に混乱を防ぐサプライチェーンエージェント、ビジネスシステム間のサイロを打破してリードを追跡する営業エージェント、より速く帳簿を締める財務エージェントなどが含まれます。
これは本当だと思います。最近の講演を注目していれば、Sam AltmanやJen-Hsun Huangがエージェントについて多く語っているのを耳にするでしょう。エージェントは今、誰もが話題にしているテーマです。それには良い理由があります。来年には、非常に賢い人間に与えるような複雑なタスク、つまり時間をかけて多くのツールを使用し、価値あるものを作り出すようなタスクをAIシステムに与えることができるようになるでしょう。もしそれが期待通りに機能すれば、物事を本当に変革することができます。
最近のCES 2025でのJen-Hsun Huangのエージェントに関する発言を見ると、これらのAIエージェントがどのように協力してビジネスをより効率的にし、業務を合理化するかについての洞察を得ることができます。
正直なところ、この文書で最も驚くべき点は、AltmanがAIやAGIについて様々な機会に語ってきたにもかかわらず、「真の意味でのスーパーインテリジェンスにまで目標を向け始めている」と述べていることです。これは非常に重要な声明です。OpenAIがこのように言及する機会が増えれば増えるほど、私はますますそれを信じるようになります。研究論文を読んでいると、それは理にかなっているように思えます。
スーパーインテリジェンスを用いれば文字通り何でもできるようになり、スーパーインテリジェントツールは科学的発見とイノベーションを、私たち自身の能力をはるかに超えて加速させ、その結果、豊かさと繁栄を大きく増大させることができると彼らは述べています。
スーパーインテリジェンスという主張がSFのように聞こえ、話すことさえもいささか狂気じみているように聞こえることを彼らも認めています。しかし、、彼らはそうした状況を以前も経験しており、再びそうなることも構わないと考えています。数年後には誰もが彼らの見ている景色を目にすることができ、最大限の利益と能力向上を実現しながらも細心の注意を払って行動する必要性が重要だと確信しています。
これは非常に興味深いポイントです。なぜなら、彼らは単にこれが突飛な主張だと述べているのではなく、基本的に「私たちは知っている。あなたたちが知らないのは、単に企業で働いていないからだ。数年後には私たちが今見ているものに追いつくだろう」と言っているのです。
また、OpenAIの製品が、彼らのAIステージレベルでどのように変化し統合されていくのかを見るのも非常に興味深いでしょう。現在は推論と人間レベルの問題解決の段階ですが、レベル3が重要な転換点となります。このレベルでは、これらのシステムが確実にアクションを取ることができるようになります。
レベル4とレベル5は確かに狂気じみた話に聞こえますが、結局のところ、私はAIで不可能だと思っていたもっと驚くべきことを目にしてきました。そして、OpenAIが非常に近い将来にAIエージェントを立ち上げる予定であることを考えると、このエージェントが登場した時にどのようなパフォーマンスを見せ、どのようなことができるようになるのか、非常に興味深いところです。
コメント