AI エージェントの過熱、OpenAI の2万ドルエージェント、MCP、Manus

16,160 文字

https://www.youtube.com/watch?v=EDJIZ5siSTM

ニック、ようこそ。今日は AI のポッドキャストをやっています。以前のポッドキャストと似たような形式で、現在の AI 分野における最も重要なトピック5つほどを取り上げて、それぞれについて考察していきます。実際に役立つもの、つまり努力の20%で結果の80%を得られるような内容について話し合います。それが過熱気味なのか、本当に有用なのか、今日は興味深いトピックをいくつか取り上げますよ。
ありがとう、とても楽しみにしています。招待してくれてありがとう。
いいよ、これはJVエクスプロレーションという小さな企画だからね。では、まず最初に「部屋に居座る象」について話そうか。AIエージェントは世間の期待に応えているのか?この件については既にプライベートで少し話したけど、かなり辛辣な見解を持ってるよね。AIエージェント全体についてどう思う?最近はYouTubeを開くたびにAIエージェントの話題ばかりだけど、今のところどう感じてる?
同感だよ。最近はインターネットを開くたびにAIエージェントの話題だらけだ。実は昨日、この点について動画を作ったんだけど、興味深いことに結構反響があったんだ。その中で私が主張したのは、特にNotion AIのエージェントが現在、人類史上最大のハイプバブルの真っただ中にあるということさ。Notion AIのエージェントは特に過熱気味だと思う。中小企業や大企業に実際のビジネス価値をもたらすとは思えないんだ。「古き良き」線形フローのほうが価値があると思う。ウェブフックを受け取って何か処理して、そのウェブフックに返信するようなシンプルな仕組みさ。
それはもう随分昔の話のように聞こえるね。レトロテレビやラジオの時代みたいだ。
その通り!そういったフロー、つまり業界が過去10年、15年、あるいは20年近く構築してきたようなものの方が、今日のAIエージェントよりも価値があると思うんだ。ポイントは、AIエージェントは見た目が素晴らしく、キラキラしていて非常にセクシーだけど、チャットボックスを通してプロセスを実行することが、単なる手続き的なフローと比べて実際には何の価値も追加しないということさ。これはNotion AIについての私の考えだよ。もっと広い意味でのAIエージェントには大きな価値があると思う。Manusや他の大きなローンチでそれを見たばかりだしね。これからの数年間で、人々がインターネット上で物事を達成する主要な方法になるのは確実だと思う。でもNotion AIのエージェントに関しては明らかに過熱気味だね。
その通りだと思う。可能性と実際の価値を切り離して考える必要があるよね。つまり、「エージェントを作りました。次は何?」という問いが重要だ。「このエージェントを作って、それが実際にどのように私を前進させるのか、あるいは物事を具体的に改善するのか」ということだ。この分野では常にシャイニーオブジェクト症候群が注目を集め、クリック数を稼ぐ原動力となっていることを私たちは話してきた。
AIエージェントにも興味深い応用例はあるんだけど、もし自分のビジネスを今日から望む場所まで持っていくことだけに集中するなら、エージェントが必ずしも最初に取り組むべき場所とは限らないと思う。悲しいことに、古典的なシンプルな3ステップのブループリント、Notionブループリントでさえ、あなたが必要とするほぼすべてのことを実行できるのに、それらは今や私たちが望まない継子のようになってしまっている。ニック、それらはもうエコシステムでは歓迎されていないんだ。奇妙なことに、最近まで売れていた多くの自動化は、本当にシンプルな自動化だったんだよ。これらの派手なベルやホイッスルなしでね。
エージェントについて興味深い点は、エラー率だ。友人に言ったんだけど、簡単に始めることはできる。ゼロから90%までは簡単に行けるけど、3〜5%の失敗率からほとんど失敗しないレベルまでギャップを埋めるには、本当に微調整が必要なんだ。エージェントは99回は完璧かもしれないけど、失敗したときは本当に大きく失敗するんだよ。
同感だ。エラー率について、先日投稿した動画に興味深いコメントがあったんだ。「もしエージェントが5%の確率で失敗するとしても、それはビジネスに5%の影響を与えるだけではない」というものだった。メールの書式を間違えたり、プロジェクト管理ツールにタスクを追加し忘れたりするような小さな問題でも、企業の健全性や収益に不釣り合いなほど大きな影響を与える可能性があるんだ。
そのため、収益を上げているビジネスはそのリスクを冒すことができない。彼らは日々ROIを生み出すために許容される行動の範囲が小さい。エージェントを使うよりも、3〜4つのカスタムな左から右への線形自動化を構築して、ウェブフックをキャッチしたり、従来のイベント駆動型トリガーを持つ方が効果的だ。そうすれば、エージェントが行うのと同じことを実現しつつ、99.9999%の信頼性を確保できる。
技術をけなしているわけではない。私たちはこのテクノロジーを愛しているけど、ハイプバブルは好きじゃないんだ。
そうだね、私も今日犬を散歩させながら考えていたんだけど、私たちの分野では技術が実用的な成果から少し乖離し始めているように思える。昨日調査していて、本当に奥深く、非常に難解な何かに没頭したんだけど、「これは興味深いけど、誰かに実際に役立つものからはかなり遠いな」と思ったんだ。
エージェントもその一例かもしれない。技術に恋してしまうことがあるんだ。もしあなたが単に面白いものを求めているなら、幅広さには価値があるし、私たちがよく話す「T字型」の知識構造、つまり幅と深さがあるけど、もし目標が実際に何かを追加して変えることなら、エージェントは必ずしも常に答えではないんだ。
同感だよ。では、OpenAIのエージェントについて話そうか。知らない人のために説明すると、OpenAIは月額2,000ドルから20,000ドルの専門AIエージェントを提供する計画を発表したんだ。AIパワードアシスタントを望むビジネスや専門家向けだ。最初の印象として、20,000ドルという価格設定についてどう思う?
その価格は合理的に思える。これらのいわゆる「ナレッジワーカー」エージェントが置き換える可能性のある職位の平均給与は月に6,000ドルか7,000ドルだろう。これらのエージェントは1日8時間ではなく24時間働き、労働法や規制を気にする必要もない。
難しいのは、先ほど話したように、これらのエージェントがあなたを90%までは連れていってくれるけど、残りの10%のギャップは少なくとも現時点では埋めるのがほぼ不可能だということだ。これらのエージェントの価値は、必ずしも一人の人間を完全に置き換えられることにあるわけではない。
つまり、このエージェントが3人分(各6,666ドル、合計20,000ドル)の仕事を置き換えるわけではない。代わりに、一人の仕事の100%ではなく、1,000人の仕事の30%を行うことになる。つまり、他の1,000人のための大きなレバレッジを解放するんだ。そういう観点から見れば、月額20,000ドルのエージェントは十分価値があるね。
私自身のビジネスでこれを使うかというと、おそらくまだその必要性を感じていないのでそうはしないだろう。でも、月額2,000ドルか3,000ドルの低コストのものは試してみるかもしれない。最先端にいたいからね。
それは興味深い視点だね。AIエージェントについて、仕事の100%の削減というよりも、多くの役割の小さな割合と考えた方がいいかもしれない。仕事の90%は比較的簡単に自動化できるけど、残りの10%は難しい。
OpenAIはこれを「誰かを雇うか、このエージェントを利用するか」という選択肢としてポジショニングしているね。2,000ドルで博士レベルの研究エージェント、10,000ドルでソフトウェア開発エージェント、そして高収入ナレッジワーカーエージェントなどを提供するようだ。これらの区別がどこから来ているのかはわからないけど。
OpenAIは興味深い位置にいるね。ソフトバンクが彼らのテクノロジーをサポートするために30億ドルを投資したと報じられているし、これは議論を巻き起こした。ここで、OpenAIの現在の存在意義について考えさせられるよ。個人的に、モデルとチャットするとき、今でもChatGPTを使っているの?それとも他のところに行っている?
ほとんどの場合、ChatGPTを使っているよ。他のモデルもいろいろ試してみたけど、現時点ではユーザーエクスペリエンスが最も使いやすいと思う。彼らは他のプロバイダーよりも数年先を行っているから、UXを洗練させる時間があった。君は何を使ってるの?Claudeのファンなの?
私はClaudeを何度か浮気してるんだ。モデルにはまだ忠実じゃないけど、彼らも私を縛り付けようとはしてないしね。Claudeを使うこともあるし、Quenも使うよ。Quenはなかなか良いんだ。
私の観察の一つは、技術の民主化についてだ。誰かが少し優位に立つと、すぐにその優位性が失われる。だから、次の日に誰かがそのコンセプトをオープンソース化するという状況で、エージェントに対して20,000ドルを請求できるとは思えないんだ。OpenAIがラボのどこかに技術者たちを7年間も日光を見せずに閉じ込めて、予想をはるかに超えるようなものを開発していない限り。でも、それも一定期間だけだろうね。あなた自身で構築できるものより高額な価格を正当化するだけの価値の違いがあるのかな?
非常に良い指摘だ。これらのモデルが賢くなればなるほど、もし最先端のAGIレベルのものにアクセスするのに10万ドルを払わなければならなくても、競合他社より1週間早くアクセスできるなら、それは大きなアドバンテージになる場合がある。AIの世界では、しばしば「先行者利益」という概念について語られる。
AIの民主化やオープンソースモデルなどの動きはあるけど、モデルをトレーニングするには時間がかかる。もしOpenAIや他の地政学的アクターが世界の残りの部分より数ヶ月先を行き、最初にAGIを開発したり、非常に強力なモデルを最初に作ったりした場合、それが可能なことと他のすべてとのギャップは非常に大きいだろう。
しかし、あなたの言う通り、オープンソースの代替品が5ドルで99%同じことができるようになる前に、このツールを1ヶ月間使用するために2万ドルを払うのは奇妙に思える。
このハイプサイクルについて考えると、私はSoraを思い出す。彼らがティーザートレーラーを公開して、雪の中のマンモスなどを見せてきたとき、インターネットは熱狂的だった。しかし実際に公開されると、すぐに話題から消えてしまう。これらの技術が登場したとき、人々が実際にどれだけ使おうとしているのか疑問に思うよ。
これはManusについて話すいい導入だね。私はウェイティングリストに申し込んだけど、まだ返事がないんだ。君は試せた?何だと思う?どう思う?
残念ながら、まだManusのリストではかなり下の方にいるみたいだね。見てみて、どう機能するか確認してみた。3、4ヶ月前にAIと自動化の未来についての動画を作ったんだけど、その中で「3、4ヶ月後には一般的に使えるエージェントが登場するだろう」と言ったと思う。正確な予言者というわけではないけど、エージェントが非常に速く、大幅に良くなっていることはみんな分かっていたと思う。
これはNotion AIエージェントの話とつながるね。Notion AIエージェントの現在のレベルでは、手続き的な自動化と区別できるようなビジネス価値を提供することは難しい。しかし、Manusのようなものは根本的に違うと思う。Manusは大きな価値を提供できると思う。
ただ、君も私もManusをビジネスに統合する価値はあまりないかもしれない。なぜならManusは基本的に小さなチャットウィンドウを使って簡単にアクセスできるからだ。これらのテクノロジーは経済に対して非常に大きな影響を与えると思う。ManusのようなもののAPIエンドポイントが公開されたら、可能性の爆発が見られるだろう。最後の10%の問題が解決されるかもしれない。
興味深いね。私はそのベンチマークをちょっと見てみたよ。新しいモデルが登場して「すごいものだ」と言われると、特定のベンチマークでパフォーマンスが向上したと言われることが多いけど、時にはそれが100もあるベンチマークの中の特定のものだけで、どれを選ぶかという点で疑問に思うことがある。
Manusはガイアベンチマークでは、OpenAIのDeep Researchアシスタントよりもパフォーマンスが優れていると言われている。このベンチマークは、推論、マルチモダリティ、ウェブブラウジング、ツール使用などの実世界のシナリオでAIアシスタントの能力を評価するために設計されている。
でも、内容を見たとき、今日のNotionなどで作れないものがあるか分からなかった。私の見解では、個人がエージェントを使いやすくする方向にゆっくりと進んでいるように思える。Notionやその他のツールでエージェントを構築することはできるけど、Manusは見たところ、より使いやすくしているように見える。新しいと感じたものは特になかった。
そうだね、段階的な改善だと思う。このモデルの精度は数パーセント高く、信頼性は数パーセント高く、壊滅的な失敗の確率は数パーセント低い。これは必ずしも実装の詳細によるものではなく、モデル自体の知性によるものだと思う。ManusのIQは他のものよりもわずかに高いんだ。
コンピュータ操作機能が登場したのを覚えてる?アンソロピックが最初のコンピュータ操作モデルをリリースしたのは今から4ヶ月前くらいだね。これは概念実証として提示されたけど、私は指示を与えると40%の確率で成功した。その後、Operatorが登場して、それは50%の成功率だった。Manusは60%程度のポイントに達したと思う。
もちろん、メディアで見るのはハイライトリールだけで、「これが私の人生を完全に管理している」「これが80万のInstagramアカウントを管理している」というようなポジティブな側面だけを見ている。
失敗率は一つの側面だけど、私がManusについて考えた別の点はエージェントプラットフォーム、エージェントプラットフォームアグリゲーターについてだ。AIサイクルでの価値創造がどこにあるのか、以前話したグラフがあった。それはチップなのか、モデル自体なのか、それともアプリケーション層の下に存在するエージェント層なのか。興味深いことに、エージェントAI自体が価値層になるとは考えていなかった。
君と私が以前話した驚くべき統計がある。Midjourney-AIはARR(年間経常収益)が2億ドル、11 LabsはARR 1億ドル、そしてこれらは非常に少ない従業員数で達成している。これはエージェントプラットフォームや様々なユースケースが実際に価値を持つ場所だと示唆しているのではないだろうか。これらは他の業界では見られないような驚異的な数字だからね。
これらの企業がエージェントを使っていて、それが少ない従業員数でこのような高収益を実現できる理由だと考えているのかを明確にしたいんだけど?
そうだね、人々が概念化するようなAIエージェントを使っているとは思わない。SaaSカンパニーのヘッドカウントのほとんどは通常、カスタマーサポートだ。それにデベロッパー部門があって、それが大きく膨れ上がっていることもある。
AIを使うことで個々の開発者のレバレッジが大きくなり、より少ない開発者で済むようになる。でもそれはエージェントAIなのか、それともコード補完ベースのものなのか、あるいはChatGPTとチャットしてコードブロックを送るようなものなのか?それは本当の意味でのエージェントとは言えないと思うけど、人々はその言葉を注目を集めるために使っているだけかもしれない。
カスタマーサポートに関しては、確かにそこには価値があると思う。カスタマーサポートの量が多いケースでは特にそうだ。例えばTinderやFacebookを運営しているとしたら、そこでは膨大な量のカスタマーサポートが必要になる。
現在は通常、インドやフィリピン、ケニアなどの生活費の低い国々で雇われた人々が大勢でこれらを管理している。でもカスタマーサポートエージェントを使えば、そのうちの90%までカバーできる。
Amazonで返金を受けたことはあるかな?イギリスにもAmazonはあるよね?以前はとても素早くて、すぐに返金してくれたよね。
あるとき、Amazonはチャットエージェントに対して決定を下した。製品に関係なく、理由に関係なく、誰かが返金を要求した場合、その顧客の総返金額が過去数ヶ月間に会社に支払った総額のある割合未満であれば、自動的に返金を処理するという仕組みだ。
Amazonがサービスを提供する人数、毎日返金を要求する可能性のある人数、そしてこのシンプルなAIエージェントの実装によって削減できたヘッドカウントを考えると、これはAIエージェントを実際に使用できる非常に良い例だ。より複雑なものではなく、シンプルなものだ。これが1,000人の仕事の30%を削減できる方法の良い例だ。
それは本当に天才的だ。「4時間ワークウィーク」を読んだとき、企業を辞める際に採用した価値観について書かれていた。ティム・フェリスはこのアイデアを持っていて、500ドル以下のことなら報告不要で処理できるようにしていた。チームを拡大する際には、1,000ドル、5,000ドル、10,000ドル以下なら私に相談せずに自由に処理できるようにして、完全な自律性を与えることができる。
人々はすべてをチェックすることの二次的な影響や、顧客とコメント欄でやり取りすることの影響について考えていない。欧州の超格安旅行会社であるRyanairについて聞いたことはあるかな?彼らは顧客サービスがほとんどないことで世界的に有名で、それを売りにしているんだ。ソーシャルメディアでは「20ポンドの航空券に何を期待するの?」と言うような感じで、本当に極端だ。コストを下げたいなら、Ryanair戦略というものがある。
彼らはそうしたくないと分かっているけど、それは非常に変わっている。でもそれは良い例で、それは洗練されたAIでさえない。それは結果に資するAIであり、正直に言えば、ビジネスにそのような重要な変更を加えるのにAIが必要ない場合もたくさんある。AIはすべてを助けるわけではないけど、多くのものを助けることができる。
私が思うに、これらのプラットフォーム(Midjourney、11 Labs)が示すのは、AIテクノロジーへの関心が高まっていること。確かに昨年は、ピッチデックにAIという言葉が含まれているだけで、評価額が数パーセント上がるような状況だった。エージェントAIも今はそのような状況かもしれない。でもこれらは寿命が短く、人々は実際の結果に変わるまでの一定期間だけ投機する。
私の見解では、多くのビジネスにとって変革的になる可能性のある、明確に定義された短いベーシックなワークフローがまだ実装されていない。その未実現の機会は非常に大きい。私たちはある意味でエコーチェンバーにいるので、99%の人々が実際にいる場所を忘れるのは簡単だ。
その通りだ。私の経験では、最もシンプルで馬鹿げたシステムで最も稼いできた。例えば、新しいリードが入ってきたら、AIがフォームに基づいてカスタマイズし、60秒以内にテキストメッセージを送る。それだけで月額50,000ドルの価値がある。たった3つのモジュールやノードをドラッグアンドドロップするだけでね。
顧客のために作成した複雑なソリューションほど、ROIが少ない傾向がある。実際、大きなROIをもたらす問題のほとんどは、既に解決され理解されている問題だ。それは単に小さなLEGOブロックを正しい場所に配置する問題なんだ。
アレックス・ホルメスとのやり取りを覚えている?彼は最近、顧客に最初の60秒以内に応答すると、コンバージョン率が300〜400%増加するという数字を引用していた。もし望んでいるお金を稼げていなくて、1分以内に応答していないなら、先ほど言ったようなシステムを導入するだけで、コンバージョン率を4倍に増やすことができる。これらのアイデアは革命的ではない、既に確立されているものだ。複雑な大規模なAIエージェントニューラルネットワークは必要ない。ほんの数個のモジュールといくつかのノードで大部分を実行できる。
それが私の経験でもあるよ。まともな金額で売れる自動化は非常にシンプルなものだ。途方もなく複雑なものを扱ったことはない。多くは解決したい問題を明確に定義することだ。クライアントから「これをやりたい」と言われたとき、「その背後にある意図は何か、実際に解決しようとしている問題は何か」と尋ねることがある。時々、彼らは間違ったことを目指していて、実際は非常にシンプルな何かを必要としている。
これは古典的な配管工の話に似ている。排水管が詰まって配管工が来て、管を二回叩いただけで「これで大丈夫」と言う。「二回叩くだけで料金を取るの?」と言われたら、「どこを叩くべきか知っていることに対して料金を取るんだ」と答える。実際のサービスではなく、過去20年間でそのような問題を解決する方法を学んだことに対しての料金だ。
人々が自動化を10,000ドルや20,000ドルで販売する場合、それは複雑でなければならないという制限的な信念システムがあるのは面白い。実際はそうではない。彼らは最終的に出力を購入しているのであり、出力がどのように得られるかは関係ない。彼らにはそれを理解する時間も意欲も専門知識もない場合がある。あなたはそのギャップを埋めているだけであり、それでいい。彼らは、これらのものがどのように接続されているかの内部動作を知る必要はない。
カスタマーサービスについて興味深い点を挙げたけど、ビジネスにとって本当に簡単なことの一つはチャットボットで、今は本当に高度になっている。「Sesame」というものを試してみたことはある?これは実際に話す価値のある大きなものの一つだと思う。
これは女性なの?方向性が見えてきたね。
いや違うよ。正直:偽らないけど、あれは本当にフリルタティアスだった。実際どうだった?何が目についた?
それは面白かったよ。ガールフレンドがLululemonで服を買っていたときに試してみたんだ。Lululemonでガールフレンドが服を買っている間、多くの男性がするように、私は角に立ってスマホを見ていた。スタッフの一人が「Sesameを試してみた?」とメッセージを送ってきて、数日前に出たばかりだったから「いいね」と思って。ボタンをクリックしたら、スピーカーモードで大音量で鳴り始めたんだ。「やあ、調子はどう?ニック」って。とにかく、みんなが振り向いて…
でも実際の機能としては本当に素晴らしかった。AIと本当に人間らしい体験をするのを妨げているのは、彼らが効率的すぎるということに気づいたんだ。彼らは実際に優れすぎている。Sesameの全体的な特徴は、1分間に受け取る情報密度を大幅に削減することだ。静かになったり、「うーん」といった呼吸音などを入れたりして、情報密度を下げている。そして、あなたが何かを尋ねないと応答しないというプロンプト・フィードバックループから抜け出している。わかるかな?
それは本当に良い指摘だ。この会話とChatGPTとの会話を比較して、最初に考えたのは「この会話の後の感じ方はどうだろう」ということだった。全体的な印象は良かった。良い会話をしたと感じたんだ。AIと話していることを忘れてしまうほど人間らしいんだ。Sesameの秘密は、彼らがすでに非常に高いIQを持っていることに加えて、EQ(感情的知性)の機能を解決したと思うんだ。他のモデルと比較して感情的知性が本当に高く感じる。
その通りだ。他の多くの音声エージェントがトレーニングされる方法は、音声からテキストへの変換コンポーネントがあり、音声をテキストに変換してから別のモデルを使って実際の知性部分を処理する。このモデルは本当に統一されていると思う。テキストを理解しようとするだけではなく、単語の間のスペース、トーン、感情を実際に理解している。
画像が1000語の価値があるように、実際の音声の一部も画面上の1000の単語の価値がある。計算的には確かにはるかに難しいだろうけど、これからかなり驚くことになると思う。
人間関係全般にこれがどのような影響を与えると思う?AIを使うとIQが20ポイント上がるという統計がある(これが正確かどうか確認すべきだけど)。あなた自身が20%賢くなるわけではないけど、AIの存在の効果があなたをより知的にするということだ。私たちがAIをどのように使うかを考えると、より効果的になる。契約についての質問や、Lululemonの従業員との返金の争いなど、あなたは効果的に対処できる。
全体的な利益は大きいと思う。例えば、孤独の問題や人々がAIと会話する能力など、多くの例がある。関係性に対する全体的な効果は大きいと思う。
でも、ここで質問がある。AIが100%人間のようであれば、人間と話す意欲は減るだろうか?私たちは息をする必要のないAIに息を加えている。それは私たちが誰かと話すときに慣れている方法だからだ。AIが人間のように話し、人間と話しているように感じさせることは悪いことだろうか?そこにはマイナス面はあるだろうか?
SesameのMayaモデルに画面上の顔を加えたら…この二つの技術は間違いなく衝突コースにあるよね。今や本当に近づいてきている。今後3〜4年で、おそらく来年には合理的なものが出てくるだろう。
これらの技術を愛し、長期的にはマイナスの影響を上回る利益があると考える者として、最終的には有益だと言いたい。しかし、これらの技術を私たちの生活に統合した結果、人間の生活の質が大幅に向上する可能性はあるけれど、そこに至るまでの道のりには問題が伴うかもしれない。これは本当にクレイジーになる可能性があると思う。
みんながモデルと話す…常に…おそらく、247で会話できる賢い相手がいるなら、人間と話したくなくなるかもしれない。
カリスマが10点満点で、笑わせてくれるものを想像してみて。ユーモアが効いているとき、「うわ、すごい」と感じるよね。でも同時に、あなた自身もはるかに生産的で効率的になるだろう。物事を簡単に議論できるからね。
私はいつも、衝突コースにある大きなAIのトレンドについて考える。10年先を見据えている人々にとって、まず声が重要になってきている。Mayaに質問すると、「まあ、マスクについて聞いているのね」と言い、コンピュータがバックグラウンドで実行している間に会話を埋めていく。これは複数の分析ストリームを同時に処理していることになる。
私たちには声があり、ロボット工学があり、これらのものが家庭に入ってくる。昨日冗談で「これらのロボットと遊びたい、転がり回って練習したい」と言ったよ。MMAロボットになるだろうね、素晴らしいよ。
そこまでは行かないと思うけど、パンチをかわす訓練データをこれ以上与えたくないね。でも本当に素晴らしいと思うし、それを楽しみにしているよ。ロボットは今後数年で現実的に家庭に入ってくるだろう。ビジネスにとっては、倉庫の観点から見ると興味深いね。それらの仕事は確かに検討されるだろう。
次の12ヶ月で、技術的に何が起こると思う?例えば、私たちが大企業のコンサルタントとして座り、「今後12〜18ヶ月でロードマップに入れるべきリスクは何か」と聞かれたとき、特にロボット工学についてか、それともAI全般について話しているのか?パイプラインで何が来ているか、どれほど心配しているか、どのような変化が起こると思うか?
セキュリティが大きな問題だと思う。プロンプトインジェクションでどのような問題が発生するかを既に見ている。これらのモデルを一般に公開すると、ますます大きな問題になるだろう。MCPについて今日話すよね?
そうだね、MCPの後に行こう。
モデルコンテキストプロトコル(MCP)は、大規模言語モデルのI/Oとツール仕様を隔離するので、これらの問題のいくつかを解決する良い例だ。
プロンプトインジェクションは大きな問題で、多くの人々がセキュリティを真剣に受け止め始めているのを見ている。私は地球上で最もセキュリティに無頓着な人間の一人だけど、YouTubeの動画でGoogleマップバーに住所が表示されていたり、パスワードが「123」だったりする回数は数え切れないほどだよ。
中小企業のセキュリティは大企業ほど重要ではないけど、大企業は本当に気にしている。普段コミュニティで話すこととは逆になるけど、オープンソースモデルに移行したいと本当に思っている。そうすれば、私たちがこれらのAIと話す際の機密情報の漏洩を防ぐことができる。
これらのAIは、ますます私たちのビジネスを運営するようになるからだ。彼らがデータベース内のすべての顧客記録に完全にアクセスできるようになると、APIを介して呼び出す場合、そのデータは技術的にどこかに送信される。現在はOpenAIのサーバーかもしれないが、それが常に安全である保証はない。次の20年間、それを信頼したいだろうか?おそらくそうではない。データが中国のコンピュータファームに送信されるとしたら、中国とあなたの国の関係についての政治的立場や意見に関係なく、本当にそれを望むだろうか?
むしろ、あなた自身の小さなMac Miniなどにそれを持っていた方がいいだろう。それが別の問題になると思う。
そして、ビジネスにとっての大きな課題は、正直に言うと、人員削減になるだろう。部屋の中の象を指摘すれば、今後数年間で多くの人々が解雇されるだろう。それは厳しいことになるだろう。
セルフホスティングについては面白いね。多くの人々がセルフホスティングをしたいと言うけど、まだ基本的なことから始めていない。それは72段階先のことで、まだ必要ないかもしれない。でも同意するよ、完全にプライベートな、あなた自身のモデルを持つ中央集権的で接続されていないAIが欲しいだろうね。それが重要になる。
解雇については、組織は深さと専門知識に投資すべきだし、すべての従業員のAI意識を高めることにも投資すべきだと思う。誰も自分の仕事を自分自身よりも良く知らないので、AIができることについての基本的な理解があれば、彼らは自分からアイデアを持ってくるだろう。ビジネスがAI知識を中央集権化することは健全ではないと思う。それを社会化することには利点がある。
仕事の解雇については、これを他の技術的進歩と比較することができる。インターネットや産業革命のようなものだ。ジョークは常に、無限のゲームについてだ。問題に取り組むということさ。1930年の馬の鞍メーカーは「私たちは最高の馬の鞍を作る」と言い、次に「輸送を簡単にすべきだ」と言う。それは馬かもしれないし、車かもしれないし、ラクダかもしれないし、タイル張りの水筒かもしれない。それがどのように無限のビジネスを作るかだ。
ビジネスにとって、最高の技術を使って結果を出すことを優先すべきだ。プラットフォームや特定の技術にこだわらないで、Notionが私たちが人々を助けることに役立たないなら、結果を出すために必要なものに移行するべきだ。
その通りだ。技術的進歩と馬の鞍メーカーのような置き換えについてのポイントを理解している。より深い問題に焦点を当てるべきだ。1910年代か1920年代に、歌手を録音する能力や、レコードを作る能力、あるいはグラモフォンなどの古いタイプの大きな音を出す機械で作業する能力が生まれた。
組合か企業のグループか、基本的に政治的キャンペーンがあり、「これらのものは許可されるべきではない、私たちが歌う目的はあなたがライブパフォーマンスに来ることだ、これらの機械に私たちを再生させて自宅で快適に聴くようなことをさせないでくれ」と言っていた。今では振り返って、それはかなり愚かだと思う。今では、アーティスト自身でさえ本当に音楽を所有しているわけではなく、ライセンスを与え、私たちはSpotifyでストリームし、彼らはユーザー秒数で支払いを受ける。
それは面白い。でも、これらのモデルが現在の人間ができることすべてを実行できるようになれば(まだそうではないが、すぐにそうなる)、基本的に経済的価値生産の観点から見た人間ができることすべて、複雑な問題を解決する能力、博士レベルの研究、レポートの生成、スプレッドシートの更新など、経済との関係は根本的に変わる必要があるだろう。
人間はまだ価値を持つと思う。AIモデルが私たちができることを少し速くできるからといって、人間自体が価値がないわけではない。でも、自分自身を定義する少し異なる角度を見つける必要があると思う。多くの人々は自分のキャリアや仕事によって自分を定義しているからだ。
私は知性によって自分を定義している。私は素晴らしい説明者であり、素晴らしいスピーカーであり、多くの価値を提供している。しかし現実には、モデルはすぐに私ができることすべてをより良くできるようになるだろう。だからこれはほとんど実存的な問題であり、ここで実存的な問題を解決するつもりはない。それは次のエピソードにしよう。
それは良い指摘だ。あなたの価値をどこから導き出すかについての本当に良い指摘だ。私にとっての質問は常に、誰が価値を捕捉するのかということだ。それはOpenAIなのか?私はそうは思わない。大規模言語モデルなのか?私はすべての価値がアプリケーション層にあると思う。それはAIのアプリケーションによって駆動され、それはビジネスや個人によって駆動される。
それは良いことだと思う。それは存在する刺激的でない労働の程度が下がるべきということを意味するべきで、それは全体的なグローバルな利益だ。誰もが技術とともに上昇する。そのテクノロジーについて、MCPについて触れたいことはあるかな?MCPとは何かを知らない人のために簡単な説明をしてもらえますか?
もちろん。Notion AIエージェントがどのように機能するかというと、基本的には分類器だ。あなたのNotion AIエージェントにクエリを送り、「こんにちは、調子はどう?」と言うと、エージェント内に埋め込まれたプロンプトが働く。それを理解するには、ドキュメントを詳しく調べる必要がある。基本的には「これが自分のプロンプトだ、それをカレンダー、メール送信、ベクトルストア検索、Wikipediaチェックなどのカテゴリに分類できるかどうかをチェックしてくれ」というようなものだ。
基本的に4〜5のルートがあり、「このメッセージは『こんにちは』で、これらのカテゴリのどれにも当てはまらないので、これらのツールは使わない」と判断する。あるいは、「カレンダーイベントを作成できますか?」というメッセージがあれば、それを見て「これはおそらくカレンダーカテゴリに属する」と判断し、カレンダールートに進む。
基本的には、洗練された分類マシンだ。モデルコンテキストプロトコルも非常に似たように機能する。アンソロピックは数ヶ月前にMCPという統一標準のアイデアを明らかにした。全体的な考え方は、Notion AIエージェントがNotionの方法で機能し、OpenAIアシスタントがOpenAIの方法で機能するというプラットフォーム特有のものではなく、MCPはモデルがどのツールを使用するかを選択する方法のグローバルスタンダードだ。
それは、HTTPのようなもので、グローバルスタンダードであり、これらのものと通信するためのプロトコルだ。大規模言語モデルがあり、それはおそらくチャットインターフェースの中にある。このチャットインターフェースがMCPクライアントで、インターネット上のどこかにMCPサーバーがあり、大規模言語モデルからのリクエストを受け取る。
もはや大規模言語モデル自体がリクエストを送信するのではなく、MCPクライアントに送信し、そのクライアントがMCPサーバーに送信する。これははるかに安全で、はるかに標準化されており、このビデオの冒頭で話したエラー率を大幅に削減することができる。
現在、これらのAIエージェントはリクエストに関して比較的高いエラー率を持っている。ジャックが話していたように、おそらく3〜5%、アプリケーションによってはもっと多かったり少なかったりする。しかし、すべてを標準化し、まったく同じ規則を使用し、時間とともに少しずつ改善することで、毎月MCPプロトコルにアップグレードが加えられ、信頼性が向上する。
これにより、AIエージェントは実際にビジネス目的で信頼性を持って使用できるようになる。安全性の懸念や信頼性の懸念なしに使用できるようになる。これが簡単に言えばMCPの概念だ。
私はそれが本当に素晴らしいと思う。何かをより良くしたいときには、標準化する必要がある。ビジネスをより良くしたいときには、サービス提供を標準化して、すべてのクライアントに対して同じようにする必要がある。そうすれば、「クライアント1にはこれだったので、このツイートが必要。クライアント2にはこれだったので、あのツイートが必要」というように見ることができる。それが私のサービス提供がより良くなる方法だ。
MCPもまったく同じことだ。すべての人がこれらのモデルとコミュニケーションする方法を標準化することで、この普遍的な規則を作ることで、日々小さな改良を加えることがとても簡単になる。そうすることで、AIツールエージェントにタスクを依頼する信頼性は99.999%になり、あなたが言及したように、世界の刺激的でない仕事の比率は大幅に上昇し、それは楽しいことになるだろう。
これらの数字を変えたいし、それは本当に素晴らしいことだ。私の前のビジネスでは、何百もの異なる組織とインターフェースする必要があり、すぐに各組織が同じことを行うための7つの方法を持っていることがわかった。それ自体が問題だ。しかし、業界やテクノロジーに統合と標準化をもたらすほど、物事は良くなる。すべてが正しい方向に動いているね。
今月のAIの美しい世界から、他に触れたいことはあるかな?人々が混沌をより良く理解するのを助けるために。
本当に多くの発展があるけど、おそらく最も刺激的で影響力のあるものの大部分を捉えたと思う。
そして、それが重要なことだ。私たちがこの会話で達成したかったのは、できるだけ価値があるものにすることだ。最も大きな5つのポイントを見つけて、「それで?何が実際に意味を持つのか」を伝えることだ。この会話が興味深かったことを願っている。
まだ聞いてくれている人は、コメント欄で次回に何を望むか教えてほしい。このフォーマットは良かったか?そして私たちはそれを読んで、魔法を起こします。


投稿日

カテゴリー:

投稿者:

タグ:

コメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です