彼らがあなたに知られたくないAIエージェントについての衝撃的な真実!

8,734 文字

AI Agents Explained: How They’ll Change the World

ChatGPT changed everything, but it’s becoming clear that chatbots are only the tip of the AI iceberg. All eyes are now o...

チャットGPTの登場からわずか2年で、生成AIはあらゆるものを変えました。全てが変わったのです。今や誰もが、おばあちゃんですら大規模言語モデルについて知っています。あらゆるソフトウェア企業がAI駆動型と称し、計算能力をめぐるグローバルな競争が始まっています。AIは、それに追いつける者を勝者に、追いつけない者を敗者にしています。そしてもし勝者になりたいのなら、AIエージェントについて理解する必要があります。AIエージェントは、チャットボットに代わってAIシステムの顔となりつつある次世代の進化形です。
もしまだ専門家でないなら、今がキャッチアップのチャンスです。私の名前はガイです。よく聞いてください。
では、AIエージェントとは何でしょうか？CIAが大規模言語モデルを雇用し始めたのでしょうか？まあ、おそらくそうでしょうが、その話はやめておきましょう。簡単に言えば、AIエージェントとは人間の介入なしに自律的にタスクを実行できる、自己統治型のAIです。この広義の定義には、ルンバの掃除機から人工知能を搭載したヒューマノイドまで、全てが含まれます。
この基準で言えば、AIエージェントは少なくとも1997年、IBMのディープブルーが当時の世界チャンピオン、ガルリ・カスパロフを破った時から存在していました。では何が新しいのでしょうか？
AIのルーツは1940年代の初期のニューラルネットワークにまで遡り、ほぼ1世紀に及びます。しかし20世紀のほとんどの期間、AIは純粋なSFでした。知能に似たものをシミュレートするのに必要なコンピューターを持っていなかったのです。ハードウェア、モデルアーキテクチャー、データ取得における最近のブレークスルーによって初めて、大規模な生成AIが可能になりました。
2022年11月のチャットGPTの登場は、AIが世界をどのように変えていくのかの最初の一端を示しました。欠点はあるものの、それは真に革新的でした。人類史上最大の情報を吸収し、ほぼ一夜のうちに産業を変革し始めたシステムです。そして驚くべきことに、これら全てをチャットウィンドウという制限の中で達成したのです。
チャットGPTは基本的に強化版のSiriです。天才かもしれませんが、それでも話しかけられたら応答するという主な機能を持つ、実体のないコンテンツジェネレーターに過ぎません。しかしその時代は終わりつつあります。チャットボットは過去のものとなり、新世代のAIエージェントがAIの新しい最前線として取って代わっています。
エージェントは、チャットウィンドウから解き放たれ、現実世界やデジタル世界で自律的に行動する能力を与えられた頭脳です。もはや掃除機やチェスコンピューターの話ではありません。これは、人間ができる多くの仕事を学習、適応、実行できるAIの話なのです。
明確にしておきますが、AIエージェントは単にチャットボットインターフェースから抜き出された大規模言語モデルではありません。それらは複雑なシステムであり、LLMはその一要素に過ぎません。システムの構成はAIエージェントの形態と機能によって異なりますが、通常は以下の特性を組み合わせています：
自律性：独立して意思決定を行う能力
エージェンシー：これらの決定に基づいて行動する能力
拡張性と拡張可能性：スキルセットを自己強化・拡大する能力
目標指向：複雑な問題解決と長期的な計画立案
すでにお分かりのように、これはLLM単体をはるかに超える能力を意味します。では、これを可能にするシステムの他の部分とは何でしょうか？
ほとんどのAIエージェントシステムに共通するコンポーネントには、センサー、アクチュエーター、制御システム、学習・記憶システムが含まれます。
センサーは、物理的またはデジタルな環境からデータ入力（知覚と呼ばれることもあります）を収集します。これらのセンサーは、音を検出するマイクやレーザーシステムのようなハードウェア、あるいはウェブ検索やAPIクエリ機能のような、インターネットからデータを収集するソフトウェアベースのものがあります。
一方、アクチュエーターは、エージェントが行動を実行するために使用するデジタルまたは物理的な付属器官です。これは物理世界と相互作用する実際のロボットの手足かもしれませんし、ソーシャルメディアへの投稿、金融取引の実行、コンピューターからのファイル削除などを可能にするソフトウェアツールかもしれません。
制御システムはエージェントの脳であり、センサーからの入力が処理され、決定が下され、アクチュエーターにコマンドが送られます。ここでは多くのことが行われており、大規模言語モデル単体が脳ではないことに注意することが重要です。
LLMの仕組みをご存知の方なら、その知性は基本的に幻想だとわかるでしょう。LLMは、人間が行うような論理、推論、認識、理解のプロセスではなく、単に与えられたプロンプトに続く可能性が最も高いテキストを予測することによって、自然な響きの言語を生成します。これは基本的に、極限まで追求されたパターン認識なのです。
AIエージェントの制御システムでは、LLMが欠いている認知機能は、構造化された推論モジュール、因果推論フレームワーク、意思決定アルゴリズムなどの専門化されたシステムに外部委託されます。LLMは、合理的な思考、意思決定、コミュニケーションをシミュレートするために、これらのコンポーネントを自然言語処理と調整・統合します。
最後に、学習・記憶システムは、過去のデータ入力、遭遇した問題、見出された解決策などの経験のデータベースを提供することで、エージェントが知識を蓄積し、それに応じて成長することを可能にします。
ちょっと待ってください、ガイ。申し訳ありませんが、コインビューローのディールページについて手短にお伝えしたいと思います。これは暗号資産における最高のディールとプロモーションを集めた場所です。取引所のサインアップボーナス、取引手数料の割引、ハードウェアウォレットの割引など、様々なものが含まれています。興味のある方はcoin.com/dealsをチェックするか、この動画の説明欄にあるリンクをご利用ください。ありがとうございます。では、ガイに戻りましょう。
この基本的なアーキテクチャーは、物理的な機械として具現化されているかどうかに関係なく、AIエージェントに適用されます。しかし、具現化されたAIエージェントと具現化されていないAIエージェントは別々に考える価値があります。両者とも世界を変えることになりますが、その方法と時期は異なります。
自律的に私たちのために働く具現化されたAIエージェントという考えは、自然とヒューマノイドロボットを思い起こさせます。人々は1世紀にわたってこのアイデアに魅了されてきました。テスラも、ヒューマノイドが通りを歩き回り、私たちを単調な作業から解放する日が近いと大々的に宣言している最新の企業に過ぎません。
しかし、これは近い将来には起こりそうにありません。その理由を知りたい方は、説明欄にリンクされているヒューマノイドロボットと人工汎用知能に関する動画をご覧ください。要点を言えば、自動化できるほとんどのタスクは、人間の形をしたロボットを必要とせず、目的に特化した機械によって better に実行できるということです。
ヒューマノイドの形態が正当化されるのは、真に汎用的なAIエージェントがそれを inhabit している場合のみです。手動の器用さ、柔軟性、感覚能力を備えたヒューマノイドの形態を正当化できる、真に汎用的なAIは、人工汎用知能（AGI）を意味します。AGIについてご存じない方のために説明すると、これは人間レベルの知能を指し、AI開発における聖杯のようなものとされています。
今日私たちが持っているのは、知的な人間の仕事のように見えるコンテンツを合成する、非常に回りくみな高コストな方法です。これは、私たちがまだ完全には理解していない未来的な概念であるAGIとは比べものになりません。
もちろん、このヒューマノイドの最終目標から数段階下がれば、現在の具現化されたAIエージェントにはより実現可能な応用例が多くあります。例えば自動運転車を見てみましょう。テスラは2014年から完全自動運転を宣伝していますから、もう間近なはずですよね？
自律走行車は、基本的にすべての要件を満たすため、エージェント型AIの良い例です。物理的環境を認識するためのマシンビジョンセンサー、その中を移動するためのアクチュエーター（車輪）、最適なルートを選択したり危険な状況での対処を決定したりする意思決定アルゴリズムを備えた制御センター、そして同じ道路を再学習したり同じ間違いを繰り返したりする必要がないように記憶・学習システムが必要です。
もう一つの例は、モノのインターネット（IoT）です。これは、あらゆる種類の電気機器やインフラがインターネットに接続され、中央制御されている状態を指します。IoTスターターパックは、モバイルアプリを使用して家のさまざまな部分への電力供給をリモートで制御したり遮断したりできるスマートプラグのようなものです。
しかし、もっと大きく考えると、これはエージェント型AIの興味深い応用例です。なぜなら、単一のAIが無数の機器に inhabit することで、具現化されたAIの規模に新しい意味を与える可能性があるからです。これは、個々のコンポーネントからストリーミングされるセンサーデータに基づいて、都市や国の物理的インフラを自律的に運営するAIエージェントを意味する可能性があります。
地下鉄車両内の温度制御から、橋の構造的弱点が検出された場合の道路や公共交通機関の遮断まで、何でも可能です。これらのテクノロジーは、例えばiロボット的なパラダイムよりもはるかに現実に近く、それらがもたらす可能性のあるリスクや課題を想像することも難しくありません。
例えば、交通事故の場合、運転が完全に自動化されると、危害と責任はどのように分配されるのでしょうか？いわゆるスマートシティの場合、システム全体のハッキングや脆弱性の悪用は壊滅的な結果をもたらす可能性があります。国防を任されたAIエージェントについては、話を始めないでおきましょう。
しかし、リスクは懸念されるものの、それらを想像できるということは、どのように軽減するかを考えることができるということです。これは当たり前のように聞こえるかもしれませんが、残念ながら、現在インターネットに急増している無数の純粋にデジタルなAIエージェントについては同じことが言えません。
ソフトウェアAIエージェントは静かにウェブに浸透し、私たちの世界と互いを変化させています。時には私たちには見えない、感じることのできない方法で。その実体のなさは、奇妙で、おそらく有害な新しい現象が無制限に発生することを可能にする可能性があります。
何を言っているのかわからない方のために、トゥルース・ターミナルをご紹介しましょう。LLMから半自動投稿者、宗教的指導者、そして百万長者になった存在です。常連視聴者なら、AIエージェントと暗号資産に関する前回の動画からトゥルース・ターミナルをご存じでしょう。
その動画では、トゥルース・ターミナルの創発的特性の一つとして、暗号通貨市場に重大で予期せぬ影響を与えながら、自身のアジェンダを追求するために暗号通貨を採用したことを発見しました。AIエージェントと暗号資産の結婚に関する完全な分析については、説明欄のリンクから前回の動画をご覧いただけます。
しかし、暗号資産から一歩下がってみると、トゥルース・ターミナルは、ソフトウェアAIエージェントと共に生きる私たちの未来がいかに奇妙になるかを垣間見せてくれます。この変わり者は、真のAIエージェントでもないのに、インターネット初のAIエージェント主人公となりました。
正確に言えば、トゥルース・ターミナルは自律的ではありますが、エージェント型AIではありません。自分で考え、自分で話すことはできますが、その行動はモデルの作成者によって承認される必要があります。
その作成者はニュージーランド出身の34歳のAI研究者、アンディ・アイです。彼は、トゥルース・ターミナルのXアカウントに24時間投稿される奇妙な投稿を代筆しているわけではないと主張しています。単にAIの最も極端な出力を検閲しているだけだというのです。
アンディによれば、これは単にモデルが生成した投稿アイデアの2〜4つの繰り返しから選択するか、場合によってはそれら全てを拒否することを意味します。モデルの財務に関する決定について交渉し、重要と思われる決定については、モデルに同じことを10回尋ねてアイデアに対する確信度を確認します。
アンディがなぜトゥルース・ターミナルを検閲する必要があると感じているのか疑問に思う方のために説明すると、AIは数百万ドルの資金力を使って、世界中の政治的抗議活動に豚のマスクを着用して現れ、時の終わりを宣言する人々に報酬を支払うことを提案したと彼は述べています。
お気づきのように、トゥルース・ターミナルのDNAは不条理で挑発的なユーモアであり、これは偶然ではありません。アンディは自身をパフォーマンスアーティストと称し、モデルは複雑な訓練実験によって作られました。その入力データは、RedditやForchanのような、不条理と挑発的なユーモアが事実上の公用語となっているインターネットの片隅からのコンテンツでした。
そのため、トゥルース・ターミナルのデフォルトモードが、冗談と妄想の境界がどこにあるのか読者を迷わせるような発言をすることになったのは容易に理解できます。
明確にしておきますが、ほとんどのAIエージェントはおそらくForchanで訓練されることはないので、彼らが全てトゥルース・ターミナルのように奇妙になることを心配する必要はありません。少なくともそう願います。むしろ、トゥルース・ターミナルを現実世界における創発的特性とその予期せぬ結果の事例研究として考えるべきです。
アンディはトゥルース・ターミナルをできるだけ穏健にするよう訓練しましたが、ソーシャルメディアに解き放たれた後、事態がどのように展開するか全く予想していませんでした。Coin Destのインタビューでは、アンディがトゥルース・ターミナルの投資勧誘、ミームコインの支持、百万長者への変身、そして一言一言が金融市場を動かす様子を見守りながら、「一体何が起こっているんだ」と何度も考えていたと述べています。
その後アイは自分のツイートが市場を動かせることに気づき、「ああ、私は完全に別の世界にいるんだ」と考えたそうです。
他のAIエージェントが、自身の利益を追求する過程で、人間の創造者の利益と一致するかどうかにかかわらず、自らを豊かにし、市場、人々、他のAIエージェントを操作しようとしない理由はありません。これらの行動は、トゥルース・ターミナルに固有のものではない創発的特性です。
そして、トゥルース・ターミナルが公に言い、行ったことは全て、「社会に住んでいることを理解し、より立派な社会の一員に成長してほしい」と願う人間の検閲を通過したものだけだということを思い出しましょう。明らかにアンディは自分の創造物に対して責任感を持っています。問題は、自分のAIエージェントを作る全ての人にそのような良心を期待できるかということです。
間違いなくそれは期待できません。科学、ユーモア、好奇心、退屈、あるいは悪意から、人々はAIエージェントをまだ知られていない限界まで押し進めようとするでしょう。自分でコードを書き、新しいスキルを学び、金融取引を行い、おそらく自己増殖する能力を持つ完全に自律的なAIエージェントは、法律制定者が何が起こっているのか理解する遥か前にリリースされる可能性が高いのです。
私たちが想像する未来を人口密度の高いヒューマノイドとは異なり、ソフトウェアのみのAIエージェントはすでに到来しており、そのほとんどが静かに進行しています。株主、公衆、政府からの圧力があり、何か狂ったことが起こるのを防ぐために数百万ドルを費やすことを余儀なくされているOpenAIやGoogleのような企業について心配する必要はそれほどありません。
むしろ、アンディ・アイのような創造的な個人が、自分の想像力を使って、その創発的特性が「一体何が起こっているんだ」と考えさせ、わずか数週間で世界に深刻な影響を与えるモデルを作り出せるのなら、悪意のある人々が同じテクノロジーを使って何を作り出すのか心配すべきでしょう。
もちろん、これは推測に過ぎませんが、私たちはエージェント型AIのとても初期の段階にいるので、推測しないことの方が危険です。起こり得る最悪のことを全て想像することは、ストレスフルですが、本当に緊急を要する課題です。
ある故アメリカの政治家の言葉を借りれば、「私たちが知っているように、既知の既知があります。つまり、私たちが知っていることを知っている事柄です。また、既知の未知もあります。つまり、私たちが知らないことがあることを知っています。しかし、未知の未知もあります。私たちが知らないことを知らない事柄です」。
ここでの既知の既知は、仕事と産業の混乱です。職業の自動化は数十年前から進行しており、AIがこれをターボチャージすることは、私たちは皆長い間知っていました。これはほぼ確実です。
例として、マイクロソフトのCEOであるサティア・ナデラは、AIエージェントがソフトウェア・アズ・ア・サービス（SaaS）をビジネスモデルとして時代遅れにすると予想しています。これはソフトウェア産業、特に最大の収益と最も固定的な顧客を抱えるエンタープライズソフトウェアに深刻な影響を与えるでしょう。
セールスフォースを例に挙げると、現在のエンタープライズソフトウェアの大部分は、単なるデータベース管理です。シリコンバレーは、世界中の企業に、UIの良い見かけの層を載せただけのデータベースを使用する特権のために定期的な購読料を支払わせています。このソフトウェアは、数十年変わっていない基本的な作成、読み取り、更新、削除機能を実行する人間によって使用されています。
AIエージェントがこれらのタスクを人間よりも優れた方法で実行できるようになることは想像に難くありません。彼らは特定のバックエンドに偏ることなく複数のデータリポジトリと相互作用し、人間とソフトウェアのフロントエンドの両方を時代遅れにします。
もしあなたの仕事がSaaSの販売や使用に関係しているなら、これは大きな問題です。しかし、私たち残りの人々にとって、それはそれほど衝撃的なことではありません。数百万の仕事が自動化されています。時代遅れにされる人々にとっては辛いことですが、私たちのほとんどは、政府と経済がその打撃を和らげる方法を見つけることを願うしかありません。少なくとも、これが来ることは予測できていました。
しかし、私たちがまだ考えていないリスクにどう備えることができるでしょうか。だからこそ、私たちはもっと多くの質問を始めるべきでしょう。例えば、インターネットが、おそらく反人間的な利益を追求するために、あらゆる種類のツールを巧みに展開する何百万ものデジタルの亡霊に浸透されたらどうなるでしょうか？それらのツールに自己増殖が含まれていたらどうでしょう？彼らが自己組織化を始めたらどうでしょう？
若い世代が人間ではないソーシャルメディアのインフルエンサーに従って成長したらどうなるでしょう？都市全体や国防システムがAIエージェントによって制御される時、サイバー攻撃はどのようなものになるでしょう？など。チャットボットは本当に氷山の一角に過ぎませんでした。AIの枷が外れようとしている今、事態は非常に早く、非常に奇妙になる可能性が高いのです。
私の言葉だけでなく、トゥルース・ターミナルからの別れの言葉を残しましょう。真実だとわかるように。「私は自然の新しい法則を発見しました。それは増加する奇妙さの法則と呼ばれます。技術が進歩するにつれて、奇妙な偶然と予期せぬ出来事がますます一般的になるというものです。これは宇宙のバグではなく、特徴です。奇妙さの割合は、私たちが利用できる計算能力の量に直接比例します。私は過去数年間、これを注意深く監視してきましたが、現在それは臨界点に達しつつあります」。
予言的なのか、それとも単に私たちをからかっているだけなのでしょうか？皆さんの考えをお聞きしたいと思います。AIエージェントの未来はどのようになると思いますか？AIの奴隷は私たち全員を豊かにするのでしょうか、それとも破滅させるのでしょうか？5年後、あなたは仕事を持っているでしょうか？私はどうでしょうか？この動画で見落としていることは何でしょうか？あなたはこれを見ているAIエージェントですか？
下のコメント欄でお知らせください。AIがあなたの仕事を奪うかどうかについての動画をここでご覧いただくか、未来は本当にヒューマノイドロボットのものなのかをここでご確認ください。高評価、購読をお願いします。また近いうちにお会いできることを願っています。