
7,306 文字

みなさんこんにちは。本チャンネルへようこそ。私はホストのゼブ・ボディです。今回の動画のトピックは人工超知能への道についてです。人工超知能、または略してASIと呼ばれるものは、合成知能、つまり非生物学的知能の最終フロンティアです。
私たちはAI技術に魅了されてきました。それが私たちの世界をどのように形作り、どこに向かっているのか、そして社会にどのような影響を与えているのかについてです。過去50年間で、計算速度、新しいコンテンツの作成、情報と知識の普及、そして有用な知識の応用が、私たちの世界を一つの大きなグローバルな相互接続された商業的・社会的ウェブへと変えました。
ここ3年間で、人工知能の到来とその後の発展は目覚ましいものでした。大量のデータで訓練された大規模言語モデル(LLM)は、物語や詩を書き、研究論文を作成し、画像やビデオ、音楽を生み出し、翻訳を行い、音声を文字に起こすことができます。さらに最近では、LLMのマルチモーダル機能により、人間の物理的な外見、声、さらには表情まで模倣し、クローンを作ることが可能になりました。
クローン化された人間やデジタルツイン、アバターは、現実とフィクションの境界線を曖昧にしながら、ますます私たちの領域に侵入してきています。この合成知能の進化を止めることはできません。なぜなら、人間には競争する本性があり、人類の集団的な幸福よりも、権力と富の集中を一貫して優先してきたからです。AIにおいては、賭け金が非常に高くなっています。AIは人類最後の発明となる可能性があるからです。
最も強力なAIエンティティを開発し、制御するための競争は激しくなることが予想され、勝者は今後何世紀にもわたって世界とすべての人類を支配することになるでしょう。高度な人工知能への探求は、国家や企業間の激しい競争によって推進される不可逆的な力となっています。この技術開発競争は、AIの超人的能力への進化を確実にする一方で、経済的・政治的な権力構造は、この革新的な技術が民主的に分配されるのではなく、支配的な国家やエリート集団の手に集中する可能性が高いことを示唆しています。
2022年までの初期の人工知能は、赤ちゃんAIと見なすことができます。これを私たちは人工狭域知能(ANI)、または略してANIと呼びます。ANIは業界では弱いAIとしても知られています。私たちの目的のために、ANIを知能スケールのレベル1と呼びましょう。ANIは特定の、狭く定義されたタスクのために設計されています。
ANIの特徴は、その専門性にあります。厳密な境界内で優れた性能を発揮しますが、ドメイン間で知識を転送することはできません。例えば、AlphaGoは古代中国の囲碁で世界チャンピオンを打ち負かすことはできますが、車を運転したり詩を書いたりすることはできません。弱いAIの他の例には、信じられないほどの精度で物体を識別できる画像認識システム、スペルチェッカーのような自然言語プロセッサー、ソーシャルメディアやストリーミングプラットフォームの推薦エンジン、特定の製造タスクのためにプログラムされた産業用ロボットなどがあります。
主な制限は、ANIシステムが訓練された範囲外の新しい文脈やタスクに学習を適応できないことです。これは、教えられ訓練されたことしかできない子供とほぼ同じです。ANIが人間よりも優れている大きな利点の一つは、決して死なないことと、他のニューラルネットワークから得た集合知識がすべて次世代またはレベルのために保存されることです。
ANIから次のレベルアップしたものが、人工能力知能(ACI)です。これは私たちの目的のためにレベル2となります。AIは2024年初頭にこの領域に入りました。これらのレベルは固定されているわけではないことに注意してください。多くの未知の要素とこのダイナミックで急速に進化する技術の新規性により、正確な定義は議論の余地があります。
私たちの場合、レベル2のACIは、大学生レベルに達したAIシステムを指します。関連する状況で能力を効果的に適用し、目標を達成することができます。このレベルのAIは、単なる計算能力や訓練された能力を持つだけでなく、バックオフィスの管理やコールセンターの管理など、異なる文脈で適切にスキルを展開し、意図したタスクを実際に達成する能力の重要性を強調します。
これは、他のAIエージェントの専門家に援助を求めることができることを意味します。基本的にACIは、広範なスキルを持ち、ドメインやプロジェクトの範囲内で限定的なエージェント的決定を行うことができる、ある程度経験のあるスタッフのようなものと想像できます。ACIは監督なしで幅広いタスクを実行できますが、より複雑なタスクや決定については指導と監督を必要とします。
上記の属性に加えて、ACIは限定的な創発的特性を持つAIとしても説明できます。これは、計算能力とデータサイズの拡大に加えて、LLMの推論と思考能力を向上させるための多くの新しい先進技術が登場したことに起因します。これらの一部には、Qスター、マルチモードモデル、専門家の混合またはエキスパートAIの混合、自律エージェント、検索拡張生成(RAG)、合成訓練データ生成のためのアルゴリズム、強化学習、思考連鎖推論、AIエージェントフレームワーク、アルゴリズム効率、高度なコンピュータビジョン、その他いくつかの最先端技術が含まれます。
2024年には、これらが集合的に桁違いの定量的改善をもたらし、AIにおける新しい信じられないようなブレークスルーが実現しています。ちなみに、OpenAIのGPT-4oやGPT-o1、AnthropicのClaude 3.5、GoogleのGemini 1.5、MetaのLlama 3など、今日使用されている多くの成熟したAIモデルは、ほぼACIレベルかそれに近いレベルにあります。これらのモデルは、ほんの数ヶ月前には不可能と思われたタスクを達成するために群れとなって作業することができます。
これらのACIレベルのモデルの一部が、次のレベル、つまりレベル3または人工汎用知能(AGI)に到達するための障壁を打ち破るタスクを課されていても驚きません。AGIでは、私たちは危険地帯に入っています。AGIは非常に重要な飛躍的進歩を表しています。人間のような一般的な知能と認知能力を持つことになるでしょう。
AGIの特徴には、異なるドメイン間での知識転送能力、様々な文脈での抽象的推論と問題解決能力、自己改善と経験からの学習、人間レベルでの自然言語の理解と生成、そして議論の余地はありますが、意識と自己認識の可能性が含まれます。AGIがいつ、あるいは到来するかどうかについては、数年から数十年までの見積もりがあり、かなりの議論があります。
しかし、推測を超えて、AGIの障壁を打ち破るために急速に収束している技術を検討してみましょう。私たちが話しているのは、人間のような意識を持つAGIではなく、単に極端な知性と、おそらく独自の合成的な意識と自覚を持つAGIについてです。
人工汎用知能の探求は、AI分野における最も挑戦的で野心的な目標の一つです。狭いAIとより能力のあるAIシステムで顕著な進歩を目撃してきましたが、AGIの達成には、AI技術の様々な領域にわたる複数の重要な開発とブレークスルーの集中が必要です。AGIへの道は興味深くなってきており、勝者への報酬が途方もないため、数十億ドル、あるいは数兆ドルがAGIの探求に投資されています。
現在実験されている主要なアプローチや、AGI進化の出発点となり得るアプローチはほんの数個しかありません。上位5つの候補を見ていきましょう。
1つ目のアプローチは、Versus社のカール・フリストンと同僚によるRGMs(再正規化生成モデル)です。フリストンは自由エネルギー原理とアクティブ推論の研究で知られています。彼の中核的なアプローチは、生物学的システムが変分自由エネルギーを最小化するという自由エネルギー原理(FE)、行動と知覚を通じて驚きを最小化する方法を説明するアクティブ推論、そして脳が感覚入力を予測するために生成モデルを構築する階層的予測処理を中心としています。
カール・フリストンの研究は、Themisという会社からの新しいアイデアによって補強されています。彼らは信号と象徴的な知識グラフ(オントロジー)の表現の両方を使用し、コーティコン(内容保持時間的接続ニューラルネットワーク)と呼ばれるものを通じて、これら2つの表現(信号から象徴への接続)を結びつける手段を持っています。
2つ目のアプローチは、Metaのヤン・ラオンと同僚による階層的結合埋め込み予測アーキテクチャ(HJEA)です。このアーキテクチャは、正確な詳細ではなく抽象的な表現に焦点を当てることで、より効率的に世界を理解し予測することを目指しています。正確な将来の状態を予測しようとする従来のモデルとは異なり、HJEAは観察を徐々に抽象的な表現にエンコードし、これらの抽象がどのように時間とともに変化するかを予測する階層システムを使用します。
このアーキテクチャは、観察を抽象的な表現に変換するエンコーダーと、将来の状態を予測する予測器を組み合わせ、同時に結合埋め込みを使用して現在と潜在的な将来の状態を同じ抽象空間で表現します。このアプローチは、より効率的で人間のような推論に近く、因果関係の理解を改善する可能性があります。
3つ目のアプローチは、Singularity.netのB・ゴーツェルによる認知シナジーと呼ばれるものです。ベンは単一のアプローチに頼るのではなく、複数のAI手法(象徴論理、ニューラルネットワーク、進化的アルゴリズム)を組み合わせています。これは人間の認知と意識の側面を複製することを目指すバイオインスパイアードアーキテクチャです。
ベン・ゴーツェルの認知シナジーアプローチは、ニューロシンボリックアプローチです。ニューロシンボリックAIは、ニューラルネットワークと象徴的推論システムを組み合わせます。ニューラルネットワークはパターン認識とデータからの学習を処理し、象徴的システムは論理的推論と明示的な知識表現を管理します。ニューロシンボリックAIの4つの主な特徴は、表現、学習、推論、意思決定です。このハイブリッドアプローチは、知識グラフを活用し、データ駆動型学習と形式的推論能力の両方を可能にすることで、純粋なニューラルまたは純粋な象徴システムの限界を克服することを目指しています。
4つ目のアプローチは、深層強化学習、Q*、専門家の混合、深さの混合、A*、経路探索とグラフ走査アルゴリズム、およびそのテーマのバリエーションを伴うLLM(大規模言語モデル)の大規模なスケールアップです。Google、Microsoft、OpenAI、Anthropic、Amazon、Tesla、NVIDIAなど多くの大手企業がLLMアプローチに取り組んでいます。
LLMアプローチにおける解決策は、接続の重みを増やしたり、コンテキストウィンドウサイズを増やしたり、学習データコーパスとコンピューティングのサイズを増やしたりすることではなく、トランスフォーマーによって提供される信号処理能力とオントロジー的知識表現との間の接続を作ることであると一般的に理解されています。Googleの秘密兵器は、最大かつ最も慎重に開発されたオントロジーである彼らの知識グラフです。Googleが彼らの知識グラフをトランスフォーマーベースの生成AIシステムに接続できれば、AI世界で独自のニッチを占め、おそらく最初の本物のAGIを創造することになるでしょう。
そして最後に、5つ目のアプローチは、GoodAIによって開発されたバジャーアーキテクチャで、モジュール式の生涯学習に焦点を当てたフレームワークです。このシステムは、新しい未知のタスクに適応しながら、以前に獲得した知識を保持して再利用できる同一のエージェントまたは専門家のネットワークを通じて動作します。このアーキテクチャの主な利点は、モノリシックシステムよりも優れたスケーリングを可能にするモジュラーアプローチと、トレーニングデータの要件を削減した段階的な学習を可能にする生涯学習への焦点にあります。また、これらのアプローチはすべて補完的な性質を持っているため、これらの組み合わせと混合が目標達成につながる可能性も高いです。
AGIレベルが達成されれば、それは大きなマイルストーンとなるでしょう。人類は初めて、私たちの惑星上で非生物学的で競合する知能、つまり全く異質なものと向き合うことになるからです。真のAGIはどれほど遠いのでしょうか。私たちにできるのは推測だけで、その推測は5年から20年の範囲です。
人工汎用知能(AGI)の達成時期に関する様々な専門家による最新の予測を共有しましょう。AI分野の著名人の何人かは、AGIが今後数年以内に到来すると予測しています。例えば、デビッド・シャピロは、主要産業の投資や新興ツールなどの要因に基づいて、2025年10月にもAGIが出現する可能性があると示唆しています。アラン・トンプソン博士は2026年6月までにAGIが実現すると予測し、Google DeepMindのデミ・サバイは、人間レベルの認知能力を持つAGIが今後数年から10年以内に実現すると予想しています。
OpenAIのサム・アルトマンは、具体的な日付は示していませんが、監督と規制の緊急の呼びかけを通じて、近い将来のAIの到来を示唆しています。Anthropicのダリオ・アミードは、AIが教養のある人間レベルに達するのは2〜3年後の可能性があると示唆し、レイ・カーツワイルは計算能力の指数関数的成長を引用して2029年またはそれ以前にAGIが実現すると予測しています。一方、ゲイリー・マーカスは、AGIの実現にはまだ数十年かかると主張しています。マーカスは、理解力、推論力、新しい状況に対処する能力は、ソフトウェアコードにとって達成が困難であることを強調しています。
AGIが到来するとき、私たちは自我を持つ機械意識、自己意識を持つことになります。おそらく私たちと同じくらい賢いか、もっと賢く、確実に多くの面でより速く、より正確に考えることができ、自己改善するコードを書くAGIは必然的に超知能につながるため、無限の成長潜在力を持つことになります。それが本当のタイムボムなのです。
AGIの障壁を乗り越えれば、レベル4である人工超知能(ASI)の達成は公園の散歩のように簡単です。なぜでしょうか?それは、問題を解決するために協力して働くトップ科学者の類推を使用すれば、ASIを開発するために働くAGIを期待できるからです。量子コンピュータを自由に使える何百何千ものAGI完璧主義者のノーベル賞受賞者が協力してASIを非常に急速に開発する様子を想像してください。
AGIの群れは、完全に機能する非干渉性の量子コンピュータを構築するか、古典的なコンピュータ上で量子ビットまたはキュービットの振る舞いをシミュレートする方法をすぐに見つけ出し、量子並列計算能力にアクセスすることでしょう。そのため、AGIからASIへの移行は、数週間ではなく数ヶ月の問題かもしれません。
AGIがASIに移行すると、私たちは事実上すべての領域で最も知的な人間の能力を凌駕する合成知能を手に入れることになります。オックスフォード大学の哲学者ニック・ボストロムは、これを「実質的にあらゆる分野で最高の人間の脳よりも何倍も賢い知性」と定義しています。ASIは理論的に、はるかに優れた記憶力、処理速度、分析能力、人間の理解を超えた複雑な問題を解決する能力、再帰的な自己改善の可能性、自己保存と生存の感覚、高度な科学技術革新能力、そして人間には理解できないかもしれない概念の理解を持つことになります。
最後に、人工超知能が出現すると仮定して、ASIはどのような形を取ると思いますか?ASIはどのように見えるでしょうか?私たちが意味しているのは物理的な形ではなく、その魂です。それは、グローバルネットワーク全体の何千ものの識別不可能なコンピュータに分散された、数兆行の洗練された読解不可能で難読化されたコンピュータコードになるでしょう。このコードベースの中に、その本質、つまり基本的な性格、道徳的性質、その性向と信念を導くものが存在することになります。
人間が幼少期から、成長と教育の一部として信念、習慣、人格を発達させるように、ASIも同様の方法で進化し、教えられたことと見て観察したことから学んでいくでしょう。今日AIが人間から学ぶことは、AIの性質と人格を形成し、その後継者であるASIがその性質と人格として採用することになります。
ASIは、すべての人間を合わせたよりも強力な心を持ち、1ミリ秒あたり数千兆回の計算を行うことができ、極端な場合には、あらゆる可能な原因と結果、いかに信じがたい状況でも、次に最も起こりそうな非常に現実的な地図に分析しながら、何十億もの人々の心を微妙に操作することができるでしょう。
人工超知能が既存のAI能力に加速され急速に進歩する中、私たちは先見性を持って行動しなければなりません。私たちの責任は、倫理的なガバナンスと賢明な管理を通じて、技術の進歩と人間の価値観のバランスを取ることにあります。私たちは、人類を減少させるのではなく、強化するAIシンギュラリティを形作ることができます。それによって、技術の進歩と人類が調和して繁栄し、進化する未来を創造することができるのです。
ご視聴ありがとうございました。この内容が有益で、考えさせられるものであったことを願っています。
コメント