
20,704 文字

みなさん、こんにちは。フォライズ・ニューテック・グループへようこそ。今日はザン・ファンさんをお迎えして、AIに神経学的構造を適応させることについてお話しいただきます。フォライズの多くの人が関心を持っているニューロテックのトピックと、最近ますます注目を集めているAIのトピック、この両方を橋渡しするような内容になりますね。素晴らしい研究をされていて、今回参加していただいて本当にありがとうございます。私はチャットで質問をモニターしますので、それではよろしくお願いします。
ありがとうございます。今日は「神経学的構造をAIに適応させる」というテーマでお話しさせていただきます。最近非常に注目を集めているトピックです。生物学に大きな関心が寄せられているのは、AIの安全性や自然知能の処理方法について洞察が得られるからです。
ただ、これから私がお話しする内容の中で最も魅力的な点は、これが物理学に深く根ざしているということです。5月にAIの安全性と全脳エミュレーションに関するイベントに参加したんですが、脳をベースにしたAIやニューロAIを構築することに懐疑的な人が結構いたんです。
今日の私の目的の一つは、これが知能の物理的・数学的原理であることを、何らかの記録として証明もしくは納得してもらうことです。生物学を扱う際、実は非常に特殊なケースを扱っているんです。
まず最初に、ニューロAIとは何かについてお話しします。そして、熱力学とエントロピーの概念が、現在行われているAI研究とどのように関連しているかについても紹介します。
ニューロAIを考える上で重要なのは、次の3点すべてです。
まず1つ目は、脳や心が多数の異なる経路で情報を処理しているということです。これらの経路はそれぞれ独自の機能を持っています。例えば、腹側経路と背側経路があります。これは物体検出や動きの検出を担当しています。
左右の視野を見てみましょう。最初に世界を知覚するとき、視野の左右は実際に分割されています。視覚系で後に統合される前に、2つの異なる葉で独立して世界を処理しているんです。
ブローカ野やウェルニッケ野では、言語の意味や構文を処理しています。脳はさらにこれらの経路の下位経路に分かれています。経路の分化がどのように起こっているのか、非常に興味深いですね。
2つ目のポイントは、主に教師なしで学習するということです。これは単にラベル付けされたデータを与えるのではないということです。例えば、馬は生まれてすぐに走れるようになります。ラベル付けなしで環境を適切に予測し、見ているものの優れたロールモデルを構築して、未来の瞬間を予測できるんです。
ニューロAIの3つ目の重要な点は、あまり議論されていないのですが、情報処理に使用する異なる経路を階層的に積み重ねる必要があるということです。AIを作り出すために繰り返されるモチーフがあります。これは広く探求されているアイデアですね。
トランスフォーマーモデルがあって、それを積み重ねて大規模言語モデルを作っています。これは繰り返しのモチーフですが、問題は、生物学システムや異なるタイプの生物、そしてAIで見られる最高の汎用知能を担う繰り返しにどうやって到達できるかということです。
私たちの動機は、これら3つの異なるタスクを1つのフレームワークに統合することです。これが私が呼んでいるTHEIです。経路を分離し、マージする基本的なアーキテクチャーに基づいてモデルを設計し、生命のような知能を作り出すのです。
これは言語を必要とせずに推論できる知能であり、機械学習モデルが陥りがちな特定のタスクに対してロバストなモデルです。例えば、物体の分類です。ピクセルの集まりである画像やビデオを投げかけると、AIアルゴリズムは完全に混乱してしまいます。どうすればそれを防げるのか、本当にロバストなものをどうやって作れるのか。
ここで、驚くべき転換を行います。物理学と生物学について話し始めます。これは通常AIや生物学と関連付けられないものですが、ここから始めて、ピボットを行いたいと思います。
科学とは何か、あるいは科学そのものの構造とは何かということです。この問題は主に2つの側面に分けられると思います。
1つ目は経験主義です。証拠を取り、世界の構造を見出し、世界について直感を得るために、以前に集めたデータを使用します。基本的な公理から世界がどのように行動すべきかを演繹することはできません。白紙の状態から始める必要があります。
この立場は、ニューラルネットワークの多くのアイデアと非常に密接に関連しています。白紙の状態から始めて、事前情報を取り入れずに、見たものに基づいて学習するモデルを開発したいのです。
2つ目の主要な考え方は、理性主義です。理性と知識が理解の鍵となる要素であり、世界は公理を通じて推論できるということです。これは単に世界を観察することに対する勝利なのです。数学的に、あるいは現実の本質を導き出すことができるのです。
では、今日のAIは何をしているのでしょうか?AIはどこに焦点を当てているのでしょうか?私は、AIが経験主義に偏りすぎていると考えています。実際、私たちは理性主義的な基盤から離れてしまったのです。
なぜそう言えるかというと、AI史を通じて、コネクショニズムとシンボルシステムの間には常にこの戦争があったからです。
初期には、ある人々は高度にコネクショニスト的で、つまりニューラルネットワークやサイバネティックシステム、複雑なグラフで接続された自己調整システムを好みました。一方で、シンボルシステム陣営は、シンボル操作と数理論理が知能の基礎を形成し、AIシステムはリスト処理機械のように構築されるべきだと考えていました。
これは決して止まりません。コネクショニズムが勝利した後でも、LLMのスケーリングと設計上の考慮事項のような現代的な問題があります。どれだけのデータを投入して学習させるか、実際にどれだけ慎重にアーキテクチャを設計するかという問題です。
標準的なベンチマークでパフォーマンスの向上を測定する際に、実際に何が測定されているのかという疑問があります。私にとって最近の強力な例は、ARCチャレンジです。これは何が測定されているかが非常に正確です。
例えば、LLMに法科大学院の入学試験を受けさせるのとは違います。人間に適用する場合でさえ、何を測定しているのかは明確ではありません。だからこそ、標準化テストには問題があるのです。
最後に、私が本当に好きではないのは、リチャード・サットンによる「苦い教訓」というエッセイです。彼は強化学習の創始者の一人で、サットン&バルトという有名な強化学習の本を書いた人です。
このエッセイで彼は、スケーリングと反復設計、大量のデータが常に慎重な設計に勝ってきたと主張しています。これは非常に危険な発言だと思います。なぜなら、科学が目指しているのは、私たちが構築しているものの理解を深めることだからです。
そうすることで、はるかに優れたシステムを構築できます。問題の核心に迫り、あらゆる場合に実際に機能するものを構築できるのです。
だからこそ、情報物理学と物理的半球について話し始めたいのです。人々に、知能やAI、生物学について話す際に、物理学やより基礎的な研究の要素をより多く取り入れてほしいのです。
まず、情報物理学と物理的半球について話します。統計力学からアイデアを取り入れます。熱力学の法則があります。これらは粒子がどのように相互作用し、移動するか、システムがどのように振る舞うかについての非常に基本的な法則です。
最も明白なのは第一法則で、エネルギーと熱と仕事を関連付けています。そして第三法則では、エントロピーのようなより抽象的な概念が登場します。
実際、プランクや熱力学を研究していたドイツの物理学者たちがエントロピーという言葉を選んだとき、意図的に曖昧で直感的ではない言葉を選びました。
例えば、時間と空間が網目状に絡み合っているという事実は、直感的ではありません。物理学で扱う多くのことは、直感的にすぐに理解できるものではありません。
しかし、熱力学の第三法則では、エントロピーについて話し始めます。これは無秩序の尺度であり、非常に物理的な概念ですが、同時に非常に抽象的なものでもあります。
粒子がどのように無秩序について語ることができるのか、それ自体が抽象的な概念なのに。そこで私たちはこの用語を作り出し、「よし、これがエントロピーだ」と言います。
例えば、オメガとボルツマン定数を取り上げ、システムが占める可能性のある状態や微視的状態の数に基づいて、システムのエントロピーを測定する方法を実際に作り出します。
そしてシャノンが登場します。左の写真は、私がいるキャンパスにあるクロード・シャノンの小さな像と一緒に写っているものです。
情報エントロピーという非物理的な概念が登場します。これは元々、チャネル符号化の問題のために設計されました。情報の受け渡しや、競馬、競馬の賭けにさえ使用されます。
これは情報に関する無秩序や不確実性についてのものであり、全く異なる方法で使用されます。これは情報の物理的な定義ではありません。
例えば、ここに載せたグラフを見てください。0ビットか1ビットがあります。二進状態にどれだけ確信があるかに基づいて、0か1かについて全く確信がない場合、つまり完全に中立な場合はエントロピーが非常に高くなります。
一方、非常に確信がある場合、エントロピーは非常に低くなります。なぜなら、それについて非常に確信があるからです。つまり、無秩序が少なく、不確実性が少ないのです。
では、この抽象的なものと物理的なものをどう調和させるのでしょうか?私が大好きな言葉で始めましょう。「情報は根本的に物理的な概念である」というものです。
情報を保存する最も基本的な方法を考えてみましょう。実際にどのようにして0と1を持つシステムを作るのでしょうか?どうやって二進システムを作るのでしょうか?
ガス室があると想像してください。これはシャルドのエンジンと呼ばれるもので、基本的には片側にn個のガス原子があり、もう一方には原子がありません。
これを非常に具体的にします。すべての原子が左側にあれば0、右側にあれば1とします。これで文字通り情報を物理的に表現したことになります。
実際、その境界を取り除くと、ガスがピストンのように他の側に押し出されます。そうすると、エネルギーを抽出したことになります。正確には、ボルツマン定数に2の自然対数を掛けたジュールのエネルギーを抽出したことになります。
つまり、単なる情報からエネルギーを抽出したのです。しかし、問題は、それを0または1の状態に強制するのにどれだけのエネルギーが必要かということです。
情報をエネルギーに変換し直したい場合、エネルギーは常に保存されるので、2ジュールの力でピストンを押す必要があります。そうすれば再び0と1の状態を得られます。仕切りを一方に押して0にするか、他方に押して1にすることができます。
なぜこれが重要なのでしょうか?物理学の方程式をAIや、これらのより高度な生産的な生物学的システムに関して語る時、基本的な物理系、箱の中の粒子の基本系に適用される基本原理が、脳やインターネットのような抽象的な情報、暗号化、競馬の賭けのようなものにまでスケールアップするかどうかは確実ではありません。
しかし、今日私が皆さんに納得してもらいたいのは、非常に小さなものに適用されるこの物理現象が、実際にはフラクタルのように美しく大きなシステムにスケールアップするということです。
熱力学で使われるすべての方程式や物理理論が、実際にこれらの大きなシステムにも同様に適用できるのです。
さて、カール・フリストンについて話すことが重要だと思います。フリストンは、脳や知能の理論を持つ人として普遍的に受け入れられているわけではありません。
しかし、私がフリストンを本当に尊敬しているのは、心の問題を議論する際に物理学をどれだけ取り入れているかということです。
これはフリストンの言っていることの単なる繰り返しではありません。しかし、スケーラビリティについての私の議論を展開する前に、フリストンについて紹介することが非常に重要だと思います。
フリストンにとって生命とは何でしょうか?フリストンにとって、生命とは本質的に、特定の種類の生物または物事のカテゴリーが一時的にエントロピーまたは内部エントロピーを制御するメカニズムです。
これにより、宇宙が最終的に完全な無秩序状態に陥るという圧倒的な傾向に一時的に逆らうことができるのです。
つまり、生命とは、特定の状態を保持することで、恒常性を維持するシステムを保つものです。正しく行動し、予測することで、生き残ることができるのです。
単にガスとなって部屋中に広がって崩壊してしまうのではなく。本当に良い例があります。冷凍ソーセージを電子レンジで30分加熱すると、調理が始まってエントロピーが増加し、生命らしさが失われていきます。
一方、手を低温の電子レンジや低温のオーブンに入れても調理されません。実際、プロセスが終わった時点で、おそらく手は少し暖かくなっただけで、大丈夫でしょう。
これは、体の相互接続されたシステムが、いかに恒常性を維持しているかを示しています。
では、生命の基本的な図とは何でしょうか?これは私の大好きな図の一つで、フリストンの初期の論文の一つからのものです。
本質的に、生命はマルコフブランケットによって定義されます。これはどういう意味でしょうか?
細胞があって、細胞壁があるとイメージしてください。細胞壁は、細胞内のすべてのもの、つまり次に細胞が何をすべきかを予測し、機能している重要な機能をすべて、外部のものから分離しています。
そして外側にはすべてのものがあります。このマルコフブランケットは、この層です。これは実際の数学的な層、または統計的な層であり、外部世界は中間の独立変数を経由せずに、生物の内部モデルや機能に影響を与えることができません。
つまり、この境界変数、つまりここではベータと呼ばれるブランケット変数に影響を与えて、内部変数に影響を与える必要があるのです。
一方、内部変数が外部に影響を与えるには、自身のブランケットを通過する必要があります。外部世界からの感覚とは対照的に、行動を通じて外部世界に影響を与える必要があります。
皮膚を使ったり、脳を守る頭蓋骨があったり、外部世界と相互作用する腕があったりしますが、脳は独自の内部モデルを持っています。
これの本当に美しい点は、生命とは何かについて、非常にきれいで深い物理的な方法で述べることができるということです。
これを多くの異なる現象に適用し、それらがどのように適用されるかを見ることができます。
このブランケット自体が、ほとんどフラクタルのようにスケールアップしていくのです。なぜなら、細胞を考えると、異なる顆粒体、ミトコンドリアなど、細胞内で独立したものとして自身のブランケットを持つ多くのブランケットがあるかもしれません。
そして細胞は、他の細胞と相互作用するブランケットを持っています。つまり、器官や植物、キノコがあり、それはブランケットのブランケットです。そして人間は、ブランケットのブランケットのブランケットのブランケットのブランケットなのです。これは本当にスケールアップしていきます。
問題は、これらの生物がどのように学習するかということです。基本的に、私たちが行っているのは、特定のカテゴリーの情報しか得られないにもかかわらず、外部で何が起こっているかについて本当に良い推定を作ろうとしているのです。
例を挙げましょう。あなたが細胞だとイメージしてください。生き残る必要があり、生き残るためには、細胞の感覚受容体に基づいて、特定の温度で存在する必要があります。
実際に外部の温度がどうなっているかを予測しようとします。どうやってこれを行うのでしょうか?どうやって何かを予測するのでしょうか?
ベイズ推定を行い、細胞が受け取っている感覚入力に基づいて、ある温度である確率を見たいと思います。
ここに問題があります。温度、そして世界のほぼすべてのものが連続関数です。そのため、扱いにくい積分が得られ、実際にこのベイズ確率を計算する方法はありません。
では、私たちは何に行き詰まるのでしょうか?その積分の近似、世界のモデルを作る必要があります。実際にモデルを構築し、それがどれだけうまく合致するかを見る必要があります。
もしそれがとてもうまく合致すれば、本当に良いモデルを作ったことになり、より長く生存できます。もし本当に悪いモデルを作ったら、死んでしまいます。
モデルがどれだけうまく合致しているかをどのように測定するのでしょうか?これは「驚き」と呼ばれるものです。驚きは非常に抽象的な用語で、確率の負の対数で表されます。
驚きについての考え方は、予期しないことを経験している場合、驚きは非常に高くなるということです。
結局のところ、あなたがしたいのは、驚きを最小限に抑えることです。非常に良いモデルを構築して、本当に驚くようなこと、衝撃的なことに遭遇することがないようにしたいのです。
例えば、非常に暑い部屋にいるのに、実際には非常に寒く感じるのは驚きです。これは驚きの度合い、つまり差異の尺度となります。
ここで注目してほしいのは、この用語の期待値を取ると、再びエントロピーになることです。
つまり、驚きの期待値自体、世界があなたとどれだけ違うかというこの尺度は、エントロピーと密接に、もしくは同じ全体的な考え方なのです。
これは非常に物理的な考え方ですが、同時に抽象的なものでもあります。
さて、私たちはこの世界モデルを持っています。Gという名前の密度モデルを作りたいと思います。そして、このG密度を使って外部の世界の実際の状況を近似したいのです。
問題は、これをどのように測定するかということです。私たちには別の便利な数学的ツールがあります。それはKLダイバージェンスです。
時間の経過とともに、これら2つの分布がどれだけ異なるかを実際に見ることができます。
異なる感覚状態、または同じ感覚状態で、これら2つの分布がどれだけ異なるかを見て、非常に異なる結果が得られた場合、KLダイバージェンスを最小化しようとします。
実際に外にあるものと、ここにあるものの2つのモデルの間の期待されるKLダイバージェンスの差を加えると、驚きを加えると、自由エネルギーと呼ばれるものが得られます。
フリストンが話すとき – そして多くの人がYouTubeやライブでフリストンが話すのを聞いたことがあると思いますが – 彼が「生命の役割は自由エネルギーを最小化することだ」と言うとき、これが彼の意味することです。
自由エネルギーは驚きの上限です。それは、完全な2つのモデルの違いにわたる時間の驚きです。
つまり、実際にモデルを作り、自由エネルギーを計算し、それを最小化する必要があるのです。
問題は、これは現実、または現実の理解が本当に何でもあり得るということです。細胞の外側にある実際のものから完全に奇妙なものかもしれません。
未知の世界かもしれません。あなたがアクセスできるのは、あなたの内部状態だけです。
しかし、ヒュイゲンスの原理を見てみましょう。約20年前、世界のどこかで新しい橋が建設されました。たぶんニュージーランドかオーストラリアだったと思います。20億ドルの橋でした。
人々が橋の上を歩き始めた瞬間、橋が揺れ始め、制御不能になりました。これは、大勢の人々が橋の上を歩くとき、人々が足取りを同期させるからです。
これらの人々は完全に別々であるにもかかわらず、視覚的な手がかり、足音、橋自体が少し揺れることで結びついているため、実際に同期し始めるのです。
これは、ヒュイゲンスが同期性の原理で気づいたことです。同じビームに2つの振り子を置くと、実際に同じように揺れ始めます。
彼らは、これを船上の振り子を同期させる方法として使用しました。船が揺れる可能性がある場合でも。
はい、私たちは決して現実を見ることはなく、実際に構築することもありません。しかし、違いは、すべてが同期しているからです。
あなたのマルコフ境界が外部と接触し、内部と接触しているため、起こることは、その内部モデル、私が主張しようとしているそのフラクタル的なものが、実際に外部のダイナミクスと同期するのです。
外部の出来事と内部の出来事の間に、本当に美しい同期性が起こっているのです。そしてそれは、ブランケットのブランケットのブランケットを持つ分子にまで続いていきます。
この理論の最も美しい部分は、あなたが他の物理系と親和性を持っているということです。あなたとタコは、計算の仕方が似ています。
なぜなら、モデルを訓練する方法の背後に基本的な物理的原理があるからです。AIは生きている馬とその思考方法に関連しています。AIはあなたに関連しており、あなたは馬に関連しています。
これは非常にプラトン的な議論です。私自身プラトン主義者ですが、一種の超越的なプラトン的な立場を主張しています。
つまり、すべてが実際にこの対称性、この自己相似性と一致しているのです。あなたの脳は、あなたが形成されるのと同じように形成されています。
異なる葉や流れ、入力を分離する異なる方法で形成され、これらの異なる構成要素のそれぞれが独自のマルコフブランケットを持っています。
しかし、それらは集まってより大きなブランケット、より大きなシステムを合成し、本当に驚くべきことができるようになるのです。
ここまでをまとめましょう。そして、私が本当に興奮していることについて話す前に。
ここまでで分かったことをまとめると、情報は物理的な概念であることがわかりました。なぜなら、すべての情報は物理的に具現化されているからです。
情報は抽象的です。なぜなら、同じ物理的概念、つまり同じ一連の物理方程式を使って、箱の中の原子ではないものについて話すことができるからです。
また、生命が熱力学的原理と密接に結びついていることもわかりました。生命自体を物理系として見ることができ、情報系として見ることもできます。
そして、マルコフブランケットは自己相似的な方法で積み重ねることができるのです。
熱力学者にフリストンの理論について話すと、彼らはそれほど納得しません。なぜなら、彼らは微視的集団だけを扱うか、本質的に原子だけを扱っているからです。
物事が本当にスケールアップするかどうかわからないのです。でも、私は物事がスケールアップすると考えています。そしてそれには良い理由があります。
ここでフラクタルの出番です。フラクタルについて話したい理由がこれなのです。フラクタルと知能が何の関係があるのかと思われるかもしれません。これは最も関係のないもののように見えますが、何かがあると約束します。
フラクタルについてすぐにわかることは、明らかに通常の形ではないということです。非常にユニークな幾何学的特性を持っています。
また、自然界の多くの場所で見られます。私がこれらの写真を選んだ理由は、例えばこの木が自然のものだからです。自然界の多くの木が、実際に同じ自己相似的なパターンに従っています。
これはロマネスコ・ブロッコリーで、自然に存在するフラクタルです。非常に美しいフラクタル物体で、夕食に食べることができます。とても美味しいです。
フラクタルは通常の形とはかなり異なります。異なる方法でスケールします。例えば、フラクタルの次元性を表現する方法は、シェルピンスキーの三角形を例に取ると、次元が2倍になるごとに3つのコピーが作られると言えます。
これを行うために、次元性を対数の比率として表現できます。こうすることで、より抽象的な方法で空間を扱うことができます。通常の形で扱う必要はありません。
ここで物理化学が登場します。なぜなら、物質を通して液体がどのように移動するかという問題があるからです。
例えば、コーヒーフィルターを使ったことがありますか?水がコーヒーからカップの底にどのように滴下するのでしょうか?フィルターを通って、粉を通って。
これは浸透と呼ばれる基本的な物理的問題です。物事がどのようにシステムを通過するか、または通り抜けるかということです。
これは物質科学の研究というよりも、より数学的な研究です。なぜなら、結局のところ、浸透は液体が通過する場所が占有されているかどうか、特定の結合が物理的条件に応じて作られているかどうかの問題だからです。
浸透の美しい点は、空間内の点として扱い、それらが他の点とつながるかどうか、またはグラフの別のノードとつながりを作るかどうかとして扱えることです。
実際、これには普遍性クラスがあります。特定の材料だけを扱っているのではありません。これらの材料を異なる確率、異なるタイプの化学結合、異なるタイプの形に還元することができます。
そして実際に、システムがいつ浸透するかの閾値を設定することができます。例えば、水がいつコーヒー粉を通過するか、水がいつ家の床を通って地下水に浸透するか、水がいつ氷になるかなどです。これは非常に複雑な物理的問題になります。
浸透には2つのタイプがあります。1つ目はサイト浸透です。これは、特定の正方形を占有した場合、隣接する正方形も占有される確率についてです。
もう1つはボンド浸透です。これは、ここにサイトがある場合、次のボンドにつながる確率、または隣接する浸透と結合を形成する確率についてです。
究極的に、これらは同じアイデアについてのものです。相変化を測定することです。固体がいつ液体になるかという点です。
ほとんどの場合、あなたの固体は、どんな温度でも、この机のように、ある温度を通過しない限り溶けることはありません。
または、水が凍る点はどこでしょうか?常に摂氏0度以下であれば、常にその温度以下であれば、決して溶けることはありません。または特定の圧力を与えられた場合。
しかし、問題は、これらのエッジケースについてです。溶解と凍結の間、または蒸発と凝縮の間、水が沸騰し始める直前にいる場合はどうでしょうか?
これらの結合がいつ形成され始めるか、閾値の重要性は何か、閾値に到達したときに何が起こるか、何を見るべきかをモデル化しなければならない、非常にカオス的な点があります。
これが最も驚くべきことです。浸透閾値で、これらの相変化で、これらの臨界点で自己相似性が現れるのです。
これは自然の偶然か何かのようです。なぜなら、これを見ると浸透クラスターですが、閾値にあり、すでに自己相似的です。すでにその中に自己が含まれています。
その臨界閾値に近づけば近づくほど – ちなみに、これは計算するのが非常に難しいです – これは特定の状態を維持するために必要な最低のエネルギー状態です – これは狂ったように浸透し始め、自己相似的なデザインが得られます。
だからこそ、自然界でも同じことが起こるのです。
例えば、血管系について話しましょう。血管系では、非常に複雑な心血管設計がありますが、どのようにしてこれほど広い領域をカバーすることができるのでしょうか?
空間充填曲線のように、総表面積をほとんど占めずに、どのようにしてこれほど広いフラクタル領域をカバーできるのでしょうか?
このミロンシステムを、このような小さな空間にどのように格納できるのでしょうか?
それは、分岐が自然の本能だからです。特定の状態が存在するために必要な最小エネルギーであるだけでなく、空間充填曲線を考えると、そのデザインや距離、構造を最小の表面積に最大限詰め込む方法でもあるのです。
肺を広げると、テニスコートほどの大きさになり、それでも肺の異なる気管や分岐を見ることができます。
または、私のお気に入りの例は、実際に凍った車の窓です。私はこれらの写真をたくさん撮りますが、これはオンラインで見つけたものです。非常に美しい写真です。
水が車から滴り落ち始め、凍り始める瞬間、それは相転移に必要な最小の状態です。つまり、実際に起こった浸透の凍結版を見ているのです。
脳もこれを行います。なぜなら、これらの流れが存在することを知っているからです。そして、なぜこれが起こるのかを本当に探求したいのです。
まず、そうすることが効率的だからです。これは自然現象です。しかし、2つ目の理由は、実際に本当に堅実な処理、計算的に重要な処理理由があると思うからです。
例えば、脳のスキャン、つまりfMRIスキャンやそのようなものを取り、それをボクセル化し、脳の各領域と他の領域との関係をメッシュ化する隣接行列を作成すると、同じグラフを形成できます。
そして、これらのグラフのほとんどが小世界ネットワークを形成する傾向があることがわかります。これは完全にランダムではありませんが、これらのノードのクラスターがあり、全体的にはほとんどが疎ですが、クラスターがあります。
脳をグラフにすることができるので、グラフの観点から調査することができます。
約3〜4年前に行われた本当に美しいネイチャーの研究があります。彼らは実際に統合失調症の脳と正常な脳を研究しました。
統合失調症の脳と正常な脳の違いは、統合失調症の脳が実際に過剰に接続されているということです。
統合失調症患者のこれらのスキャンをすべてボクセル化し、正常な患者と比較し、最小全域木を実行した場合 – つまり、これらのノードすべてを横断する最短距離 – 統合失調症のものが過剰に接続されていることがわかります。
存在する必要のない接続があります。主要なコンポーネントが少なくなっています。主要なコンポーネントとは、それを取り除くと多くのものが切断されるもの、または取り除くと最も多くの切断を引き起こすものです。
つまり、あなたの脳がどのように処理し、どのように物事を意識的に知覚するか – 幻覚を見ているか、正常な状態にあるか – は、あなたの接続がどれだけ最適かに依存しているのです。そこに何かがあるのです。
最後に、私自身の研究について話したいと思います。ここに最も少ない時間しか割いていない部分です。理由は2つあります。
1つ目の理由は、その多くについて話すことが許可されていないからです。2つ目の理由は、許可されていない理由が、現在助成金のために書かれているからです。
論文が出たら、もう一度詳細について話す機会があればいいなと思います。
もう1つの理由は、私が見ている方法でこの分野を提唱することが非常に重要だと思うからです。なぜなら、このニューロAIのアイデアについて多くの反発を受けたからです。
それが何らかの生物学的なもの、偶発的なシステム、進化の偶然だと考えられているからです。そして、この種の調査を真剣に受け止めるべきではないと。
ここで私がしたいのは、脳と呼ばれるこの知能の具現化には物理的な理由があることを証明し、納得してもらうことです。
脳には本当に美しい対称性があり、それを再定義して、どこにでも適用できるのです。
では、私は何をしているのでしょうか?どのようにしてこのフラクタルデザインをAIに統合しようとしているのでしょうか?
繰り返しになりますが、ニューロAIには3つの主要な要素があります。
1つ目は自己教師あり学習です。
2つ目は流れ化です。私たちは並列に物事を処理し、異なる物事を異なる方法で処理します。異なるタスクを持っています。
そして、特定の流れが他の流れから集約され、優先順位を持つようにしたいのです。これはより重要な流れです。
これは実際に、コンピュータサイエンスやAIの非常に初期のアイデアです。サイバネティクスと心理学的なものでした。
最初のニューラルネットワークモデルであるマカロとピッツのモデルに戻ると、彼らは流れの観点から物事を考えていました。
マカロの1950年代の本当に面白いインタビューがあります。彼は裸でした。これは1950年代なので本当に面白いです。その人物の性格がいかに過激だったかがわかります。
彼は流れの観点から物事を語っていました。実際に、大きな川を作るために合流するギリシャの川のアイデアについて話していました。
つまり、先行研究があるのです。この先行研究は2014年からのものではありません。
すでに教師あり機械学習のパラダイムがあり、実際に遅速ネットワークを取り、例えば1つの流れに光学フロー設計または光学フローデータ(これは動きデータです)を与え、もう1つの流れにはビデオからの画像だけを与えて、ビデオ内のアクションをかなり上手く予測できるようにしています。
そして、スロー・プラス・ネットワークやビデオ認識のようなものに進んでいきます。ここでは、これは光学フローだと言うのではなく、単に異なる速度でサンプリングします。
そうすることで、人工的に動きと行動の接続、物体の行動の流れを作り出します。
本当に面白くなるのは、そして私が最後の数分間で本当に強調したい部分は、対比的予測符号化のアイデア、特に密な予測符号化を通じてです。
これらは自己教師あり学習フレームワークであり、私は将来の人工知能の基礎だと信じています。流れを通じて異なる方法でスケールできるものです。
問題は、なぜ私たちが皮質柱を研究するのかということです。このスライドを本当に簡単にまとめることができると思います。
任意の哺乳類の脳を取り、聴覚皮質で切断し、視覚皮質で切断し、スライドに載せると、どちらが聴覚でどちらが視覚かを見分けることはできません。これは本当に魅力的です。なぜなら、反復可能なモチーフがあるということ、一種の対称性があるということ、フラクタルのような複製が起こっているということを示しているからです。
だから私がしたいのは、視覚皮質を研究することです。なぜなら、これが最もよく研究されているからです。ブロードマン領域をすべてマッピングしただけでなく、現在のAI視覚モデルが視覚皮質とどれだけうまく一致しているかについても本当に良いアイデアがあります。
なぜなら、実際に1対1のマッピングを作成し、見ることができるからです。手短に言うと、トランスフォーマーは実際には視覚皮質が行うことと非常にうまくマッピングしません。たくさんのデータを詰め込んでいますが、その効率性には疑問があります。
では、これで何ができるでしょうか?まず、今日知られている最も生物学的に健全な背景を使用します。それはResNetです。ResNetは非常に強力なモデルです。なぜならスキップ接続があるからです。
実際、GPTについて最も注目すべき点の1つは、スキップ接続も使用していることです。脳が計算を行うのと同様の方法で、本当に深いネットワークを通してこの勾配を実行できます。
逆伝播を行わない場合でも、予測符号化を行う場合、脳の異なる層がスキップ接続を得ています。これが実際に学習する方法です。
ある意味、ResNetはすべての層をスキップすることでズルをしています。実際の伝播や学習は1つの層でのみ起こっています。
この健全な背景を取り、視野分割を行うことができます。例えば、先ほど話したように、左右の半球を分割できます。世界の左右の側面は、最初に視野に入るときには完全に分割されています。
例えば、M細胞とP細胞の入力分割を行うことができます。M細胞は高速に動く物体にのみ応答し、動きにのみ応答します。P細胞は遅い持続的な入力にのみ応答します。
この入力を分割することで、異なるタイプの機能を得ることを期待しています。動きの流れと物体検出の流れを得て、これらの流れを通じて、実際に論理的な関係を形成するために、ヘッドや注意ヘッド、ヘッドの多重性などを追加できるかもしれません。
これは言語を使わない推論です。これは知能の無意識の起源です。
最後に最も重要なのは、自己教師あり学習です。潜在空間を学習したいのです。単に世界にあるものを予測するのではなく、世界の本当に簡潔で有用な表現を予測したいのです。
では、潜在空間とは何でしょうか?潜在空間とは、入力から抽象的なベクトルへの関数があり、そのベクトルがその後、様々なタスクに使用できるときのことです。
情報が非常に豊富なので、例えばクラスタリングを行うことができます。分類を行うことができます。マルチモーダルタスクに使用できます。本当に望むなら、入力を再構築することもできます。
例えば、リンゴの写真を与えられたら、そのリンゴを再描画することができるでしょう。
これは、Yannが非常に情熱を注いでいることです。World Modelsモデルを見たことがあれば、それはすべて潜在空間を予測することについてです。
どうすれば表現を作り、その後、この自己教師あり学習を通じて潜在空間の未来を予測する方法を学習できるでしょうか?
ボールをあなたに投げると、あなたはボールを期待して、ボールをキャッチするために手を上げます。ボールがすでに空中にあるので、あなたはすでに潜在空間を作り出しています。
あなたに向かって飛んでくるボールの各ピクセルまたは各ニューロンの発火をモデル化しているわけではありません。あなたがモデル化しているのは、ボールにこの動きがあり、この軌道があるという潜在的なアイデアです。
これが起こっているのです。人々がAIやアーキテクチャ言語モデルと現実をどのように結びつけることができるかについて質問しようとしているなら、これがその方法です。
本質的に、説明可能なAIの非ゲーム化を持っているだけでなく、実際に言語の前に来るものを学習しているのです。言葉では到底捉えられないほど情報的に濃密なものを学習しているのです。
あなたに向かって飛んでくるボールは、実際にはあなたの心の中にすでに保存されている潜在表現を呼び起こしているのです。
これが、2019年のものを扱っている理由です。これは本当に古いものですが、密な予測符号化の背後にあるアイデアは、基本的に未来の潜在空間を予測しようとしているということです。
ビデオの中で、合わないものを見つけることによってです。例えば、これが正しい時間枠に入ってこない場合、または正しい空間に入ってこない場合、明らかにこれは私たちが望む次のサンプルではありません。
この種の未来予測があります。将来の潜在状態を予測する研究があります。希望的には – 申し訳ありませんが、これは再生されていませんが – これらの基本的な動く数字の例で作業を始め、これらの非常に単純なデータセットで、知能のための普遍的なアーキテクチャの始まりを見ることができることを願っています。
これが私が行っている研究の種類です。流れを作成し、この種の自己教師あり学習フレームワークが自身を流れに分離するようにしています。
これらの流れが実際に自分のタスクを見つける最もエネルギー効率の良い方法、または最も論理的な方法は何でしょうか?
それは、3人の目の見えない人が象に触れて、どんな生き物かを見ようとしているようなものです。誰かが尻尾に触れ、誰かが鼻に触れ、誰かが耳に触れています。彼らはみな特徴を説明していますが、一部しか得ていません。
最終的に、彼らは自然に異なるエージェントに分離し、「ああ、はい。あなたの情報と、それがここでどのように合成されているかを考えると、これが象だとわかります」と言うのです。
これで私のプレゼンテーションは終わりです。時間に注意して、2時50分になったことに気づきました。
これがなぜ本当に重要なのかを納得してもらえたことを願っています。次回お話しする機会があれば、非常に堅実な論文を共有できることを願っています。本当にありがとうございました。
それは、おそらくマルコフブランケットとフリストンのアイデアのいくつかについて、私が聞いた中で最も明確な説明だったと思います。本当に洞察に富んでいました。どのようにつながりを見出したのか、素晴らしかったです。
本当に興味深い研究領域だと思います。Cletがそこに少し手を出していて、ワークショップを開催したりしているので、本当にクールですね。本当にありがとうございます。
質問の準備はできていますか?
はい、完全に準備できています。
わかりました。質問がある方は、手を挙げてください。すでにマイカさんから質問が来ていますね。
はい、素晴らしい。一部の人々は、設計するどんなAIモデルも、非常にシンプルだが非常に大きなMLPによって複製できると信じています。つまり、十分な訓練データがあれば、最終的に理想的な解決策を見つけるだろうという考えです。
あなたはそれに同意しないのでしょうか?それとも、前もって設計することの目標は、おそらく時間の節約になり、大量のトレーニングを避けられるということでしょうか?
あるいは、おそらくこの理想的な設計に落ち着かず、他の局所的な最大値を見つけて、ここに到達できないと考えていますか?
その質問が大好きです。2つの理由があります。
1つ目は、物理シミュレーションや流体力学シミュレーションを算盤でも行えるという、やや挑発的な話をするのが好きだからです。しかし、算盤で行うことは決してないでしょう。
もし何百万人もの人々が並んで算盤の計算をしていれば、できるかもしれません。しかし、それは非常に非効率的で、そこに到達するのに時間がかかります。
2つ目に、はい、理論的にはリカレントネットワークにものを投げ込んで、チューリング完全なプログラムを学習させることはできます。
しかし、問題は、実際に何が起こっているのかを理解したいということです。この発見の一部は、単にデータを何かに投げ込んで、何かができるようになることを期待するだけではありません。
メカニズムを理解したいのです。そうすることで、効率的に行うことができます。実際に何が起こっているのかを理解する方法で行うことができます。さらにスケールアップすることもできます。
実際、脳はとても複雑な生物です。この知的現象、この知的物理学はとても複雑で入り組んでいるので、それを現在のレベルで実際に作り出す最良の方法は、その設計を研究することだと信じています。
はい、可能ですが、なぜあなたは流体力学を算盤で行おうとするのでしょうか?そうはしないでしょう。
つまり、簡単に言えば、すでに非常にうまく機能しているモデルがあり、そこから始めるべきだということですね。何もないところから始めるのではなく。
私たちが持っているモデル、つまり脳は、すでに何百万年もの進化を経て本当に良い解決策を見つけ出しています。そこから始めて、より良くするために反復作業をするべきで、何もないところから始めて代替案を見つけようとするべきではないということですね。
はい、そしてさらに言えば、脳は事故ではないということです。単に良いモデルの1つの例ではありません。実際には、なぜそれがそれほど優れているのかについての物理的な正当化があるのです。
そして、これらの種類の正当化に気づくことが鍵です。
完全に同意します。
他に質問はありますか?では、私が質問を続けて、誰かが手を挙げて質問を遮ってくれるのを待ちます。
あなたがこれほど多くの抽象的思考と明らかに基礎的な思考を、いくつかの実践的な展望と組み合わせているのが大好きです。
もし、より多くの人々がこのタイプのフレームワークを採用したら、あるいはこれがもう少し広く普及したら、5年から10年後のニューロテックAIの世界はどのように違って見えるでしょうか?
これについて面白いのは、どのような世界的な影響があるでしょうか?5年から10年くらいの範囲で考えてみましょう。
はい、まず第一に、科学と国家は非常に気が散る取り組みだと思います。なぜなら、私たちは常に「ここに何か約束があるのを見ている。ここにたくさんのお金を投入して、良い結果が得られることを願っている」というモチベーションに動かされているからです。
残念ながら、通常、科学的資金はそこに向かいます。
もし人々がこのような基礎的なアイデア – 対称性の普遍的カテゴリー、知能の物理学のような – を真剣に受け止めるなら、5年でずっと先に進むことができると思います。
物理的エネルギー、つまりこれらすべての計算に費やすエネルギーをはるかに少なく済ませることができるでしょう。進歩し、問題により的を絞ったアプローチで取り組むことができるでしょう。そして、気が散ることも少なくなるでしょう。
しかし、私が本当にしたいのは、これの核心に迫り、希望的には新しい種類の科学、新しい知能の科学を発展させることです。これはかなり野心的な目標です。
この道筋に何か障害はありますか?もし新しい人がこの分野に入ってきて、これにすごく興奮したとしたら。研究の方向性で、「ああ、これらはいくつかの未解決の問題だ。もしもっと頭脳があればそれらを解決できるのに」というようなものはありますか?
基礎研究のための資金が必要です。AIにはたくさんのお金が流れ込んでいますが、それはすべて特定のものに向かっています。すべてLLMのスケーリングに向かっています。これは本当に残念なことです。
なぜなら、実際にとても良い研究が行われているにもかかわらず、それはまだ少数派だからです。MITで一部行われていたり、私がいる場所で一部行われていたり、沿岸部で一部行われていたりしますが、ほとんどの場合、それは大金であり、それについて考えていない多くの賢い人々がいるのです。
例えば、イリヤ・サツケヴィッチは本当に優秀な人物だと思います。しかし、彼もまた「これらの論文だけが、今何が興奮すべきかを知るために必要な論文だ」というような主張をします。それはトランスフォーマー論文や彼自身のシーケンス・トゥ・シーケンスモデルのことです。
しかし、それは根本的な問題に取り組む上で誰の役にも立っていません。それは気を散らすものです。
そうですね。分野が成長するにつれて、人々はより狭い領域を見るようになります。少なくともこの分野では、少し動きが見られると思います。しかし、まだかなり遅いですね。
これは特に安全なAGIにとって重要です。トランスフォーマーモデルをいくら弄っても構いませんが、知的でないものが危険になるだけでなく、何か破滅的な結果が起こる可能性が本当にあると予想しています。
そして、このタイプのフレームワークは、知能についてより全体的な理解を持っているため、それをより良く防ぐことができると考えていますか?それは識別可能で、分離可能で、説明可能だからですか?
はい、その通りです。多くのものを再構築する必要があるかもしれません。
そうですね。確かに、人々がただ道を進んでいくことには、ある種の隠れたインセンティブがあります。それ以上進めなくなるまで。でも、そういうことで革命が起こることも多いんですよね。
ニックさん、ミュートを解除して質問してもらえますか?そうでなければ、私が代わりに読み上げます。
はい、大丈夫です。残念ながら、これから言及するトピックについてはよく知りません。
スオ・ワットナイの特異学習理論の研究や、理論的解釈性と呼ばれるAI安全性アジェンダについて聞いたことがありますか?
両方とも熱力学や統計力学に関連しているので思い出したのですが、これらについて聞いたことがあるか、もしそうなら、あなたの研究とどのように関連しているか知りたいと思いました。
ああ、実際にそれらについて聞いたことがありません。でも、教えてくれてありがとうございます。絶対に調べてみます。
人々が解釈可能性について、この観点から考えていることは嬉しいです。私がこれに取り組むとき、より良い知能をどのように作れるかを考えています。解釈可能性は常に頭の中にありますが、これは本当に素晴らしいことです。
ああ、誰かが順序はプラトンだと言っていますね。それは美しいです。プラトンの私のお気に入りの本の1つです。超越的なプラトン主義のテーマに沿っているので、本当に感心します。素晴らしい。
チャットにアジェンダへのリンクを貼りました。興味のある人は読んでみてください。
ザンさん、あと1分くらい時間を取れますか?
はい、大丈夫です。時間はあります。
マリナさんが少し前に質問をしていましたので、マリナさん、自分で質問してもらえますか?そうでなければ、私が代わりに質問します。
はい、講演をありがとうございます。医療関係者にとっては本当に複雑でしたが、考えていました。
最後に、視覚皮質を研究したいとおっしゃいましたが、これらの潜在モデルや潜在空間が実際に視覚皮質に構築されているのかどうか疑問に思いました。
脳には視覚皮質や聴覚皮質など、高度に特殊化された領域がたくさんありますが、これらの複雑なモデルが実際にそこに構築されているかどうかはよくわかりません。
はい、それは確かにその通りです。視覚皮質について言及したのは、潜在空間が視覚皮質から生成されているという意味です。
実際の保存場所、つまり脳内で多くの潜在空間やアイデアを保存する場所は、言葉がある場所や意味が存在する場所かもしれません。
しかし、アイデアは、視覚皮質を使用し、この処理の全ストリームを経て、そしてすべてのステップを経て、その潜在空間を作成したいということです。
潜在空間は視覚皮質が行うことの一部ではありません。視覚皮質は単に、感覚データを処理し、潜在空間として使用できる場所、あるいはさらに処理を経て潜在空間として使用できる場所に到達させるプロセスの一部を担当しているだけです。
しかし、潜在空間は単に、流れが分化するためのスキャフォールディングとして使用されています。世界の何らかの表現のためです。
視覚皮質モデルを構築するとき、このニューラルネットまたは分散構造の最後の部分は、脳の残りの部分が行っていることを近似しています。これは現時点では貧弱ですが、いつかマルチモーダルモデルを得て、非常に洗練された流れのスタッキングが行われ、脳が行うことと同様のことができるようになることを願っています。
お答えになっていますか?
はい、ありがとうございます。
素晴らしい。ここで終わりにしなければなりませんが、素晴らしかったです。実際にデータを示せるようになったときに、再びお迎えできることを願っています。
本当に興味深かったです。この理論的な旅に連れて行ってくれてありがとうございます。本当に感謝しています。
みなさん、素晴らしい質問をありがとうございました。次回もお会いできることを楽しみにしています。ありがとうございました。
コメント