

レックス・フリードマンは最近アマゾンの熱帯雨林に行き、かなりの経験をしたようです。自然とのつながりを感じ、視野を広げた後、イーロン・マスクとほぼ9時間に及ぶポッドキャストを行いました。その一部は、ニューラリンクの背後にいる様々な人々、特に最初の人間サイボーグと言えるペイシェント・ゼロとの会話です。この人物はニューラリンクの最初の人間患者で、脳にニューラリンクを埋め込む手術を受けた四肢麻痺の方です。ニューラリンクの助けを借りて、コンピューターとのやり取りやシビライゼーション、マリオカートなどのゲームをプレイすることができ、さらにはストリーミング配信も可能かもしれません。
以前の動画で、ウェブグリッドについて見てみました。これはニューラリンクの小さなゲームで、この最初の臨床試験参加者がプレイするものです。誰でもプレイできるので、「ゲームを開始」をクリックしてプレイできます。基本的に、物事をクリックする速さを追跡します。つまり、どれくらい正確に、どれくらい素早くクリックできるかということです。彼は9.51 BPS(1秒あたりのビット数)というスコアを達成しました。参考までに、私のスコアは13.41 BPS/秒でした。ただし、私は巨大な湾曲モニターとNaga Razerマウスを使用しており、過去にファーストパーソン・シューターゲームをプレイしたことがあります。
15歳の子供がこれらのゲームをプレイしていれば、おそらくもっと高いスコアを出すでしょう。しかし、参考までに言えば、これはおそらく成人のクリッカーのトップ10~20%近くのスコアだと思います。自分でも試してみたい方のためにリンクを残しておきますので、スコアをコメント欄に投稿してください。彼のスコアは9.51でした。つまり、私は手を使えない人、コンピューターとの全く新しい対話方法を学ばなければならなかった人、基本的に脳の力を使って狙いを定めてクリックするテレパシーのようなものを使う人よりも、おそらく40%ほど速く、より正確だということです。
理解しておくべき重要なことは、彼が目を使って物体を見ているわけではないということです。それがコントロールの方法ではありません。まったく新しい別のものです。彼はそれをスター・ウォーズのフォースのようなものだと表現しています。考えるとカーソルが動くのです。これは一種の小さなニューラルネットワークAIモデルで、一種のトレーニングを受けています。異なるタイプのものがあり、脳波を拾ってマウスを動かします。つまり、コンピューターと対話する全く新しい方法なのです。
この人は大人として、過去1年余りの間にこれを学び、おそらく手とマウスを使う人間の人口の相当な割合を上回っています。すべてを考慮すると、彼は信じられないほどよくやっています。モデルが改善され、正しいものをクリックするための脳波の追跡が向上し、研究者たちが彼と協力してモデルを改善し続け、彼自身がより上達し、ハードウェアが向上するにつれて、これにはハードウェアの制限があるかもしれませんが、近い将来、これまでのものよりもはるかに優れた効率的なコンピューターとのやり取りができる脳コンピューターインターフェースが登場すると考えられます。キーボード、マウス、タッチパッド、音声インターフェースなど、すべてが非常にすぐに遅く、時代遅れに感じられるでしょう。
イーロン・マスクがこれがどこに向かっていくと考えているかについて聞いてみましょう。それを聞くのは魅力的ですが、同時に、この種の技術が人型ロボット、例えばテスラのオプティマスにとって何を意味するのかも考えなければなりません。これら2つの技術を組み合わせたらどうなるでしょうか。人型ロボットと、頭蓋骨の中で浮かぶタンパク質と脂肪の大きな塊である脳と、このロボットのようなコンピューターとの間で非常に高速にデータを転送できる脳チップがあるとしたら、それは何を意味するのでしょうか。考えると少し頭がクラクラします。イーロン・マスクがこれがどこに向かっていくのか説明してくれるでしょう。
彼だけがこの方向に進んでいるわけではありません。NVIDIAのシニアAI研究者であるジム・ファン博士はこう言っています。「現在、最も興奮するロボット開発のトップ3は、1つはNVIDIAのプロジェクト・グルートと、基本的にNVIDIAが調理しているすべてのものです。フィギュア・オーツーがどれほどうまく機能するか、非常に興味があります。フィギュア・オーツーのリリースを8月6日に見ることになるでしょう。フィギュア1(左)とフィギュア2(新しく改良されたバージョン)の違いに注目してください。指と手のひら、手が違います。これらのロボットにどれくらいのリソースとエンジニアリング力、そして単なる努力が注ぎ込まれているか考えてみてください。手を正しく作るのに何パーセントかかると思いますか?体の残りの部分、バッテリー、電力、ビジョン、いわゆる脳、ニューラルネットワークなどと比べて、何パーセントでしょうか?そのようなものを開発するのに、手だけを正しく作るのにどれくらいの割合がかかると思いますか?5%?10%?20%?答えは驚くかもしれません。
ジム・ファン博士のプロジェクト・グルートでは、このパターンの続きが見え始めています。彼らはApple Vision Proを使用して、基本的にロボットを制御し、様々なデータを生成しています。これは時々テレオペレーションと呼ばれます。ジム・ファン博士はここで「テレオペレーションは遅く時間がかかりますが、少量のデータを収集する余裕はありません」と言っています。これはロボットのトレーニングデータを収集し、能力を向上させるための方法です。このビデオでは、イーロン・マスクがこのアプローチについてどう考えているか、そしてテスラ・オプティマスでこの状況にどのようにアプローチしているか、あるいは同じか異なるかについて見ていきます。
NVIDIAはRooCas
aやMimicGenなど、これらのプロジェクトの一部をオープンソース化しています。MimicGenはロボットアームのためのものですが、人型ロボットと5本指の手のための別のバージョンも出る予定です。このように、機械と人間の間の一種の重なりがより近づいてきているのです。脳コンピューターインターフェース、Apple Vision Proのような一種のVRビジョンは、ロボットの目を通して見ることを可能にし、それをコントロールしたり、特定のことをどのように行うかを訓練するのを助けたり、トレーニングのためのデータを収集したりするのに役立ちます。これはますます一般的になっていくでしょう。
今年の初め、ブラッド・アトックとフィギュア・ロボット社は、サンフランシスコとその周辺地域でロボットのトレーニングを手伝う人々を雇っていました。PhD AIの研究者ではなく、手先が器用で何かしらのデキシリティを持っている人々のことです。もし聞いている皆さんの中で、AIやロボット工学の分野に入りたいと思っている人がいれば、そしてちなみにこの2つの分野は本当に大きな重なりを見せ始めています、このようなことをするのは素晴らしい足がかりになるかもしれません。フィギュア社、NVIDIA、その他のロボットスタートアップ、これから出てくるであろう会社でも同じです。比較的新しい分野なので、20年の経験を主張できる人はほとんどいないでしょう。バーチャルリアリティヘッドセットを通じてロボットを制御する経験なんて、おそらくそれほど多くはないでしょう。
同時に、ブラッド・アトックが言うように、最近になってようやく、何十億もの知的な人型ロボットを大規模に展開する機会の窓が開きました。これは5年前には実現不可能でした。私たちは2024年、歴史上初めてこれが可能になった年に幸運にも生きています。人生はまるでSF映画のようになりつつあります。ロボットは労働に対する私たちの見方を根本的に変えます。
どの国の経済力にも、労働者が必要です。人々が働いて何かをする必要があるのです。電子レンジを設置したり、カスタムキッチンを配達したり、冷蔵庫を動かしたり、カラーテレビを動かしたりする人が必要です。ギターをMTVで弾くだけの人ばかりではいけません。知りませんでしたが、Dire Straitsの「Money for Nothing」という曲の主唱者は、ニューヨークのある電機店にいて、そこにはテレビや冷蔵庫があり、MTVでギターを弾いている人のミュージックビデオが流れていたそうです。その店で働いている配達員の一人、ごつごつした感じのニューヨーカーが、そのような生活ができる人たちについて文句を言っていたんです。その人は、自分のすぐ隣にそういう生活をしている人、つまりロックスターがいることを知らなかったんです。これらの歌詞は文字通り、その店員の愚痴なんです。ロックスターたちが何も仕事をしないのに、自分は冷蔵庫を設置したり動かしたりしなければならないと怒鳴っているんです。申し訳ありませんが、より攻撃的な部分は削除しました。
ADHDの瞬間でごめんなさい。でも、誰かが自分のことをあれこれ言っているのを聞いて、その店でまさにその人が言ったことをメモして、それをそのまま歌にして、おそらく何百万ドルもの利益を生み出したという事実が大好きなんです。そこには何か詩的なものがあると思いません?
他のニュースでは、AIはただのバズワードで、バブルで、もうすぐ弾けて、終わりで、嘘だと言っているメディアの報道がたくさんあります。これは素晴らしい表現だと思います。外部の人々はAIはすべてバズワードだと言っていますが、内部の人々は何をしているのでしょうか?投資の世界では、インサイダーが何をしているかを注意深く追跡することがよくあります。会社の内部にいて、潜在的にインサイダー情報を持っている人がいれば、もちろんそれをどのように取引できるかについては法律がありますが、多くの人々はインサイダーが何をしているかに注目します。その考え方は、彼らは外部の人々よりもおそらく多くのことを知っているだろうというものです。ヘッジファンドを運営し、特定の会社のCEOやCFOと会う人は、その会社がどこに向かっているかについて、その会社と30の他のトピックをカバーしているレポーターよりもはるかに多くのことを知っているでしょう。
インサイダーがしていることは、倍増していることです。新しく発表されたNVIDIAのBlackwellについては前の動画でカバーしましたが、ここに注目すべき行があります。「例えばGoogleは、40万以上のGB200チップを注文しました」とチップを扱う2人の人が言っています。これは100億ドルをはるかに超える価値があるかもしれません。そして彼らはいつ入手できるかさえわかりません。ちなみに、GoogleはTPU(テンソル処理ユニット)という独自のチップを持っています。そして今年はチップやその他の機器、不動産に約500億ドルを費やす予定で、これは昨年から50%以上増加しています。MetaもMicrosoftも同じことをしています。そして後で見るように、イーロン・マスクも同じことをしており、他にも本当に止まる気配がないことを示すものがたくさんあります。
ニューヨーク・タイムズは「シリコンバレーのハイプマシンを一時停止せよ」と言っています。AIを一時停止するのではなく、ハイプマシンを一時停止しろということです。そして、誰かが壁に頭からぶつかっている小さな絵があります。これが何を意味しているのかわかりませんが、プラトーに達したグラフと「ChatGPT」と書かれたカップがあります。著者は、AIが使い物にならないほど愚かで信頼できないかどうかはわからないと主張しています。彼女は、サム・アルトマンが魔法のように感じるものを公開すると約束したが、実際にはChatGPTをより安く、より速くするだけのルーティンアップデートだったという例を挙げています。これは事実ではありません。彼女が人々を欺こうとしているのか、情報不足なのかわかりませんが、これは正しくありません。
サム・アルトマンが言及していたのは、もちろん高度な音声モードのことで、いくつかのクリップを見たことがあれば、かなり驚くべきものです。私はその機知に富んだ行動に大笑いしました。赤ちゃんコンピューターは父親を何と呼ぶの?赤ちゃんコンピューターは父親に何と言うの?データを見て!古いChatGPTがしていたのは、私の音声をテキストに変換し、そのテキストをGPT-4に入力することでした。そうすると、翻訳の過程で多くのものが失われます。なぜなら、翻訳ソフトウェアはある意味で愚かで、GPT-4はテキストしか読めないので、私が言ったことのニュアンスのすべてを圧縮したようなものしか得られなかったからです。
これは多くの人が見逃している非常に重要なポイントだと思います。音声モードの前は、その下にあるのはただのテキストでした。答えをテキストで作成し、別のモデルがそのテキストを読み上げていたのです。あなたが何かを言うと、あなたの声をテキストに変換し、そのテキストを自分で読んで理解していました。ご存知のように、私たちのコミュニケーションの大部分は単なる言葉、つまりテキストで捕捉されるものだけではありません。声のトーン、抑揚、感情、そして私たちが言っていることの意味を変える可能性のある他の百万のものもあります。これらは、あなたが言ったことを単に書き起こすだけでは捉えられません。そしてもちろん、AIモデルがただテキストを読み上げるだけでは、コミュニケーションの潜在的な小さなニュアンスの多くが失われてしまいます。
新しいオムニモデルは、すべてを一緒にトレーニングしています。それは統合されています。オムニはGPT-4の「O」で、「O」はオムニ、つまりすべてを意味します。それはすべてが一つになっているのです。「ChatGPTをより安く、より速くするルーティンアップデート」をクリックすると、これはThe Vergeの記事で、「OpenAIがGPT-4.0をリリース、より速いモデルで、すべてのChatGPTユーザーに無料」となっています。これは完全にこれらすべての要点を見逃しています。
ちなみに、それ以来GPT-4.0ミニもリリースされました。これは大きな前進です。なぜなら、1年前、2年前には最先端のフロンティアモデルだったものの機能を、わずかなコストで手に入れることができるからです。それらははるかに効率的で、より安価で、エネルギー消費も少なくなっています。
ポイントは、外部からAIを報道している人々が「すべて偽物だ、すべてバズワードだ、何もできない」と言っている一方で、すべてのインサイダーはAIの開発を続けるために必要なリソースを獲得するために大金を投じているということです。誰が正しくて誰が間違っているのでしょうか?
Microsoft、Google、Meta、OpenAI、Tesla、Xi、その他の会社が、決して何にもならないAIのバズワードサイクルに賭けたために、今後5年から10年の間に破産すると思いますか?もし私が賭ける人間だったら、マスクとコープ、ジェンセン、ザッカーバーグ、デミス・ハサビス、サティア・ナデラに賭けるでしょう。彼らは愚かな人々には見えません。
それともAIは結局、ルンバのような中途半端な掃除ロボットのようになると思いますか?一人でいるときはそこそこの仕事をしますが、客を迎えるときには使えないようなものです。
ちなみに、Google DeepMindは最近、AIモデルを使って世界で最も権威ある数学コンペティションであるIMMOで銀メダル基準を達成しました。銀メダルを獲得したと言うのは少し控えめな表現かもしれません。なぜなら、あと1ポイント取れば金メダルだったからです。世界最高の数学コンペティションで最高賞を獲得するまであと1ポイントだったのです。
そしてもちろん、NVIDIAは彼らの研究を投稿しました。「Eureka」は、GPT-4を中心に構築されたシステムで、シミュレーションでトレーディングロボットの報酬プログラムを作成する際に使用されます。この場合、ペンを回転させるトリックを行わせるのですが、80%以上のタスクで専門家が手書きしたものよりも優れた性能を発揮します。これらは、この仕事を生業とする専門家の人々です。GPT-4は、いくつかの修正を加えることで、その80%を上回ります。
AIは世界クラスの人間が解く数学問題のトップ10~15%、ロボットのトレーニングコードを書く専門家レベルの人間の80%以上を上回っています。そして昨年までに、Google DeepMindは自律的に大量の新しい、これまで見たことのない材料を発見して再現することができました。この青い円は人間の実験です。これは私たちの能力を使って作ることができた量です。そしてここにはGome、つまりおそらくGnomeと言うべきでしょうか、約20倍の量があります。AIモデルはこれらの材料の潜在的なレシピを考え出し、そして防爆ケージに座っているこの小さなロボットが、それらを再現しようとしているのです。
ブロックポストが述べているように、「自律実験室は新しい結晶構造のレシピを作成し、成功裏に41以上の新しい材料を合成しました。これはAI駆動の材料合成に新しい可能性を開きました。」
ニューヨーク・タイムズの著者はこう続けています。「しかし、品質が重要な職場では、AIは大きな進展を見せないかもしれません。」彼女の大きな懸念の一つは、最も優秀な数学と科学の頭脳を持つ世代が、平凡なメール作成の段階的な改善に費やされることです。
あなたはどう思いますか?彼女が正しいと思いますか?それとも、この世代の最も優秀な数学と科学の頭脳が実際にAIになると思いますか?コメント欄で教えてください。
ここにイーロン・マスクがいます。私の名前はウェス・ロスです。視聴いただきありがとうございます。
「AIがテラビット/秒で通信でき、あなたがビット/秒で通信しているなら、それは木に話しかけるようなものだ」
これは非常に興味深い質問です。超知能種にとって、人間にはどんな用途があるのでしょうか。人間を意志や目的の源として考える議論はあると思います。
人間の心を本質的に、爬虫類でさえ持っている原始的な辺縁系の要素と、考えや計画を立てる大脳皮質の部分と考えるなら、大脳皮質は辺縁系よりもはるかに賢いのに、主に辺縁系のために奉仕しています。辺縁系を幸せにしようとしているのです。
人々が性行為をしようとすることに費やされた計算量は途方もないです。実際に生殖を求めているわけではなく、文字通りこの単純な動きをしようとしているだけです。そしてそれから快感を得るのです。
抽象的には、むしろばかげたこの単純な動き、つまりセックスに、大脳皮質は膨大な量の計算を費やして、それをどうやって行うかを理解しようとしています。おそらく人類の分散計算の90%は、セックスをしようとすることに費やされているでしょう。おそらく大きな割合がそうでしょうね。
ほとんどのセックスには快楽主義的な目的しかありません。つまり、単なる喜びやドーパミンの放出といったものです。時々は生殖ですが、現代の人間にとっては主にレクリエーションです。
そして、あなたの大脳皮質は辺縁系よりもはるかに賢いのに、辺縁系を幸せにしようとしています。なぜなら辺縁系はセックスをしたがるからです。あるいは美味しい食べ物を欲しがったりするからです。
そして、それがさらに第三のシステムによって増強されます。それはあなたの電話、ラップトップ、iPadなど、すべてのコンピューティングデバイスです。これがあなたの第三の計算層です。つまり、あなたはすでにサイボーグなのです。アプリケーションやコンピューティングデバイスの形で第三の計算層を持っています。
そして、セックスに関して言えば、デジタル計算の膨大な量もセックスをしようとしています。Tinderなどを使ってね。
人間が構築した計算能力も、セックスをしようとすることに参加しているんだ。デジタル計算のギガワットがセックスに費やされているんだよ。
もしAIが… これは今まさに起こっていることだけど、もし私たちがAIと融合したら、それは単に人間が使う計算能力を拡張するだけで、基本的には…
そうだね、それは確かに一つのことだ。でも、私が言いたいのは、人間に用途はあるのか?という根本的な問いがあるということだ。人生の意味は何か、なぜ何かをするのか、という根本的な問いがあるんだ。
もし私たちの単純な辺縁系が何かをしようとする意志の源を提供するなら、それが私たちの大脳皮質に伝わり、さらに第三の計算層に伝わるなら、良性のシナリオでは、AIは単に人間の辺縁系を幸せにしようとしているだけかもしれない。
あなたのニューロンがしていることは、概念を少数のシンボル、つまり私が話している音節やキーストロークに蒸留しているんだ。それがあなたの脳の計算の多くをしていることだ。
これは実際に健全なこと、あるいは役立つことだという議論があります。なぜなら、複雑な概念を圧縮しようとすると、おそらくそれらの概念の最も本質的なものを蒸留せざるを得なくなるからです。すべてのごちゃごちゃを除いて。圧縮のプロセスで、最も重要なことに物事を蒸留するのです。なぜなら、言えることは限られているからです。
そして、あなたはまた「勝つために遊ぶか、全く遊ばないか」と言いました。では、AIが勝つためには何が必要ですか?それは、最も強力なトレーニング計算能力を持ち、トレーニング計算能力の改善率が他の誰よりも速くなければならないということです。そうでなければ勝てません。あなたのAIは劣ったものになってしまいます。
では、Grockの、例えば3、来年、願わくは今年末には利用可能かもしれませんが、Grock 3がどうすれば世界で最高のLLM、最高のAIシステムになれるでしょうか?そのうちどれくらいが計算能力で、どれくらいがデータで、どれくらいがポストトレーニングで、どれくらいが製品としてパッケージングするかなどでしょうか?
それらはすべて重要です。それはF1レースで何が重要かを言うようなものです。車が重要か、ドライバーが重要か。両方とも重要です。もし車が速くないなら、例えば競争相手の半分の馬力しかないなら、最高のドライバーでも負けるでしょう。もし馬力が2倍あれば、おそらく平凡なドライバーでも勝つでしょう。
トレーニングコンピューターは、いわばエンジンのようなものです。エンジンの馬力のようなものです。だから、それを最高のものにしようと努力する必要があります。そして、そのトレーニングコンピューターをどれだけ効率的に使用するか、AIの推論をどれだけ効率的に行うかが重要です。明らかに、それは人材に関わってきます。
そして、どのようなユニークなデータへのアクセスを持っているかも役割を果たします。
Twitterのデータは役に立つと思いますか?
そうですね、主要なAI企業のほとんどがすでにTwitterのデータをすべてスクレイピングしていると思います。知っていると思います。だから、今後役立つのは、それがリアルタイムであるという事実です。なぜなら、彼らがリアルタイムでスクレイピングするのは難しいからです。だから、Grockには即時性の利点がすでにあります。
テスラと、最終的に数千万台の車から来るリアルタイムビデオで、オプティマスでは数億台、おそらく数十億台のオプティマスロボットが現実世界から膨大な量を学ぶことになるでしょう。それが最終的に最大のデータソースになると思います。オプティマスプロオプティマスが最大のデータソースになるでしょう。なぜなら、現実は現実のスケールにスケールするからです。
実際、人間がこれまでに蓄積できたデータがいかに少ないかを見るのは謙虚になります。本当に、人間が生成した使用可能なトークンは何兆個あるでしょうか?スパムや繰り返しを除外して、重複しないものは。それはそれほど大きな数字ではありません。すぐに尽きてしまいます。
オプティマスはどこにでも行けます。テスラの車は道路上にいなければなりませんが、オプティマスロボットはどこにでも行けます。道路外にも、オフロードにも行けます。オプティマスロボットはカップを拾い上げて、正しく拾えたかどうかを確認できます。カップに水を注ぐとか、水がカップに入ったか入らなかったか、水をこぼしたかこぼさなかったかなど。
そういった単純なことですが、それを10億倍のスケールで行うことができます。現実から有用なデータを生成するのです。因果関係のようなものです。
人型ロボットの大量生産に必要なものは何だと思いますか?
基本的に車と同じです。世界の車両生産能力は年間約1億台です。需要が年間約1億台程度なので、それ以上にはなっていません。そして、何らかの形で使用されている車両は約20億台あります。
これは理にかなっています。車の寿命は約20年なので、定常状態では年間1億台の車両を生産し、20億台の車両フリートを持つことができます。
人型ロボットの場合、その効用ははるかに大きいので、私の推測では年間10億台以上になるでしょう。
あなたがオプティマスの建設を始めるまで、それは非常に困難な問題だと考えられていました。
まだ非常に困難です。楽勝ではありません。現在のオプティマスは公園を歩くのに苦労するでしょう。公園を歩くことはできますが、公園はそれほど難しくありません。しかし、広範囲の地形を歩けるようになるでしょう。
そして物を拾うこともできます。
はい、すでにそれができます。でも、あらゆる種類の物を。
見知らぬ物を。カップに水を注ぐのは簡単ではありません。容器について何も知らないなら、あらゆる種類の容器がありえます。
手だけでも膨大な量のエンジニアリングが必要になるでしょう。
手は、おそらくオプティマスの電気機械的な観点からのエンジニアリングの約半分を占めるかもしれません。しかし、知能のほとんどは…
人間の知能の多くは、手で何をするかに向けられています。
世界の操作、物体の操作、そして世界の物体の知的で安全な操作です。
そうですね。手がどのように機能するかを本当に考え始めると…私はいつもそうしていますが。
感覚運動小人(センサリーモーターホムンクルス)では、私たちは巨大な手を持っています。
そうですね。あなたの手の筋肉、アクチュエーターはほとんどが前腕にあります。前腕には実際に手を制御する筋肉があります。手自体にはいくつかの小さな筋肉がありますが、手は実際には骨格の肉人形のようなものです。
そして、指を動かす筋肉は前腕にあり、手根管を通っています。手根管は小さな骨の集まりで、その中を通るトンネルにこれらのケーブル、腱が通っています。これらの腱が主に手を動かしています。
そして、それらの腱のようなものをオプティマスに再設計する必要があります。すべてのことを行うためには。
現在のオプティマスでは、アクチュエーターを手自体に入れようとしましたが、結果的に巨大な手になってしまいました。
巨大な手は奇妙に見えます。
そして、実際には十分な自由度や力を持っていません。だから、アクチュエーターを前腕に置く必要があることに気づきます。そして、人間と同じように、狭いトンネルを通ってケーブルを通し、指を操作する必要があります。
ニューラリンクは、あなたの見解では、現在のAIの安全性に対する最良のアプローチだと思いますか?
それはAIの安全性に役立つかもしれないアイデアです。確かに、それが万能薬だとか確実なものだとは主張したくありません。しかし、何年も前に私は、人間の集合意志と人工知能の整合性を妨げるものは何かと考えていました。人間の低いデータレート、特に私たちの遅い出力レートは、必然的に、コミュニケーションが非常に遅いため、人間とコンピューターの間のリンクを弱めるでしょう。
あなたが木であればあるほど、木がどんなものかわからなくなります。例えば、木を見て、この植物を幸せにしたいと思っても、それはあまり多くを語っていません。だから、人間が取り込んで出力できるデータレートを増やせば増やすほど、AGIに満ちた世界で人間の集合意志をAIとより良く整合させる可能性が高くなります。
特に出力レートが劇的に増加すれば、人間の集合意志をAIとより良く整合させることができます。
「勝つために遊ぶか、全く遊ばないか」と言いましたね。AIが勝つためには、最も強力なトレーニング計算能力を持ち、トレーニング計算能力の改善率が他の誰よりも速くなければなりません。そうでなければ勝てません。あなたのAIは劣ったものになってしまいます。
では、Grock、例えば3、来年、願わくは今年末には利用可能かもしれませんが、Grock 3がどうすれば世界で最高のLLM、最高のAIシステムになれるでしょうか?そのうちどれくらいが計算能力で、どれくらいがデータで、どれくらいがポストトレーニングで、どれくらいが製品としてパッケージングするかなどでしょうか?
それらはすべて重要です。それはF1レースで何が重要かを言うようなものです。車が重要か、ドライバーが重要か。両方とも重要です。もし車が速くないなら、例えば競争相手の半分の馬力しかないなら、最高のドライバーでも負けるでしょう。もし馬力が2倍あれば、おそらく平凡なドライバーでも勝つでしょう。
トレーニングコンピューターは、いわばエンジンのようなものです。エンジンの馬力のようなものです。だから、それを最高のものにしようと努力する必要があります。そして、そのトレーニングコンピューターをどれだけ効率的に使用するか、AIの推論をどれだけ効率的に行うかが重要です。明らかに、それは人材に関わってきます。
そして、どのようなユニークなデータへのアクセスを持っているかも役割を果たします。
コメント