
5,381 文字
私は今日、このAI革命の最も微妙でありながらも浸透している側面について話したいと思います。AIは時間を圧縮します。そして私たちはそれを実際に体験しているのです。常に追いつこうとしている感覚を持ちながら生きているこの瞬間を私たちは経験しています。私が受け取るDMやメールの多くは、「ネイト、どうやったらついていけるか教えてくれ」というものです。
ニュースは火曜日に出て、水曜日にも出て、水曜日の夜にもまた出る。すべてについていくことができない。プロンプトも進化し続けなければならない。今度はエージェントも取り入れなければならない。そのリストは延々と続きます。私たちは超圧縮された時間の中で生きているような感覚を持っています。しかし今日お話ししたいのは、私たちの時間体験ではありません。
それはAIの時間体験です。なぜなら、それは私たちがより理解する必要があるものだと思うからです。私たちは人類が常に経験してきたように時間を経験します。私たちは驚くほど非合理的な時間認識を持っています。年を取るほど、大人になってからの年月は子供の頃よりも短く感じるという考えをよく理解するようになります。
ですから、私たちの時間感覚は奇妙で、私たちの種に結びついています。これについてはいくらでも話せますが、詳しくは読んでみてください。AIにはそのようなものはありません。AIは論理的な時計駆動型の時間認識を持っています。そしてコンピューティングの進歩により、時間内にできることのAIの能力は加速し続けています。したがって、AIにとっても時間は圧縮されていますが、それは同じようには感じられません。
それは単位時間内でできる作業を圧縮しているのであり、作業にかかる時間を圧縮しているわけではありません。もう一度言います。人間にとっては、やるべき仕事がとても多いため、時間が短くなっているように感じます。AIにとっては、より多くのコンピューティングがあるため作業が圧縮され、時間は拡大していると感じます。
AIの内部的な時間認識について話すつもりはありません。それは哲学者に任せますが、単位時間内で何ができるかについて、私たちとは非常に異なる理解を持っていることは明らかであり、それは現実世界での影響をもたらします。例えば、AIエージェントが時間をかけて意図を維持するという考えについては、まだあまり進んでいません。
これは非常に難しいことです。現在の予測では、2026年までにAIエージェントがタスクに1週間かけられるようになるかもしれないとされています。これは大きなことです。言っておきますが、私の職場の人々はタスクに何ヶ月もかけています。私たちは1年間の戦略的な整合性を維持する必要があります。数年先を見据える必要があります。
より大きな時間感覚を持つ必要があるのです。そして、タスクを実行するとき、より長い期間にわたって重要なコンテキストを保持する必要もあります。私たちはみな経験したことがあります。頭から情報が抜け落ちることはあります。コンテキストを忘れることもあります。私たちは忘れっぽいのです。したがって、AIも忘れるからといって厳しく判断しないことが重要です。
しかし重要なのは、一般的に言えば、人間は現時点でAIエージェントよりも時間をかけて意図を維持することが得意だということです。そして重要なことに、AIの知能スケーリングは時間をかけた意図のスケーリングよりも速く進んでいます。だから知能はこのように上昇しているのです。私たちはいつもそのことを話しています。垂直に上がっています。素晴らしい。しかし、時間をかけた意図をスケールする能力はこのように動いています。あまり速くは動いていません。
そのゆっくりとした進歩が非常に意味を持つ唯一の理由は、コンピューティングの進歩と知能の進歩により、AIがその時間でより多くのことを行えるようになり続けているからです。NVIDIAで働くジム・ファンがSequoiaで行った講演から見つけた小さなケーススタディを紹介したいと思います。ジムはNVIDIAでロボティクスを担当しており、彼が「物理的チューリングテスト」と呼ぶものを提案しています。
チューリングテストをご存知なら、その考え方は人間とロボットのどちらと話しているかわからないというものです。私は大幅に単純化していますが、基本的に今はそれに合格するAIを持っています。文字通り古典的なチューリングテストを実行すれば、それは合格します。そして私たちはほとんどそれに気づいていません。これはとても面白いことです。なぜなら、すべてのSF小説はロボットがチューリングテストに合格したとき、世界全体が変わると考えていたからです。
私たちはAI革命の中で生きていて、それは変化しているとは言えるでしょう。でもまだ空飛ぶ車はないし、宇宙の城の窓から外を見ることもできません。とはいえ、物理的チューリングテストははるかに高いハードルであり、私たちはそれに合格するには程遠い状況です。そしてSF小説のほとんどの作品では、会話型チューリングテストと物理的チューリングテストが組み合わされていると思います。
そしてそれが、60年代、70年代、80年代の作家たちが想像した未来と私たちが実際に持っているものとの間の断絶の一部です。なぜなら、物理的チューリングテストでは、ロボットが人間のように物理的空間を移動できる必要があるからです。ジムに敬意を表しますが、彼がそれをまとめ始めるまで、それを表現する言葉は本当になかったのです。
彼はハッカソンにいて、翌朝の掃除をしている場面について話します。部屋は完全に散らかっていて、リビングルームは大惨事です。ピザの箱がここにあり、ビール缶があそこにあり、バルマーカーブに乗っていて、ソファのクッションは散らかっていて、ビデオゲームをしていたのでそれも起動したままです。すべてがめちゃくちゃです。
彼が私たちに想像してほしいのは、あなたが仕事に出かけて、夕方5時に戻ってくると、すべてが元通りになっている世界です。部屋はきれいで、ランプは立っています。それがロボットがやったのか人間がやったのか区別がつかない。なぜなら、あなたはロボットがそのような複雑な物理的作業を問題なく行える世界に住んでいるからです。
最近のロボットの映像を見たことがあるなら、私たちがそこに近づいていないことはわかるでしょう。ロボットがビール缶に近づき、それを静かに拾い上げ、リサイクルに入れ、家全体を移動し、犬を避け、階段の下にあるテニスボールを避け、戻ってきてクッションを並べるなどの世界には程遠いのです。
そして部屋全体でそれを行い、完全に自律的に、指示なしでそれをきれいにする。今、知能は非常に、非常に、非常に、非常に速くスケールしていますが、そのような物理的空間にいる能力はそうではありません。それがジムの要点です。そしてここでAIと時間に戻ります。
ジムは、物理的チューリングテストの興味深い点の一つとして、NVIDIAが今年発表したような仮想環境を使用して、AIのための多くのトレーニング作業を実際の時間の少量に圧縮できることを示唆しています。彼はSequoiaとのEdとの会話で、NVIDIAでは通常の時間で10年分のトレーニングを2時間に圧縮することができたと話しています。特別なシミュレーション環境では10年が2時間になります。
なぜなら、シミュレーション環境では並列化でき、超高速で実行でき、チップとプロセッサがそれに追いつき、LLMも追いつき、トレーニングを実世界のように遅くする理由がなかったからです。そのため、10年のトレーニングタスクを2時間に圧縮することができました。
これは、コンピューティングのスケーリングを持つAIが短い時間枠で新しい種類の作業を可能にする方法について考えるとき、私の頭を回転させるようなことです。だから、私たちにとっては仕事は増えているが時間は変わらず、AIにとっては時間が拡大しているように見えるかもしれないという考えに戻ると、コンピューティングと能力が拡大し、時間が経過するにつれて単位時間内でより多くのことができるようになります。新しいBlackwellチップが与えられれば、H100よりもLLMとして1時間でより多くのことができます。
本当に物理的な話をしています。そのように考えると、エージェントを持っている場合、私はソフトウェアに戻っています。ロボット工学の話は置いておきます。別の機会にロボット工学の会話をしましょう。エージェントがあり、通常3ヶ月かかるタスクを職場でそのエージェントに依頼し、エージェントは非常に高品質な仕事をしますが、時間をかけて意図を維持する能力は短いとします。
時間をかけた意図はあまり重要ではないかもしれません。なぜならエージェントは必要なツールをすべて持ち、莫大なコンピューティングとスループットを持ち、非常に高速に動作するからです。そのため、あなたが3ヶ月かかることを4時間で完了させることができるかもしれません。仕事の終わりを意味するとは言いません。なぜなら私はポラニーのパラドックスを信じているからです。それは、仕事は私たちが話せる以上のものだということです。
仕事は効率的にトークン化できるとは思いません。タスクを説明する能力以上に仕事には多くのことがあります。それはすべて別にしておきます。興味があれば私のSubstackでそれについて読むことができます。かなり広範囲に書いています。しかし、適切な範囲、特定の問題範囲に関する適切な意思決定の自律性、適切なツールがあれば、エージェントが信じられないほど知的なインターンになる世界が見えると思います。
エージェントを管理し、難しいタスクを与えることができるようなものです。スコープを与え、ツールが正しいことを確認し、結果を検証する必要がありますが、短時間で信じられない量の仕事をこなします。それが真実かどうかはわかりません。おそらく現時点でそれに最も近い例はDevonでしょう。
Devonはエンジニアリングエージェントであり、実際にDevonはエンジニアリングインターンのように機能します。あなたがシニアエンジニアで、何をしているかを知っていて、コーナーからコードを書いて抜け出すことができるなら、Devonは素晴らしいです。P3やSE3を拾ってそれらをノックアウトしてくれる人が欲しいなら、Devonは素晴らしいです。特定の定義されたタスクに取り組み、それを追求する人が欲しいなら、Devonは素晴らしいです。
今日コーディングしたい特定の領域でいくつかの作業を分解し、その日の終わりにレビューできるプルリクエストを作成してくれる人が欲しいなら。創業エンジニアになってほしい人がいて、一部の人がDevonをそのように使おうとしていますが、それは悪い考えです。Devonはそのレベルの責任の準備ができていません。Devonはシステムアーキテクチャを決定したり定義したりすることはできません。
そのように過剰に使用する人々はフラストレーションを感じます。人々はまた、Devonが完璧ではないことにもある程度フラストレーションを感じます。Devonは時々焦点から外れることがあります。Devonはトークンを使い果たすためにタスクを完了できないことがあります。エージェントで発生すると思われる他の問題も出てきます。実際、私はDevonをエージェントとして、将来エージェントと協力することがどのようになるかの最初の近似的なプレビューだと考えています。
トークン切れの問題が発生すると思います。エージェントに十分に明確なタスクを与えたかという問題も出るでしょう。エージェントに責任を与えすぎたかという問題も出るでしょう。エージェントが取り組んでいたことをその知能に合わせてスコープ設定したかという問題も出るでしょう。
そして私たちは皆、エンジニアだけでなく、来年くらいにそれを解明する必要があるでしょう。しかし要点はこうです。再び時間の部分について考えると、コンピューティングが増え、これらのモデルがよりスマートになるほど、その時間でより多くのことができるようになります。だから、来年末までに時間をかけた意図がたった1週間であっても、スコープを正しく定義すれば、本当に意味のあるプロジェクトワークが完了するのに十分な時間かもしれません。
それは私にとってちょっと変な感じがします。なぜなら人間として、私はそのようには考えません。来年そんなにスマートになるからこの仕事すべてを完了できるとは思いません。もちろん、読書しようと思いますし、AIから学ぼうとします。私たちは皆スマートになろうとしますが、幻想は持っていません。
ここのCPUをアップグレードすることはできません。でも機械はできます。だから私が思う最も興味深くて話されていないことの一つは、知能の向上はエージェントが時間をかけて意図を使用する方法に関連しているということです。そしておそらくそれについてもっと話すべきでしょう。チップ。
コメント