NVIDIA CEOの衝撃的な予測:『AGIロボット』

6,720 文字

NVIDIA CEO's Shocking Prediction: "AGI ROBOTS"
NVIDIA's CEO Jensen Huang breaks down his vision for the future including AGI, robots, the AI workforce and more!Build a...

世界を驚かせているのは、私たちが人工汎用知能に近づいているだけでなく、人工汎用ロボティクスにも近づいているということです。これは、NvidiaのCEOであるジェンセン・ホアンが、このポッドキャストのインタビューで語った内容です。ジェンセンは、人工汎用知能、ロボティクス、そしてAIが科学と工学にどのような影響を与えるかについて、驚くべき予測を示しています。
最初のパートでは、彼はAIとロボティクスについて語ります。非常に近い将来、私たちは社会のあらゆる場面で人型ロボットやその他のタイプのロボットを目にすることになるでしょう。私はちょうどCESから戻ってきたばかりですが、彼の基調講演でも同じことを言っていました。2025年は人型ロボットの年になると彼は考えています。
トークンはトークンです。つまり、問題はそれをトークン化できるかということです。私たちはそれをピクル化することができます。皆さんご存知の通り、物事をトークン化するのは簡単ではありません。しかし、もし物事をトークン化し、大規模言語モデルや他のモダリティと整合させることができれば…私がジェンセンがコーヒーカップに手を伸ばす動画を生成できるなら、なぜロボットにプロンプトを与えてトークンを生成し、それを拾い上げることができないのでしょうか。直感的に考えると、コンピュータにとってその問題設定は非常に似ているように思えます。そして、私たちはそれほど近づいているのです。これは信じられないほど興奮する話です。
実は私は「トークン化できるなら」というフレーズを今まで聞いたことがありませんでした。これは非常に興味深い考え方です。過去50年間のコンピュテーションと同じような感じです。もし何かを1と0で表現できれば、コンピュータを使ってそれをシミュレーションすることができます。これは非常に似ています。彼が示したような動きやテキストなど、何かをトークン化できれば、人工知能を使って次に何が来るかを予測することができます。だから、「トークン化できますか?」という言葉をこれからよく耳にすることになるでしょう。
ブラウンフィールドのロボットシステム2つ…ブラウンフィールドとは、環境を変更する必要がないということです。これは非常に興味深い点です。CESの前までは聞いたことのない用語でした。ブラウンフィールドとは環境を変更する必要がないということです。これが人型ロボットがそれほど大きな可能性を持っている理由です。人間のように作られているため、人間が活動する環境で操作することができます。世界全体が人間と自動車のために作られているのです。
つまり、ロボットが人型や車の形をしていれば、既存のインフラで簡単に機能し、それ以上のものはあまり必要ないということです。これは重要な区別だと思います。しばらくの間、ロボットはあらゆる形やサイズで登場するという予測が多くありましたが、そうなるかもしれません。しかし、ロボットの主要な形態は人型になりそうです。なぜなら、すべてが人間のために作られているからです。
Nvidia のイベントで実際に私が触れることができた Figure ロボット、もちろん Boston Dynamics、そして Tesla の Optimus ロボットなど、多くの人型ロボットが登場しています。
自動運転車とデジタルツインと実体を持つロボットの間で、車と人型ロボットを使えば、世界を変えることなくロボティクスを世界中に導入することができます。なぜなら、私たちはこの2つのために世界を作り上げてきたからです。
そこで彼は私が言ったことと全く同じことを言い、CESの基調講演でも同じことを言いました。世界は車と人間のために作られており、そのためにロボットと実体を持つAIをそれらの2つの形で構築すれば、それが最も簡単にロボットを世界中に導入する方法となるでしょう。
おそらくイーロンがこの2つの形態のロボティクスに焦点を当てているのは偶然ではありません。より大きな潜在的なスケールを持つ可能性が高いからです。これは興奮する話ですが、デジタル版も同様に興奮する話です。私たちはデジタルやAI従業員について話しています。
次のセクションでは、彼はAIが雇用と労働力に与える影響について話します。これは実際に私が最近よく話してきたことです。AIが労働力に加わることから、資本と労働の両方に対する将来の影響まで、私が本当に興味を持っており、今年はもっと多く話すことになるトピックです。
この動画でパートナーシップを組んでくれたEmergence AIに感謝します。このチャンネルを少しでも見ていれば、私がエージェント、特に実世界のタスクを達成できるエージェントに強気であることをご存知でしょう。だからこそ、Emergence AIについてお話しできることを嬉しく思います。
Emergence AIは彼らのエンタープライズグレードのマルチエージェントオーケストレーターを立ち上げたばかりで、これらのエージェントが実際にあなたに代わってウェブを閲覧できる実世界のユースケースの最初のデモを披露しました。これは拡張されたウェブ自動化です。つまり、複数のエージェントがこのインテリジェントなオーケストレーションの下で、ウェブ上のさまざまな要素と動的に対話し、人間のような対話とナビゲーションをマシンレベルのスケールで実現できるということです。
本当に素晴らしいのは、これらのエージェントが実際に、これまでは人間を必要とした複雑で高度なウェブ対話を実行できるということです。動的に読み込まれるメニューをナビゲートし、フォームに記入し、設定を調整し、埋め込みファイルを処理し、PDFやHTMLから関連データを抽出することができます。
Emergence AIのオーケストレーターは、設計時の柔軟性と実行時の決定論的な性質を組み合わせて提供します。これは基本的に、これらのエージェントが自己修復できることを意味します。途中で間違いを犯しても、それを理解し、次の試行で成功することができます。
Emergence AIはプライバシーとセキュリティに大きな重点を置いています。APIを通じてアクセスできる完全ホスト型のソリューションを提供するか、あるいは独自の仮想プライベートクラウドでホストすることができます。
もしあなたがエンタープライズビジネスで、多くのプロセスを自動化したいと考えているなら、Emergence AIは素晴らしいソリューションです。彼らのエージェントAPIを統合し、複数のエージェントをシームレスにオーケストレーションして、あなたとあなたのビジネスのためにタスクを達成することができます。これには、最新のものも従来型のものも含めたエンタープライズアプリケーションとの対話が含まれます。
Emergence AIは開発者向けにプラットフォームの試用招待を開始したばかりです。ぜひチェックしてみてください。私からの紹介だと伝えてください。彼らのウェブサイトemergence.aiにアクセスするか、単純にcontact@em.aiにメールを送ってください。すべてのリンクは説明欄に記載しておきます。
再度Emergence AIにこの動画でのパートナーシップに感謝します。では動画に戻りましょう。
AIの従業員があらゆる種類で存在することは間違いありません。私たちの見通しでは、生物学的なものと人工知能の両方があり、同じ方法でプロンプトを与えることになるでしょう。その通りです。ほとんどの場合、私は従業員にプロンプトを与え、コンテキストを提供し、ミッションを実行するよう依頼します。彼らは他のチームメンバーを募集し、戻ってきて、私たちは行ったり来たりしています。
デジタルやあらゆる種類のAI従業員とどう違うのでしょうか。AIマーケティング担当者、AIデザイナー、AIサプライチェーン担当者、AIなど、様々な従業員を持つことになります。そして私はNvidiaがいつか生物学的にも大きくなり、人工知能の観点からもはるかに大きくなることを期待しています。
私はちょうどマーク・ザッカーバーグが中級エンジニアとしてメタに多くのAIが加わることについて話すのを取り上げたばかりですが、もちろんこれは非常に興味深く、避けられないように思えます。2025年はエージェントが労働力に加わる年になるでしょう。
彼は自身の人間の従業員へのコンテキストとプロンプトについて話しており、エージェントとAIが労働力に加わる場合も同じことです。プロンプトを与える必要があり、彼らはあなたのビジネス、目標、制限、リソースを理解する必要があります。
私が見る一つの問題は、オンボーディングです。どのようにエージェントをオンボーディングするのでしょうか。新しいエージェントを導入するたびに、ビジネスのすべてのコンテキストを手動で提供する必要はありません。なぜなら、チームに数千、あるいは数百万のエージェントを導入することになるからです。
そのため、オンボーディングを自動化する方法があります。それは、内部資料やオンボーディングドキュメントへのアクセスを与えることです。ちなみに、これはすべて人間の従業員に対して行うことと同じです。新しい人がチームに加わると、ビジネスのすべてのコンテキストを学び、目標を学び、働き方を学び、使用するツールを学ぶというランプアップ期間があります。
これはAIでも全く同じことが必要ですが、AIの場合はすべてがコードで定義できるという点が興味深いです。すべてを1つのドキュメントで与えれば、人間の従業員の標準である数日、数週間、数ヶ月ではなく、数分でオンボーディングを完了できます。
次のセクションでは、彼はAIが科学と工学に与える影響について話します。これは私がかなり話してきた別のトピックです。人工超知能に到達するための最後のボトルネックについて考えるとき、それは人工知能が自身の研究を行い、自己改善する能力です。
フロンティア数学、フロンティア科学、新しい数学や科学の発明または発見(どちらの言い方でも)、そしてそれを自身に適用し、その時点で再帰的になり、質と知能が指数関数的に成長します。これはレオポルド・アッシェンブレナーが状況認識に関する論文で「知能爆発」と呼んだものです。
まず第一に、誤解されているか、私自身も誤解していたかもしれないのは、AIと機械学習によって影響を受けている革新的な科学、コンピュータサイエンス、科学、工学の水面下の活動、表面下の活動の過小評価です。
今日私たちが話している種類の仕事が明日を変革するであろう理論数学部門のどこにも、科学部門のどこにも入れないと思います。世界中のすべてのエンジニア、すべての科学者を取り上げて、もし彼らの今日の働き方が未来の早期の兆候であるとすれば(それは明らかにそうですが)、AIへの大きな変化の波、AIの波、機械学習の波が、私たちが行うすべてのことを短期間で変えていくのを目にすることになるでしょう。
私はコンピュータビジョンの初期の兆候と、トロントのアレックスとイラン、ヒントン、そしてもちろんスタンフォードのヤン・ルンやアンドリュー・アンとの仕事の初期の兆候を目にしました。私たちは幸運にも、猫を検出するという観察されたものから、コンピュータサイエンスにおける深遠な変化へと推測することができました。
ジェンセンがこの新しい生成AIの波に対して持っていた先見性は少し狂っています。これは何年も前のことで、アレックスとイランの仕事について話しているとき、それはアレックスネットでした。猫の検出という単純な画像検出について話しているとき、現在では単純に見えますが、当時は最先端でした。しかし彼は、それを可能にしていたのは基本的に行列の乗算であり、その推測が正しかったことを理解できました。ビデオゲームはどのように動作するのでしょうか?基本的に同じタイプの数学的関数の多くを使用しています。そのため、Nvidiaがビデオゲームのために構築していたGPUと同じものが人工知能も動かすことができたのです。
彼は2010年か2012年頃、アレックスネットが最初にリリースされた時からそのすべてを推測し、基本的に「私たちは準備する必要がある」と考えました。そして実際に離陸するまでには約10年かかりましたが、彼は自社全体を人工知能の周りに位置づけました。なんという先見性でしょう。明らかに彼の会社の時価総額は別として、ジェンセンは十分な評価を受けていないと思います。しかし、それは信じられないほどの予測でした。予測だけでなく、自社全体をその周りに整列させることができたという点で、おそらく史上最高の経営者の一人でしょう。
動画を続けましょう。その推測は私たちにとって幸運でした。そして今、私たちはそれにとても興奮し、インスパイアされたので、やり方のすべてを変えました。しかし、それにはどのくらいの時間がかかったでしょうか。今日の基準では玩具と考えられるであろうアレックスネットを観察してから、物体認識において超人的なレベルの能力に到達するまで、文字通り6年かかりました。
それは数年でしたが、今まさに起きていることは、科学のすべての分野における地殻変動です。取り残される科学分野は一つもありません。非常に明確にしておくと、量子コンピューティングから量子化学まで、私たちが話しているアプローチに関与していない科学分野はありません。もし私たちが自分たちに、そして彼らは2、3年前からそこにいますが、さらに2、3年の時間を与えれば、世界は変わるでしょう。
生成AIが基礎にならない科学的なブレークスルーや工学的なブレークスルーは一つも存在しないでしょう。私は今やそれを確信しています。時々、これがトレンドなのかどうかについての質問を耳にしますが、第一原理に立ち返って、実際に何が起きているのかを観察する必要があります。コンピューティングスタック、コンピューティングの方法が変わりました。ソフトウェアの書き方が変わったということです。
それはとても素晴らしいことです。ソフトウェアは人間が知識を符号化する方法です。非常に素晴らしい発言です。コンピューティングスタック全体が変わりました。明らかに私たちはまだその移行期間にいますが、すべてがハードコードされている従来のソフトウェアや、事前に定義されたゲームエンジンを持つビデオゲームなど、すべてが今まさに変化しています。すべてが生成的で予測的になるのです。
それを考えるのは本当に素晴らしいことです。私はソフトウェアの終わりについての動画を作り、おそらく将来的には同じレベルのソフトウェアエンジニアは存在しなくなるかもしれないと本当に信じています。なぜなら、短期から中期的には、すべてがAIによるコード作成に移行し、最終的にはすべてが動的に予測されるだけになるからです。
一例として、ゲーム「Doom」のAIデモがあります。そこではゲームの各フレームがゲームエンジンで事前に定義されるのではなく、その瞬間に生成されていました。私はすべてのソフトウェアがそうなる可能性があると考えています。本当に必要なのはそれとデータベースだけです。つまり、従来のデータベースに基本的な真実があり、データベースの上にあるものはすべてその瞬間に生成または予測されるだけです。考えると非常に素晴らしい未来です。
私たちのアルゴリズムは、今では非常に異なる方法で符号化されています。それはすべてに影響を与えることになり、他の何も同じようにはならないでしょう。私はここで考えが一致している人々に話していると思います。私たちは同じものを見ており、あなたがたが働いているすべてのスタートアップ、私が働いている科学者やエンジニアたち、誰も取り残されることはありません。私たちは全員を一緒に連れて行くのです。
これが彼の考えです。これはほんの数週間前のことですが、依然として非常に関連性の高い内容です。数週間で古くなると考えるのは狂っていますが、これは決して古くはありません。これは非常に関連性のある内容です。NvidiaのCEOであるジェンセンによる非常に興味深い指摘でした。
この動画を楽しんでいただけたなら、ぜひいいねとチャンネル登録をお願いします。次回の動画でお会いしましょう。

コメント

タイトルとURLをコピーしました