
7,039 文字

テスラは自動運転車において大きくリードしていますが、いずれすべての車は自律走行能力を持つ必要があるでしょう。それはより安全で、より便利で、より楽しい運転を実現します。そのためには、現在では動画から直接学習することが、これらのモデルをトレーニングする最も効果的な方法であることがよく知られ、十分に理解されています。以前は、ラベル付けされた画像に基づいてトレーニングしていました。「これは車です」「これは標識です」「これは道路です」というように手作業でラベル付けしていました。
それは驚くべきことで、今では動画をそのまま車に入れて、車自身に理解させています。この技術は大規模言語モデルの技術と非常に似ていますが、膨大なトレーニング施設が必要です。その理由は、動画のデータレート、つまり動画のデータ量が非常に膨大だからです。自動運転車に使用されている動画から物理的世界を学習するアプローチは、基本的に大規模言語モデルを物理世界の理解に基づかせるのに使用されるのと同じAI技術です。
イーロンの完全自動運転ビジョンがどのように実現するかを知りたい方に、ジェンセン・フアンがすべての点をつなぎ合わせました。それは驚くべきことです。ここにジェンセン・フアンがいます。彼はNVIDIAのCEO兼創業者です。ジェンセン、参加してくれてありがとうございます。昨晩の基調講演でCESを開始し、ロボットから新しいゲーミングデバイスまで多くのことを発表されました。
お話されたことの一つが、「物理的AI」の時代に入っているということでした。NVIDIAの収益面では、それがいつ増加し始めるのでしょうか?自動運転車やロボティクスなど、いつ収益に反映されるのでしょうか?下にはキャンディを配るロボットもいますが。
ロボットをトレーニングするには多くのデータが必要です。私たち全員が関わる消費者向けロボットの最初のバージョンは自動運転車であり、私たちはしばらく前から自動運転車に取り組んでいます。その事業は今年、推定で50億ドルの収益を見込んでいます。これがどれほど重要かを示しています。その理由は、自動運転車を構築するためには、山のようなデータ、特に動画データをトレーニングする必要があるからです。
NVIDIAのデータセンター事業は私たちにとって非常に重要です。ロボティクスを構築するには、3つのコンピューターが必要です。トレーニングコンピューターであるDGX、Omniverseのシミュレーションコンピューター(NVIDIAはシミュレーション事業も手がけています)、そしてロボティクスコンピューターです。コンピューターグラフィックスはビデオゲームだけでなく、自動運転車のための仮想世界のシミュレーションにも使用できます。シミュレーションコンピューターは私たちにとって非常に大きなビジネスであり、3つ目はもちろんロボティクスコンピューターです。この3つのコンピューターすべてが私たちにとって大きなビジネスです。
現在の自動運転車ビジネスが既に50億ドル規模であるならば、年間1億台の新車と、年間1兆マイルの走行が実現したときにどれほど大きくなるか想像してみてください。これはおそらく世界最大のロボティクス産業の一つであり、世界最大のコンピューティング産業の一つになるでしょう。
これが車のための新しいThorチップです。これが新しいThorですね。これは新しいThorロボティクスプロセッサで、前のものより20倍強力です。トランスフォーマーエンジンとBlackwellアーキテクチャを搭載しています。これは自動運転車やロボット、あらゆる種類のものに組み込まれるでしょう。
発表されたもう一つのものが新しいスーパーチップ、GP10で、これはDigitsで動作しています。これは基本的にAIスーパーコンピューターのデスクトップ版ですね。このようなものと、Microsoft、Amazonなどのクラウドで独自のスーパーコンピューターを運用している顧客を見たとき、これらはどのように連携するのでしょうか?
私はこう考えています。クラウドにAIスーパーコンピューターがありますが、人々は個人的にAIスーパーコンピューターを持ちたいと思っています。パーソナルコンピューターがクラウドコンピューティングを補完するようなものです。コンピューター業界ではPCから始まってクラウドに移行しましたが、AIの場合はクラウドから始まって、PCやパーソナルコンピューターに移行しています。
開発者であれば、自分だけのパーソナルクラウドがほしいとき、Digitsのようなものを入手して、すべてを自分自身のために使うことができます。NVIDIAのソフトウェアがすべてそれで動作するのは本当に奇跡的です。このように小さなものでも動作します。AIでやりたいことは何でもそれでできますし、クラウドでもできます。どちらでも選べます。私たちは、お好みの方法でNVIDIA AIにアクセスできるようにしたいと思っています。
これらすべてはBlackwellに基づいており、昨晩のプレゼンテーションでBlackwellは完全に生産に入っていると言われました。顧客からのBlackwellに対する反応はどうでしょうか?
需要は信じられないほどです。世界中のすべてのデータセンターにBlackwellを導入しようと急いでいます。すべてのクラウドサービスプロバイダーはすでにGrace Blackwellシステムを設置し、液冷とNVLink72を使用しています。世界中に約45の工場があり、彼らに提供するために必要なシステムを構築しています。かなりエキサイティングになるでしょう。
BlacwellはいつHopperの収益シェアを超えるのでしょうか?まだHopperからの収益が入ってきていますが、Blackwellが引き継ぐと想像されます。その切り替えはいつ起こるのでしょうか?
おそらく今年の早い時期だと思います。できるだけ早くしたいですが、もちろんBlackwellはまだ割り当て段階にあり、生産を増やそうとしています。しかし、すぐに来るでしょう。
彼はNVIDIAの自動運転車事業が既に年間50億ドルを生み出していると言いました。それは将来の誇張ではなく、現在の事実です。そして彼は、これはほんの始まりに過ぎないことを明確にしました。毎年1億台以上の新車が製造されており、NVIDIAの目標はそれらの大部分をAIで動かすことです。
彼らの新しいThorチップは驚異的で、前のものより20倍強力です。ChatGPTの背後にある技術と同じ種類のテクノロジー、トランスフォーマーベースのAIモデルを実行するように設計されていますが、車の中に組み込まれています。それはリアルタイムの意思決定、動画データからの学習、世界への即時反応を意味します。これがイーロンのFSDの夢を可能にするものです。
そしてジェンセンはこう言いました。彼らのBlackwellチップは現在完全に生産に入っており、世界中のすべての主要なデータセンターがそれを望んでいます。Amazon、Microsoft、Google、45の工場が需要を満たすためにシステムを構築し続けています。彼がAIが物理的な世界に入ると言うとき、それはもはやSF映画ではありません。イーロンのFSDは私たちが思っているよりも近いかもしれません。なぜならNVIDIAはそれを動かすための脳を文字通り作っているからです。
ゲームは、AIが巨大なマネーメーカーとなった今でも、NVIDIAにとってどれほど重要なのでしょうか?
ゲームは非常に重要です。しかし、ゲーム産業はAIによって活性化されるでしょう。コンテンツ制作の部分は、AIによってコストが下がり、ゲームはAIによってより興味深くなり、AIによってより美しくなるでしょう。昨晩発表したDLSS4テクノロジーは全く驚くべきものです。AIとコンピューターグラフィックス、プログラマブルシェーダーをニューロシェーダーと呼ばれるものに融合させました。
AIをコンピューターグラフィックスにも導入したのです。ですから、ビデオゲーム産業はAIによって活性化されると思います。それは本当に素晴らしいことです。しかし、コンピューターグラフィックスは私たちが会社として行うほぼすべてのことに不可欠です。シミュレーションやデザインに使用しており、長い間私たちのビジネスの非常に重要な部分となるでしょう。
RTXの発表の一部として、RTXシステム上でAIを実行できるようになります。家にPCがあり、RTXシステムを持っていますが、AIモデルを実行するにはどのようなものになるのでしょうか?
これは文字通りBlackwellです。クラウドでスーパーコンピューティングに使用しているBlackwellアーキテクチャがここにあります。もちろん、ご希望であれば自分だけのAIを作成することもできます。ai.nvidia.comというクラウドがあり、そこに多くのAIモデルを置いています。
これらのAIモデルはすべてNIMと呼ばれるものにパッケージ化されています。それらはコンピューター、ビジョンモデル、言語モデル、アニメーションモデル、物理モデル、デジタル生物学モデルなどです。ソフトウェアエンジニア、開発者、クリエイティブアーティストとして何をしたいにせよ、それらのモデルをダウンロードして独自のAIを作成し、PCで実行することができます。
最後に、Broadcomなどの新しいカスタムチップについてはどうでしょうか?それはNVIDIAとどのように関連するのか、またはNVIDIAはBroadcomがGoogleやNVIDIAの他の顧客のために作るカスタムチップに対して、どこにアドバンテージを見出していますか?
基本的なトレンドは今や非常に明確です。一歩下がって考えると、誰もが加速コンピューティングが前進への道であると認識していることがわかります。過去に構築した1兆ドル相当のデータセンターでの汎用コンピューティング、それらのデータセンターは近代化されるでしょう。
最初の重要なポイントは、加速コンピューティングが明らかに前進への道であるということです。第二に、私たちは非常に異なることをしています。NVIDIAのアーキテクチャはオープンであり、かなり普及しています。その結果、あらゆるクラウド、あらゆる会社、自動運転車、ロボティクスにNVIDIAを導入できます。それは非常に多用途だからです。
私たちのアーキテクチャが文字通りあらゆる場所にあるという事実は、開発者にとって最高のアーキテクチャであり、革新するための最高のアーキテクチャであり、ロボティクスや自動運転車などの新しい産業を構築するための最高のアーキテクチャです。加速コンピューティングとAIの未来に非常にワクワクしています。
ジェンセンが次に言ったことは本当に驚きました。彼はAIが現在最大の収益を生み出しているにもかかわらず、ゲームがNVIDIAの中核であることを明確にしました。彼はゲームから離れているのではなく、AIがゲームを活性化すると言っています。考えてみてください。現在、ハイエンドのゲームを作るには数千万ドルかかりますが、AIによってコンテンツ制作のコストが急速に下がります。そして、ゲームはより良く見え、よりスマートになり、プレイヤーにリアルタイムで適応することさえできます。
ジェンセンはAIパワーのグラフィックスブーストであるDLSS4と、AIとリアルタイムグラフィックスを融合させる新技術「ニューロシェーダー」を紹介しました。それはもはや見た目の良さだけではなく、インテリジェントなものです。そしてここが驚くべき点です。スーパーコンピューターやデータセンターを動かしている同じBlackwellアーキテクチャが、今やRTX PCの中に入っているのです。
高性能のNVIDIAグラフィックスカードを持っていれば、強力なAIモデルを自宅で直接実行できます。彼はai.nvidia.comというクラウドプラットフォームも言及しました。そこでは、ビジョン、言語、アニメーション、さらにはデジタル生物学のための事前構築されたモデルを入手できます。チャットボットを構築する場合でも、学習するビデオゲームキャラクターを作る場合でも、すべてが手の届く範囲にあります。
次に質問がありました。GoogleがBroadcomからカスタムチップを使用していることについてはどうですか?ジェンセンは動じませんでした。彼は、加速コンピューティングが未来であり、汎用チップは時代遅れになりつつあると明確に述べました。そして、一部の企業が自社用のカスタムチップを作る一方で、NVIDIAのオープンアーキテクチャはすべての人々、すべてのデータセンター、すべてのクラウド、すべての車、すべてのロボットによって使用できると述べました。
ジェンセン、もう一つ最後の質問です。自動車事業とそこで見ていることについて話していただいて嬉しいです。自動車が現在データセンター内で最大の企業部門であると言及されました。テスラのビジネスについても言及されましたが、それはすべて何についてですか?他の自動車メーカーの自動運転についてですか?データセンター内で自動車メーカーが使用している他の機能はありますか?もう少し詳しく教えていただけますか?
テスラは自動運転車において大きくリードしていますが、いずれすべての車は自律走行能力を持つ必要があるでしょう。それはより安全で、より便利で、より楽しい運転を実現します。そのためには、現在では動画から直接学習することが、これらのモデルをトレーニングする最も効果的な方法であることがよく知られ、十分に理解されています。
以前は、ラベル付けされた画像に基づいてトレーニングしていました。「これは車です」「これは標識です」「これは道路です」というように手作業でラベル付けしていました。それは驚くべきことで、今では動画をそのまま車に入れて、車自身に理解させています。この技術は大規模言語モデルの技術と非常に似ていますが、膨大なトレーニング施設が必要です。その理由は、動画のデータレート、つまり動画のデータ量が非常に膨大だからです。
自動運転車に使用されている動画から物理的世界を学習するアプローチは、基本的に大規模言語モデルを物理世界の理解に基づかせるのに使用されるのと同じAI技術です。Soraのようなテクノロジーはただただ驚くべきもので、GoogleのVOなどの他のテクノロジーも素晴らしいです。意味のある動画を生成する能力、人間のプロンプトによって条件付けられた動画は、動画から学習する必要があります。
次世代のAIは物理的なAIに基づく必要があり、物理的な世界を理解する必要があります。これらのAIに物理的な世界がどのように振る舞うかを教える最良の方法は、動画を通じてです。ただ膨大な量の動画を見ることです。このマルチモダリティのトレーニング能力の組み合わせは、今後数年間に多くのコンピューティング需要を必要とするでしょう。
この部分は本当にすべてをつなぎ合わせます。ジェンセンは自動車がNVIDIAのデータセンター事業内で最大の企業部門であることを確認しました。それは大きなことです。10か月前でさえ、彼は大声で言っていました。車はAIの未来であり、テスラがそれをリードしています。
しかし、際立ったのはテスラを称賛しただけでなく、すべての車が自律走行能力を必要とすることを明確にしたことです。贅沢品としてではなく、より安全で、より簡単で、率直に言ってより楽しい運転を実現するからです。そして、これらの車をトレーニングする方法は急速に変化しています。
以前はエンジニアが数百万の画像に手作業でラベルを付け、AIに「これは車です」「これは一時停止の標識です」などと教えていました。それはスケーラブルではありません。現在では、AIモデルが言語を学習するのと同じように、車は生の動画から学習します。
ジェンセンは、この動画ベースのトレーニングが物理的な世界を理解するための鍵であり、それは大規模言語モデルが単独ではできないことだと言っています。ここで物事は現実的になります。OpenAIのSoraやGoogleのVideo Poetなどのモデルを考えてみてください。それらはプロンプトからリアリスティックな動画を生成していますが、それらの動画に意味を持たせるためには、これらのモデルも動画から学習する必要があります。
これは自動運転と同じ基盤であり、ただ異なる方法で適用されているだけです。そしてこれらすべてには膨大なコンピューティングパワーが必要であり、NVIDIAはBlackwellと45の工場でそれをスケールさせています。
イーロンがFSDは毎月良くなっていると言うとき、これがその進歩の背骨です。10か月経った今でも、ジェンセンの予測は展開しています。物理的なAIー空間、時間、行動を理解するAIーが次世代の車、ロボット、そして私たちが日常で使用するAIを動かすものになるでしょう。
コメント