マイクロソフトCEOのサティア・ナデラがAIの未来を語る

7,359 文字

Microsoft CEO Satya Nadella on the Future of AI
How Satya Nadella and Microsoft are preparing for the future...Join My Newsletter for Regular AI Updates 👇🏼 The Best AI ...

エネルギー使用量は私たちの地球にかなり大きな影響を与えると考えられており、エージェントはこれまでのどのワークロードよりも多くのエネルギーを必要としますが、それは異なる規模の単位です。知能のコストがゼロに近づくとき、あなたが最も期待していることは何ですか?現在、インフレを抑制したり経済成長を改善したりするには、何らかの助けが必要です。
オペレーティングシステムが将来的に同様になり、従来のコードが全くないか、あるいは非常に少なくなる未来が来ると思いますか?テクノロジースタックのあらゆる層を根本から再考する必要があります。以前、ソフトウェアのアプリケーション層がエージェントに統合されると言っていましたが、それは垂直型SaaS企業にとって何を意味するのでしょうか?
さて、サティア、お話しいただきありがとうございます。Buildで発表されたすべてのことについて、おめでとうございます。いくつか質問があります。マイクロソフトでは、クラウド、オープンソースの採用など、大きな転換を成功裏に監督してきましたが、現在私たちは次の段階にいます。非常に強力なAIエージェントの台頭において、現在の製品スイートを維持しながら、それに対する大きな変化が起こる中で、どのように投資を考えていますか?
まず、私たちの開発者カンファレンスに参加していただき、ありがとうございます。私の考え方としては、まず新しいものを受け入れる必要があります。現在、AIの時代、エージェントウェブの時代に2〜3年経っていると考えると、エージェントを構築し、アプリを構築することの意味するパターンがより明確になってきています。以前のワークロード用に構築したテックスタックを、新しいワークロードのために根本的に考え直す必要があります。
例えばインフラ層を考えてみましょう。私たちは世界中に70のAzureリージョンを持っていることを非常に誇りに思っていますが、それらをAI工場になるように改修または適合させる必要があるというわけです。Chat GPTやCopilotのようなアプリを例にとると、確かに多くのGPUやAIアクセラレーターが必要ですが、他のすべてのものも必要です。実際、トレーニングと推論の両方で膨大なストレージが必要です。また、例えばエージェントの環境を持つために、通常のコンピュート、AIアクセラレーテッドでないコンピュートも大量に必要です。
興味深いことに、過去15年間で構築したものが今さらに関連性を持つかもしれません。エージェントはこれまでのどのワークロードよりも多くのリソースを必要としますが、それは異なる規模の単位です。これがインフラ層で行う必要があることです。
データについても同じことが言えます。データベースを取り、人、場所、物事をスキーマ化する場所だと言いますが、今では知能層をデータに直接持ってくることができます。私たちが見せた最もクールなデモの一つは、SQLクエリの中にLLMレスポンスを混ぜ合わせることができるようになった、非常にモジュール化されたPostgresでした。生成できるクエリプランを考えてみてください。
テックスタックのあらゆる層を再考する必要がありますが、同時に過去15年間の最高の仕事を活かし、開発者がその恩恵を受けられるようにすることもできます。新しいAIワークロードのために、テックスタックのあらゆる層を根本的な観点から考え、それを実際の顧客のニーズに合わせて統合することが重要です。
特にOffice 365のような人々がよく知っている製品のエンドユーザーにとって、製品は急速に変化すると思います。その加速する変化とは何でしょうか?
これは興味深いことです。Officeを見ると、Microsoft 365には3つのモードがあると言えます。
まず、全く新しいモードです。AIのための新しいUIがあり、チャット、検索、ノートブック(様々な種類のデータを収集し、ポッドキャストやオーディオの概要などを作成する場所)があります。また、研究者やアナリストなどのエージェントもあります。これらは私がタスクを委任できるもので、非常にエキサイティングです。さらにCopilot Studioもあるので、エージェントを構築することができます。これが新しいことで、AIとエージェントのためのUIを持っているということです。
もう一つ興味深いのは、Teamsがこれらすべてをマルチプレイヤーモードに移行させることです。これらのエージェントはすべて、私のチャンネルや会議で利用できます。つまり、Teamsは、AIが私とマルチプレイヤーモードで働くための足場になるのです。
そして3つ目のモードは、ただ集中して作業するモードです。GitHub CopilotとVS Codeで集中してコーディングしながらエージェントを使用できるように、Excelのスプレッドシートに集中しながらもすぐそばにCopilotチャットがあります。これはスプレッドシートを分析している間、データサイエンティストが隣にいるようなものです。ドキュメントを研究・作成しているときには、研究者がすぐそばにいるのです。
つまり、すべてのOfficeのキャンバスをIDEにし、基本的にチャット機能を付けたのです。ある意味、M365システムの価値はこれらすべての層に知能が組み込まれたことで、より複合的になったと感じています。
その点について続けたいと思います。以前、ソフトウェアのアプリケーション層がエージェントに統合されると言っていました。私はそれについて「SaaSは死んだ」というタイトルの動画を作り、多くの注目を集めました。でも、あなたの考えを聞きたいです。主張としては、エージェント層があり、その下にエージェントが読み書きできる接地されたデータベースがあるということですが、これは垂直型SaaS企業にとって何を意味するのでしょうか?彼らはこの未来にどのように備えるべきでしょうか?
私たちが今日見せたデモでは、Dynamics 365が基本的にMCPサーバーとCopilot Studioを使って、CRMと他の多くの記録システムにまたがるマルチエージェントアプリケーションをオーケストレーションし、複雑なビジネスプロセスを完了させました。これはすでに現実のものとなっています。ビジネスプロセスとビジネスアプリケーションを考える際には、このような構成にする必要があることは明らかです。
そのため、「私は記録システムやエンゲージメントシステムであり、私のデータの上にワークフローがあるだけで、それが範囲だ」と考えていたとしたら、それは続かないでしょう。私たちは皆、このエージェンティックウェブの新しいオーケストレーション層に参加することに対してオープンである必要があります。
あなたのSaaSアプリケーションはバックエンドの一つになるでしょう。エージェンティックウェブに参加するためには、MCPのようなものをサポートする必要があるでしょう。そして、NLウェブのようなものがすべてのコネクタの摩擦を減らす可能性もあります。企業内でのコネクタの摩擦は大きな問題ですが、NLウェブはこれを大きく変える可能性があります。そのため、私たちが構築したSaaSアプリケーションは、この未来に適応するために根本的に変化する必要があるでしょう。
そのSaaS企業は、顧客のために基礎となる真実のデータのキュレーターになり、エージェントはマイクロソフトのようなプラットフォーム企業によって提供されると思いますか?
正確にどのように展開するかは不明確だと思います。というのも、ある意味で私たちは皆、今持っているものの重要性を過大評価しがちですが、現実にはこのようなプラットフォームの転換が起きると、価値は別の場所で生み出されるからです。
結局のところ、重要なのは仕事を完了することです。ビジネスプロセスを完了させることが目的であり、特定の記録システムとそのキュレーション、あるいは特定のエージェントやワークフローについてではなく、全体についてです。それが水の流れる方向であり、問題は、自分が持っている堀を守ろうとするか、エージェントの頭部のようなファサードを構築しようとするのではなく、その流れに乗ることができるかどうかです。
異なる種類のエージェントが互いに会話し、異なるデータベースがあり、それは抽象化層にすぎないというのは素晴らしいと思います。それはとてもエキサイティングに聞こえます。
また、あなたは誰かを雇うとき、その人と彼らが将来持つエージェントのバスケットを雇っているとインタビューで言及していました。それは私にとって魅力的ですが、明確にしたいと思います。なぜなら、おそらく雇用主は従来のIPと同じようにエージェントのIPも所有したいと思うからです。
それは正しいです。実際、私たちの見解はそのようなものです。今日の発表を見ても、会社の知的財産とは何でしょうか?仕事での私たちの成果物は会社の財産であり、エージェントについても同様でしょう。だからこそ、私たちはレールを拡張し、エージェントにエントリーIDを持たせ、組織内の人と同じように条件付きアクセスを管理できるようにしました。
もう一つ非常に重要なことは、エージェントがデータにアクセスする場合、それは同じデータ保護とデータ権に従う必要があるということです。また、セキュリティの面では、エージェント環境をエンドポイントのように管理する必要があります。だからこそ、Defenderは資格情報の盗難などがないことを確認します。つまり、人々とそのITインフラのために行ってきたアイデンティティ管理とセキュリティのすべてが、エージェントとそのITインフラのためにも行われるのです。
それは理にかなっていると思います。また、多くの人々が個人的な生活のために独自のパーソナルエージェントを構築すると思いますが、彼らがそれらのパーソナルエージェントを職場に持ち込む未来も見えますか?
それは素晴らしい質問です。自分のパーソナルエージェントを持ち込むシステムは、データの漏洩がないように行う必要があります。それが問題です。例えば、個人のメールと企業のメールは今日、2つの分離されたものであり、2つのアイデンティティがあります。プライバシーの理由と知的財産の理由の両方のために状態を分離する方法を知っています。
だからこそ、私たちはEntraとMicrosoftアカウントを信じています。そのため、CopilotとMicrosoft 365 Copilotがあり、ユーザーモデルの観点からこの2つを混同すると非常に混乱する可能性があります。私が2つのプロファイルを持つEdgeをピン留めする理由は、個人としてMicrosoftアカウントを使用し、マイクロソフトで仕事をするときにEntraを使用するという明確な区別があるからです。そうしないと、すべてを混同して非常に複雑になる可能性があります。
それは理にかなっていると思います。あなたのビジョンについて質問したいと思います。知能のコストは急速に低下し、希望的にはゼロに近づいているようです。将来的にはとても魅力的な世界になると思います。知能のコストがゼロに近づいたとき、どのようなユースケースが開かれると思いますか?あなたが最も期待していることは何ですか?
私にとって、最終的に世界を見渡すと、インフレを抑制したり経済成長を改善したりするために、技術や知能のような何かがより豊富に必要なのか?絶対にそうです。今は、何らかの助けが必要な時です。
開発者カンファレンスで共有したスタンフォード医学の例を考えてみましょう。彼らは腫瘍委員会の会議や腫瘍学、がん治療のような非常に重要なことに、この技術をすべて適用することができました。彼らはマルチエージェントフレームワークをFoundryで使用し、病理学、臨床試験、問題のあるデータを調整して、より良い腫瘍委員会の会議を行い、そのデータと情報をPowerPointや教室、あるいは人々が協力するためのTeamsに送りました。
医療は私たちのGDPの約20%を占め、多くの費用はこのワークフローにあります。もし医療提供者がAIを使って患者のケアと結果を改善し、コストを削減できれば、それは社会に大きな影響を与えるでしょう。それが私が本当に期待していることです。
医療のユースケースには非常に期待しています。超パーソナライズされた医療。私はすでに自分の健康に関する質問に答えるためにChatGPT Copilotを使用しています。それは非常にエキサイティングですし、あなたが見せてくれた研究、イマージョン冷却も素晴らしいです。材料科学。本当に多くのことがあります。
若い世代の一部は、エネルギー使用量が地球に非常に大きな悪影響を与えると考えて、AIを完全に避けているか、あるいは軽く使っているだけだと聞いています。マイクロソフトはそれについてどのように考えていますか?彼らにどのような言葉で安心してもらえますか?
まず、若い世代がこれについて深く気にかけていることは本当に刺激的です。なぜなら、ある意味では、私たちが創造しているものが、社会で重要な結果を出すのに根本的に役立っているということを言うための正しい促進要因だからです。それが医療であれ、教育であれ、金融サービスへのアクセスであれ、どのような領域であっても、最終的には経済成長、経済的繁栄と豊かさです。
第二に重要なのは、持続可能な方法でそれを行う必要があるということです。持続可能な豊かさです。そしてそれが実現するなら、私が常に戻る方程式は「トークン/ドル/ワット」です。最も柔軟なリソースとしてソフトウェアを使用し、最も効率的な方法でエネルギーを使用して最大量の豊かさを生み出すことができるという事実は、それが健康や教育、その他の結果を改善するのであれば良いことです。
現実は、テクノロジー全体が今日のグリッド電力または総電力消費の2〜3%程度だということです。それは少ないですが、確かに倍増するでしょう。もし倍増する必要があるなら、倍増するための社会的許可が必要です。実際の世界でより多くの価値を創造する必要があります。
それが私がテック業界は、誰もが楽しいことに使っている私たちの製品の一つだけに固執するのではなく、医療、材料科学、広範な知識労働、小規模ビジネスの生産性向上に焦点を当てる必要があると感じている理由の一つです。なぜなら、それがエネルギーという貴重なリソースを使い続ける社会的許可を与えてくれるからです。
それを持続可能な方法で行います。私たちは代替エネルギーの最大の買い手の一部です。実際、新しいプロジェクトに対する最大の補助金は、私たちのような人々からのものだと言えるでしょう。私たちは本当にそれを推進し続けたいと思っていますが、最終的には経済的繁栄を生み出すようなトークン/ドル/ワットを提供することが重要です。
あなたが言ったことを嬉しく思います。環境への影響について非常に心配している人々にあなたが言ったことを伝え、このビデオを見せるつもりです。ありがとうございます。
現在、コンピューティングアーキテクチャには大きな変化が起きています。確定的な部分と非確定的な部分の境界があいまいになっています。数ヶ月前、拡散モデルを使用してゲーム「Doom」を再現したクールなデモを見ました。すべてのフレームが予測されていました。オペレーティングシステムも同様に、従来のコードが全くないか、あるいは非常に少ない未来を想像できますか?
それは素晴らしいです。私たちも同様のものを持っていました。Museモデルは、ゲームデータで訓練した世界行動モデルでした。基本的にXboxコントローラーをアクションとして使用し、次のシーンを生成するようなものです。これはロボット工学のようなものとも言えます。ゲームもそのようなものです。そう、すべてが生成されるのです。
オペレーティングシステムについて、時々私たちは確定的システムと呼ぶものの確定性を過大評価していると思います。結局のところ、ソフトウェアプログラムを取り、それを証明することはできません。それはコンピュータサイエンスの根本的な課題の一つです。したがって、確かに確率的なシステムですが、この確率的なシステムは確定的な方法で動作する必要があります。
基調講演でイーロンにインタビューしたとき、彼は「知能の物理学を理解する必要がある」と言いました。これは実際に考えるべき良い方法です。つまり、複雑なシステムを組み合わせるとき、それらの複雑なシステムの物理学を理解し、それらを制限し、サンドボックス化する方法が必要です。
オペレーティングシステムでもそうする必要があるでしょう。私たちが立ち上げたばかりのコーディングエージェントを見てみると、興味深いことに、そのエージェントにはGitHub Actionsの下に環境があります。実際には仮想マシンを配置し、その仮想マシンの境界を設定しています。インターネットアクセスがあるかどうかを制御する必要があります。MCPサーバーでツールにアクセスする場合も制御する必要があります。そしてそのすべての完全な監査ログがあります。
だから私たちは、多くの命令的コードで構築したソフトウェアシステムのような確定的システムと、このエージェントを混合し、結合する方法を学び、そしてその相互作用自体を監視できるようにするでしょう。
基調講演であなたが言ったように、私たちはこの移行の中盤に入りつつあります。異なるタイプのソフトウェアのブレンドがどこに向かうのか見るのは本当に興味深い時期だと思います。お会いいただきありがとうございます。感謝しています。
本当にありがとうございます。お会いできて嬉しかったです。時間を割いて来ていただきありがとうございます。今後もよろしくお願いします。

コメント

タイトルとURLをコピーしました