
10,941 文字

OpenAIが今日の地位に到達できたのは、マイクロソフトの助けなしには考えられません。資金面から人材、そしてインフラに至るまで、マイクロソフトはずっとOpenAIに全面的に協力してきました。そのコミットメントの証拠に、彼らは2年後にほぼ同じブログ記事を投稿しているほどです。同じタブを開いているのかと思ったくらいです。でも違いました。
しかし今日の話題は、このパートナーシップが延長されたからではなく、むしろその逆だからです。マイクロソフトはOpenAIなしの未来を模索しはじめているのです。これは非常に興味深いことです。これは以前私が話した「AIの商品化と最低価格への競争」というビデオの内容とも関連しています。価格に対してどれだけの性能が得られるかという競争です。OpenAIがかつて持っていたリードは縮まりつつあり、それが業界に与える長期的な影響は本当に興味深いものです。それについて皆さんと話し合う時間を取りたいと思います。
しかしAI技術がどんどん安くなっているとはいえ、私のチームに給料を支払わなければならないので、本題に入る前に今日のスポンサーからの短いメッセージをお伝えします。
まず最初に、マイクロソフトとOpenAIのパートナーシップの条件を理解しておく必要があります。また、OpenAIへの投資方法が非常に特殊であることも指摘しておくべきでしょう。OpenAIへの投資はリターンに上限があるのです。通常、会社に投資する場合、例えば10万ドル相当の会社に1万ドル投資すれば、その会社の1%を所有することになります。もしその会社の評価額が10万ドルから1億ドルに上がれば、あなたの投資も同じ倍率で増加します。あなたの1万ドルも3桁増えることになります。なぜなら1%の所有権は、数字がどれだけ大きくなっても1%のままだからです。
これがアーリーステージ投資の仕組みです。非常に低い評価額の会社に投資し、ほとんどの場合は失敗することを予想しつつも、大成功する小さな可能性に賭けるのです。Y Combinatorの世界のほとんどのアーリーステージ企業は、だいたい1800万ドルから3000万ドル程度の評価額で資金調達をしています。時期によって大きく変動しますが、これがあなたが投資する対象の評価額の範囲です。
ほとんどの投資家は、投資したお金が戻ってこないことを予想しています。私の投資家でさえ、私たちが倒産して何も戻ってこないことを予想しています。しかし、もし投資が成功した場合、それは50%の利益や80%の利益ではなく、10倍から100倍のリターンになる可能性が高いのです。それがアーリーステージ投資の魅力です。お金が戻ってくる可能性は低いですが、戻ってきた場合には桁違いの価値になる可能性が十分にあるため、そのリスクを取る価値があるのです。
OpenAIは、投資家たちがこの巨大な倍率のリターンを得るために無謀なことを推し進めることを望まなかったので、初期の段階で潜在的なリターンに上限を設けるという奇妙な決断をしました。私の記憶が正しければ、その上限は10倍のリターンでした。先ほどの例でいうと、10万ドルの会社に投資して、その会社が1億ドル規模になった場合、100万ドルではなく、投資額の10倍である10万ドルしか戻ってこないということです。現金化する際に上限に達するからです。
これはOpenAIが従来型の投資を受け入れる機会を奇妙なものにしました。多くの企業がお金を投資したいと思いましたが、何か他のメリットがない限り、これらの特定の条件に合意する企業はあまりありませんでした。これがマイクロソフトが彼らにとって非常に良いパートナーになった理由です。マイクロソフトがより良いAI技術を必要としていたこと、Azureで大量のインフラを持っていたこと、そして何に使うべきか分からない大量のお金を持っていたことの組み合わせが、彼らをOpenAIにとって素晴らしいパートナーにしたのです。
OpenAIが持っていたものや行っていたことに対するマイクロソフトのニーズと、マイクロソフトが持っていたインフラとお金に対するOpenAIのニーズ、それらが非常に理にかなっていたのです。特に当時(特に2023年)は、OpenAIの技術は他の競合他社、特に今日のDeep Seekのようなオープンソースの競合他社とは比較にならないほど優れていました。
マイクロソフトのOpenAIへの数十億ドルの投資は、当時最高クラスのモデルへのアクセスを獲得するために行われました。現在、OpenAI OpenAIプラットフォームを使わずにOpenAIの最高のモデルを使用する唯一の方法は、Azure経由です。T3チャットでは、OpenAIのモデル、特にGPT-4oとGPT-4o miniをOpenAIではなくAzure経由でホストしています。これは素晴らしいことです。なぜなら私たちはAzureでたくさんのクレジットを持っているからですが、またいくつかのモデルの速度がはるかに優れているからでもあります。ただし、一部のモデルははるかに劣っています。Azure上のGPT-3.5 Turboについては話し始めないでください。大変でした。
それはさておき、このパートナーシップは関係者全員にとって非常に実りあるものでしたが、業界ではいくつかの変化が起き始めています。私自身で説明するよりも、サイヤさんの言葉を引用したいと思います。「AIモデルはコモディティ化しています」。私は完全に同意します。私の「最低価格への競争」というビデオで説明したように、ほとんどのモデルは最高の価格対性能比と現在の性能基準を満たすことに焦点を当てています。
以前、OpenAIのモデルと競合他社との性能差は非常に大きく、モデルの知能能力で2倍以上の差があるように感じました。しかし時間が経つにつれて、代替モデルがOpenAIのレベルに近づいてきています。OpenAIと代替モデルの差は過去最小になっており、その代替モデルはしばしばはるかに安価で、Deep Seek CR1や特にV3のオーバーホールのような場合には、オープンソースの代替モデルでOpenAIを上回っています。
さらに、これらの多くのコストも下がっています。時々OpenAIは、GPT-4.5のような価格が大幅に上がるような変なことをしたり、さらに悪いことに、API経由でGPT-o1 Proで最近行ったような価格設定をします。OpenAIの価格もようやく下がり始めていますが、今日のGeminiのような製品から得られるものとは比較になりません。
また、マイクロソフトが内部で独自のモデルを開発しているという噂もあります。彼らは他のプロバイダー、特にオープンソースの世界から見てきた推論技術を活用したモデルを開発しており、OpenAIから得ているパフォーマンスと十分に比較できるものだと言われています。彼らのモデルは「Mi」として知られていますが、歴史的には特に素晴らしいものではなく、話題に値するものではありませんでした。しかしマイクロソフトは内部で自社の推論モデルを開発しており、漏れ聞こえてくる情報から判断すると、非常に優れているようです。
Deep Seekの最新のV3アップデートについては、近日中に専用のビデオを予定しています。簡単に説明すると、Deep Seek R1とRシリーズは彼らの推論モデルですが、推論モデルは従来のLLMに基づいている必要があります。OpenAIでは、Oモデルはこれまでのところ4oに基づいていました。それが4.5が興奮している理由の一部です。それ自体が良いモデルだからではなく、o4やo5のような推論モデルの基盤として非常に有望だからです。
V3はR1の基盤となっています。V3は12月にリリースされた時、画期的なモデルでした。私はすべてを中断してそれを使い始め、最終的にはT3チャットの構築につながりました。Deep Seekのモデルに非常に感銘を受け、またそのウェブサイトの状態に恐怖を感じなかったら、T3チャットは存在しなかったでしょう。それらの焦点ではなかったからです。
V3は非常に刺激的なリリースで、特に価格を考慮すると、得られるパフォーマンスは信じられないほどでした。こちらの標準的な知能ベンチマークを見てください。Claude 3.7 SonnetはDeep Seek V3と比較して性能が低いのです。速度のような他のベンチマークについては、公式APIでベンチマークを行っているため良くないですが、異なる方法で実行すれば速度を上げることができるはずです。
Deep Seekが行っていることの素晴らしい点は、GPT-4oよりも優れたパフォーマンスを、4oではなくGPT-4o miniに近い価格で実現していることです。知能面で上位にありながら、競合しているモデルよりもGPT-4o miniに近い価格設定であることは驚異的です。GPT-3.5 Turbo mini highは依然として信じられない価値を持っており、すべての要素を考慮すると、これはOpenAIが今までリリースした最高のモデルだと言い続けています。
しかし、オープンソースの基本モデルとしてのV3は非常に有望であり、新しいV3がR2のトレーニングに使用された場合に何が起こるのかを見るのが非常に楽しみです。非常に面白い未来になるでしょう。パフォーマンス速度はまだ素晴らしくありませんが、他のプロバイダーがV3をより高速にする方法を見つけることを望んでいます。なぜなら、驚くほど小さく効率的なモデルだからです。彼らはそれを飛ぶように高速にすることができるはずです。
これらすべてを持ち出した理由は、私たちがこれらすべてのために見て使用する基本的なプリミティブが本当に良くなっており、境界線上でコモディティ化していることが明らかだからです。ここに速いモデルをもう一つ追加したいのですが、GPT-4.5は、テストを行うには高すぎるためチャートにも載せていないようです。笑えます。
私の信頼するArtificial Analysisを使えないので、Deep Seekの数字を信じるしかありません。こちらはGPT-4.5に対する彼らのベンチマークで、覚えていれば、これは今までリリースされた最も高価なモデルの一つです。GPT-4.5は入力トークン100万個あたり75ドル、出力トークン100万個あたり150ドルかかります。現在のDeep Seek V3の価格と比較すると、入力トークンが27セント、出力が1.10ドルで、入力トークンは280倍も高価です。一貫して同等かそれより劣るパフォーマンスのモデルに対して、270倍も高価なのです。
推論しないモデルがそれほど高価なモデルと比較できるという事実は、これらのオープンスタンダードで私たちが持つオープンな機会が信じられないほど素晴らしいことを示しています。Deep SeekがV3モデルそしてRシリーズで作り出したものは信じられないほどで、OpenAIとマイクロソフトがパートナーシップを始めた時とは根本的に異なる世界です。彼らがそのパートナーシップを発展させた時とも異なる世界です。
OpenAIは自社のモデルを改善し続けることに成功しています。3.5 Turbo miniは確かにその性能に対して信じられないほど優れていますが、彼らは競合他社に対して以前持っていた巨大なリードを維持するのに十分な速さで改善していません。
マイクロソフトはオペレーティングシステムレベルではない難しい問題を解決する能力は歴史的に非常に低いです。彼らでさえこれらの高性能モデル、これらの素晴らしいモデルを自分たちで作る方法を見つけ出しているのであれば、これまでOpenAIに費やしてきた数十億ドルについて疑問を持つのは理にかなっています。
ここでAI世界で起こっている焦点の変化を指摘したいと思います。ここで取り上げられている主な点で考慮に値すると思うのは、OpenAIのゴートゥーマーケットマネージャーが説明した「AIの成功体験をもたらすためには、様々な要素を一つにまとめることが重要だ」ということです。私はこれについて少し前に出した「Googleが素晴らしい状態にある理由」というGeminiに関するビデオで話しました。
そこで私が強調しようとしたのは、Googleは独自のポジションにあるということです。なぜなら彼らはデータの部分を把握しており、科学の部分もほぼ把握しており、NVIDIAや他のチップメーカー以外の誰も持っていないレベルのハードウェアを持っているからです。
チップを構築し、インフラをホストし、モデルを生成し、そのモデル作成とトレーニングに使用するデータを作成および見つけ、これらすべてに資金を提供し、GCPでホストするプラットフォームを持ち、さらにはこれらのものを体験できるアプリを持つ同じ会社であるという考え。現在、これらすべてを把握している唯一の企業はGoogleです。
マイクロソフトはこの部分をほぼ持っています。彼らはプラットフォームとお金を持っており、科学の側面も理解し始めています。彼らにとっては興味深い旅でした。しかし、彼らは自社のチップを作っていないという意味で、同じ意味でハードウェアを持っていません。彼らはまだメーカーの気まぐれに左右されています。信じられないなら、Windows向けARMの状態を見てください。彼らはQualcommがどう思うかに完全に依存しています。一方、Googleは現在自社のアーキテクチャを設計・製造しており、これにより他の企業と比較して大きな優位性を持っています。
これはマイクロソフト対Googleの戦争の再燃だと思います。そしてOpenAIは特にここで競争しようとしています。少し再構成する必要があります。主な違いはここです。科学とデータの部分を入れ替えました。OpenAIはこれからこれへと設定したいのです。OpenAIはこれらの部分すべてを所有し、ハードウェアについてはいつでも対処できるようにしたいのです。
GoogleはここにいてさらYに拡張し続けたいと思っています。彼らがここで勝てれば、あるいはここだけでさえ勝てれば、彼らはまだとても良い位置にいます。だから彼らは慎重に左側に移動しています。マイクロソフトはこれしか持っていないため、ある意味混乱しています。彼らは混在した成功でここに拡張し始めています。彼らはアプリを理解できませんでした。彼らが持っていた最も近いものはGitHub Copilotで、彼らはそれを自社のブランディングのために完全に指揮しました。彼らは自分たちのプラットフォームさえ持っていないからです。そうですね。
Windows PCでのCopilotについて話し始めないでください。私は気が狂いそうになります。またOpenAIはカスタムチップを作ろうとしていると言われていますので、私は間違っていたようです。OpenAIもこのチャート全体に拡張しようとしています。彼らは全体に広がりたいのです。AIを消費するアプリから、実際にモデルを実行しているハードウェアとチップアーキテクチャまで、完全に統合されたAIプラットフォームを持ちたいのです。
彼らに幸運を祈ります。CPU設計とアーキテクチャは混沌とした世界であり、ウェブ開発への進出の失敗が恐ろしいほどであることを考えると、彼らがその世界に適しているかどうかわかりません。ウェブ開発はアーキテクチャと比較すれば簡単です。彼らに幸運を祈りますが、マイクロソフトが単にここにいることのリスクを直接見ていることは重要だと思います。彼らはどちらの側からも消費される可能性があります。
科学の側面がますますコモディティ化され、自分たちでそれを消費できるようになり、スケールやデータカーブのような企業からデータを収集したり購入したりするためにできることは何でもし、AIを消費するための素晴らしいアプリを必死に構築し、そして最終的には自社のハードウェアを作るかもしれないことを彼らが認識し始めたので、マイクロソフトとOpenAIの関係における彼らの立場は小さな垂直競争相手であることに気付いています。彼らはOpenAIがその層全体を消費するにつれて、自分たちのシェアを失うことを恐れています。
そこで彼らは、AI世界ではAIが彼らのビジネスの中核であることなしに、どうやって成功するかを理解しようとしています。これは焦点の非常に興味深い変化です。なぜなら、これが議論を呼ぶ意見にならないことを願っていますが、私たちはますます価値のある部分がここにあると気づいているからです。
もし私が自分のアプリでモデルを入れ替えて、ユーザーが気づかなければ、おそらく少し速くなったり少し賢くなったり、あるいは単に5%バカになったりするかもしれませんが、誰が気にするでしょうか?バックエンドでモデルを変更してもユーザーが気づかないかもしれないという事実は、この世界で最も価値のある部分がどこにあるのかを根本的に変えます。
以前はOpenAIがアプリで良いAI生成を持つ方法でした。時間が経つにつれて、その優位性は失われました。OpenAIモデルからR1に切り替えて、本当に良い体験を得ることができます。以前にどのOpenAIモデルを使用していたかによっては、経験は以前よりも優れているかもしれません。これは信じられないことです。これはマイクロソフトが内部で感じ始め、その周りで決断し始めている業界全体の大きな変化です。
マイクロソフトとOpenAIの合意の核心は、マイクロソフトがこの途方もない額のお金を投資するだけでなく、OpenAIがより良いモデルを作る過程で得た革新や開発へのアクセスをマイクロソフトに提供するということでした。ルールは、彼らがAGIの定義に達したら、OpenAIはもはやすべての学びをマイクロソフトに提供する必要がなくなるというものでした。
私が聞いている噂では、マイクロソフトはOpenAIから情報を得ることをやめ、両者の間に小競り合いが起きたというものです。なぜなら、マイクロソフトの研究者たちがOpenAIに「o1をどうやってそんなに良くしたのか」と尋ねたときに(これはAI世界で推論がオープンなものとして理解される前のことでした)、OpenAIはそれを教えることを拒否したからです。これが両社の関係に火種を投じたようです。
マイクロソフトのCTOはこれについてLinkedInに書いたようです。なぜこれがニュースなのかわかりませんが、明白なことを要約すると、「AIモデルをトレーニングするための大型スーパーコンピュータを構築しています。OpenAIのパートナーはこれらのスーパーコンピュータを使用してフロンティアを定義するモデルをトレーニングし、その後私たち両方がこれらのモデルを製品やサービスで利用できるようにして多くの人が恩恵を受けられるようにしています。私たちはこの取り決めが気に入っています。約5年間続けています。また、長年にわたり、マイクロソフト リサーチや製品グループでAIモデルを構築してきました」とのことです。
マイクロソフトのAIモデルは、ベンチマークではOpenAIやAnthropicのモデルと同等の性能を発揮しているようです。マイクロソフトはOpenAIやDeep Seekなどのモデルと競合できる推論モデルをトレーニングしています。推論モデルはChain of Thoughtをシミュレートするように設計されています。
このレポートによると、OpenAIは合意されたとおりにChain of Thoughtプロセスに関する技術情報を共有していなかったと記されており、これがパートナー間の対立の原因になりました。これが重要なポイントです。OpenAIはChain of Thoughtの方法に関する技術情報をマイクロソフトと共有することを拒否しており、これによりマイクロソフトがパートナーシップを活用して自社のモデルを向上させることができなくなっており、今やこの全体像が崩れ始めています。
マイクロソフトは今年後半にMiをAPI(アプリケーションプログラムインターフェース)としてリリースすることを検討しています。これにより、マイクロソフトはライバルやパートナーからのAPIと直接競合することになります。また、同社はすでにMicrosoft CopilotでOpenAIモデルの代わりにMiモデルを入れ替える実験をしていると言われています。
マイクロソフトがCopilotでClaudeを使用できるようにした時点で、このことが起こり始めていると勘付いていました。それがこのパートナーシップが侵食し始めた時です。そして予想よりもはるかに速く進んでいるように感じます。確かに私自身も含めてです。AIは確かに物事を加速させます。製品を出荷する速度ではないかもしれませんが、間違いなくこの種のパートナーシップが崩壊する速度を加速させています。
また、トランプとOracleとの派手なOpenAIの発表である「スターゲート」プロジェクト(米国でAIインフラを構築するためのパートナーシップ)にはマイクロソフトは大きく関与していません。OpenAIはマイクロソフトもパートナーシップの一部だと主張していますが、どうなるか見てみましょう。
この画期的なレポートに対して、The Informationに敬意を表します。他には、このレベルの詳細情報はありません。これは明らかに彼らが見つけて発表した記事です。
昨年秋、OpenAIとマイクロソフトの上級リーダーとの通話中、マイクロソフトのAI責任者であるシャイマンはOpenAIのスタッフとo1の仕組みについて説明するよう争っていました。彼はOpenAIがユーザークエリに回答する前に思考するようにo1をプログラムする方法に関する文書をマイクロソフトに提供していないことに腹を立てていました。この過程はChain of Thoughtとして知られており、AIモデルの秘密のレシピの重要な成分です。
声を上げ、シャイマンはOpenAIの従業員(当時OpenAIのCTOだったメアを含む)に、AIスタートアップがマイクロソフトとの広範な契約の自分の役割を果たしていないと伝えました。
これらのソースを読み進めるほど、マイクロソフトが感じていることをより理解し始めています。私の率直な感想では、マイクロソフト内部の感情は、マイクロソフトのAIチームがOpenAIよりもDeep Seekから多くを学んでいるというものです。マイクロソフトがOpenAIに130億ドルを投資し、ネット上で無料で読める一般的なオープンなPDFからDeep Seekから得るよりも少ないことを考えると、OpenAIに130億ドルを費やすよりも無料のPDFから得るものの方が多いのであれば、彼らが怒り始めている理由が分かります。
締めくくる前に、もう一つ紹介したいチャンネルがあります。このチャンネルは私にこれらのことについてもっと考えさせてくれ、非常に洞察力のある情報が多くあり、非常に有益でした。YouTube上の「AI Explained」チャンネルは私のお気に入りの一つになりました。実際にベルを押そうと思います。このような深いニュースが好きならあなたもそうすることをお勧めします。
最近のAI Explainedビデオで取り上げられたものがなければ、これらすべてをカバーしなかったでしょう。まだチャンネル登録していなければぜひどうぞ。素晴らしいチャンネルです。AI Explainedには多くのことを教えてもらい、より深く掘り下げるためのいくつかのソースを提供してくれたことに大きな感謝を表します。何が起こっているのかを理解するための良い出発点となりました。
ちなみに、OpenAIとマイクロソフトの契約でAGIの定義を正式に決めたかどうかはわかりません。OpenAIの契約はAGIが達成された時点で即座に終了しますが、定義することが難しいため、「AIシステムから1000億ドルの利益を生み出せるとき」と定義されました。つまり、AIシステムが1000億ドルの利益を生み出すことができれば、その時点で彼らの合意の定義によってそれをAGIと呼び、パートナーシップを解消することができ、OpenAIはもはやマイクロソフトにこれらすべてのアクセスを提供する必要がなくなります。
これが重要な理由は、OpenAIがパートナーシップから抜け出したいと思っているため、マイクロソフトへのアクセスを提供する必要がなくなるように、このAGIの定義に急いで到達しようとする可能性があるからです。
もう一つ気づいたのは、このAGIの定義はCEOとのインタビューの後、少なくとも公に決定されたということです。これは2024年12月9日のもので、ここでも彼らはAGIの定義が奇妙だと言っており、その定義はその直後に決定されました。これは彼らが物事を解決しながら、どれだけ場当たり的に進めているかを示しています。
これらすべてのことは、彼らが物事を把握する際に臨機応変に起こっています。かなり混沌としており、企業としてのマイクロソフトはこのスピードで動くようには作られておらず、どの部分が動く価値があるのかを必死に理解しようとしています。
私たちはここでもっと多くの情報を得ることになると予想しています。起こったことは、マイクロソフトが遅れをとっていた何か、つまりAIの科学的側面に追いつこうとして大金を投資したことでした。その後、DeepMindを作った人物の一人をマイクロソフトのAIの責任者として雇い、外部で起こっているすべてのことを見て、OpenAIが彼らが望むような方法で加速するのを助けておらず、外部の他のすべてのことがOpenAIよりも役立っていることに気づいたのです。
どうやってこの混沌から抜け出せばいいのでしょうか?これはすべて理にかなっていると思います。そして私はモデルフロンティア企業のCEOでないことをこれまで以上に感謝しています。これはすべて混沌としており、私は平和な小さな世界で最高のAIチャットアプリを構築し続けてとても幸せです。まだ試していない方は、月額たった8ドルでT3チャットを試してみてください。
この奇妙なマイクロソフトとOpenAIのニュースに対して私が過剰反応しているのか、これは重要なことなのか、数年後に覚えているようなことなのか、あなたの考えを聞かせてください。次回まで、平和を、オタクたち。
コメント