中国のDeepSeek社が世界のAI競争に火をつける

8,197 文字

China’s DeepSeek - A Balanced Overview
Go to for 30-day free trial + 20% off!Accusations of theft by OpenAI, a stock market flash crash and a small AI model fr...

2025年1月28日の株式市場のチャートをご覧ください。これは血の海です。米国株式市場で1兆ドル以上の価値が失われた血の海です。その原因は、中国のDeepSeek R1 AIモデルのリリースでした。この中国モデルは米国の最高モデルと同等の能力を持ちながら、無料でオープンソースであり、より効率的で、最も衝撃的なことに、開発費用はチャットGPTo1の3%未満だったと報告されています。
2年前、このチャンネルでは企業間のAI軍拡競争について話していましましたが、今日それは国家間のAI競争へと進化しています。一方には長年の技術的優位性を持つアメリカがあり、もう一方には全く異なるイデオロギーと動機を持つ中国があります。この優位性への競争は武器についてではなく、思考するように設計されたシステムの開発についてです。この競争は冷戦を思い起こさせます。
一部の人々はこの出来事を「AIのスプートニク・モーメント」と呼んでいます。ホワイトハウスは「中国のDeepSeek AIプラットフォームの国家安全保障への影響」を調査していると述べています。さらに、OpenAIはDeepSeekが自社モデルの訓練のために知的財産を盗んだと非難しています。アメリカが「Stargate AI」プロジェクトに5000億ドルを投入する中、世界的な競争が始まっており、この継続的な戦いは今年のテクノロジー分野で最大のストーリーの1つとなる可能性があります。
人工知能が国家安全保障の問題となるにつれ、技術は今日以上に急速に進歩を強いられることになるでしょう。なんと狂った時代に生きているのでしょうか。しかし、先を急ぐ前に、実際に何が起きているのでしょうか?どうやって無名の企業がこれら全てを成し遂げたのでしょうか?これは単なるAIバブルの一部なのか、それとも本物なのでしょうか?リリース以降、世界中が追いつこうとしているように見えます。全てを理解しようとしてみましょう。
歴史的に見ると、技術がイデオロギーの異なる敵からの国家安全保障上の脅威に直面すると、第二次世界大戦での競争からコンピュータやジェット機のような発明が生まれます。しかし今回、アメリカはAI分野でほとんど無敵でした。それが2025年1月20日のR1のリリースで全て変わりました。
DeepSeek R1は無料で、OpenAIの月額200ドルのモデルと同等のパフォーマンスを持っていると報告されています。これは言語、推論、数学、コーディングなどのタスクにおけるパフォーマンスのことです。このフリーモデルはAnthropicのClaude 3とGoogleのGeminiも上回っています。しかし多くの人が知らないかもしれませんが、DeepSeekは現在の最先端モデルとは少し異なることをしています。それが非常に効率的な理由の一部ですが、これらの詳細は後ほど説明します。
無料でこのレベルのAIパフォーマンスを提供する競合がないため、ユーザーが殺到し、DeepSeekはAppleのApp Storeで1位になりました。しかし、人々が驚いている統計を見てみましょう。このAIは2ヶ月で構築され、開発費用は560万ドル未満だったと報告されています。AI企業のAnthropicは、AIシステムをゼロから開発するには一般的に1億から10億ドルが必要だと述べており、Metaは650億ドルをAIに投資する計画です。わずか560万ドルでこれほどのパフォーマンスを持つものを作り出すことは画期的ですが、全てが見たままではないかもしれません。それについては後ほど説明します。
DeepSeekと、それが Wall Streetでどのように解釈されているかについて、人々が知っておくべき重要なことが2つあります。1つ目は、中国政府のスコープであるかどうかは重要ではないということです。強化学習を通じてLLMが自己学習する技術革新は印象的です。7000億パラメータではなく、sionパラメータだけで推論を行う費用対効果は印象的です。より少ない電力とチップでより多くのモデル学習と推論を行える可能性は印象的です。
ただし、これはチップ需要が危機に瀕しているということではありません。むしろ経済全体でAIの加速が見られる可能性が高いということです。DeepSeek R1はオープンソースなので、誰でも好きなように使用でき、コードは自由に修正できます。これはOpenAIのアプローチとは全く逆で、かなり皮肉なことです。
これは米国のAI企業にとって恐ろしいニュースです。なぜなら突然、彼らのコストが全て均衡を失ったからです。6710億パラメータを持つDeepSeekは、M4 Mac Proのスタック上でローカルに実行できます。対照的に、投資家や企業はアメリカのAIサーバーに数十億ドルを投資してきました。
このリリースのショックの後、米国企業は多すぎる金を使い、多すぎるエネルギーを消費し、提供しているサービスに高すぎる料金を請求してきたように見えます。おそらく将来的には、最も稼ぐのはモデル自体ではなく、その上で動くアプリケーションになるかもしれません。これは米国の投資家たちの大きな間違いだったのでしょうか?誰にもわかりません。だからこそ市場は売り込んでいるのです。
米国企業にとって明るい点が1つあります。それは、AIシステムのユーザー、特に企業環境では、データを直接中国に提供することに不安を感じるかもしれないということです。競争に対応するため、チャットGPTメーカーのOpenAIのCEOであるSam AltmanはGPT 3o Miniモデルを無料で提供すると発表しました。Mark ZuckerbergとMetaは内部的にパニックに陥っています。
しかしアメリカだけではありません。中国でも影響は同じです。TikTokのメーカーであるByteDance、Alibaba、Tensentなどの他の中国のテック大手は慌てふためき、競争するためにAIモデルの価格を引き下げなければなりませんでした。にもかかわらず、DeepSeekは低価格を維持しながら収益を上げており、競合他社は赤字を出しています。
興味深いことに、OpenAIはFinancial Timesに対して、DeepSeekが自社モデルの訓練にチャットGPTの出力を使用していた証拠があると述べました。実際、昨年彼らは盗用を疑い、DeepSeekに属すると思われるOpenAI APIアカウントをブロックしました。米国政府の公式な立場は、知的財産の窃盗が発生した可能性があるというものです。また、中国のAI開発者たちは、米国の制裁にもかかわらず、最先端のNVIDIAグラフィックスカードを入手し続けているようです。
しかし、それは疑問を投げかけます。DeepSeekとは何者で、どのようにして一夜にしてこれを構築したのでしょうか?米国株式市場で最大の下落日の一つを引き起こした企業について、DeepSeekの創業者とチームについてはあまり知られていません。しかし、これまでのストーリーは興味深いものです。
DeepSeekの創業者であるLiang Wen-Fengは一般的なテック業界の出身ではありません。彼は実際には金融の背景を持ち、High Flyerという投資ファンドを共同設立しました。彼の会社はAIを使用して市場トレンドを予測し、投資判断を支援しました。そして彼はそれで非常に成功を収め、現在そのファンドは80億ドルを運用しています。
しかし、最初の成功の後、彼はもっと多くを望みました。彼の次の目標は「人間レベルのAI」を構築することでした。2021年、彼は「AIサイドプロジェクト」の一環として、数千台のNVIDIA GPUの購入を開始しました。これはバイデン政権が中国へのAIハードウェアの輸出制限を開始する直前でした。LiangはAIサイドプロジェクトを別会社にスピンオフし、その会社がDeepSeekとなり、R1は彼らの最新モデルです。
正直なところ、Liangの話を読めば読むほど、より興味深くなります。DeepSeekの創業者に関する専用のエピソードを見たいと思う方は、コメント欄でお知らせください。
DeepSeek R1は強化学習で訓練されました。つまり、学習を助けた人間はいませんでした。そしてDeepSeekがモデルアーキテクチャに使用する方法は、他のほとんどのプレーヤーとは異なります。それは「Mixture of Experts」と呼ばれる技術です。Sky Newsは以下のように説明しています。
「OpenAIの最新モデルGPT-4がアインシュタイン、シェイクスピア、ピカソを一つにまとめようとする一方で、DeepSeekはより大学のように、専門家の部門に分かれています。これによりAIは、どのような質問を受けているかを判断し、それをデジタル脳の特定の部分に送って処理することができます。これにより、他の部分はオフのままで、時間、エネルギー、そして最も重要なことに、計算力の必要性を節約できます。」
YouTubeチャンネルのComputer Fileはさらに説明を加えています。「例えば、非常に具体的な数学の質問をした場合、Mixture of Expertsはこのネットワークの特定の部分、はるかに小さな部分を訓練して、その問題を解決します。基本的に初期段階で質問をネットワークの異なる部分にルーティングし、その中の小さな部分、例えば300億パラメータだけを活性化します。これは大きな節約になります。」
「このように影付きの部分が活性化し、それが答えを生成します。このようなエージェントを使用してシステムを開発できます。一つはこれを行うように訓練され、もう一つは別のことを行うように訓練されています。そして適切なものに質問するだけです。一つのモデルが全てを処理できることを期待するのではありません。それはより効率的です。」
効率性に加えて、蒸留と呼ばれるプロセスがあります。基本的に、より大きなモデルを使って、ターゲットとする領域で小さなモデルを訓練します。結果として、計算力を大幅に削減しながら同等のパフォーマンスを実現します。これがAI開発者と金融市場に大きなショックを与えた理由です。
思考の連鎖(Chain of Thought)を完全にオープンで可視化したことは興味深い選択でした。OpenAIは基本的にその反対のことをしています。問題を解決するステップバイプロセスを書き出し、ゆっくりと解決し、その後答えを書き出します。複数のステップを必要とする問題を解決する場合、はるかに優れた結果が得られます。
空が青い理由など単純な質問に対してはインターネットから学習したテキストを簡単に再生できますが、問題解決スキルを要する質問は一度で処理するのが難しいので、時間をかけて処理する必要があります。
OpenAIはこの思考の連鎖を開発しましたが、全てが非公開なので、その方法は公開していません。つまり、全く「オープン」AIではないわけです。ある意味で、思考の連鎖の高価な要約版は見ることができますが、実際の内部モノローグは企業秘密です。
R1が行っているのはo1と似た思考の連鎖ですが、完全に公開されています。彼らは全てのモデル、全てのコードをリリースしており、対話することができ、完全なモノローグを見ることができます。また、はるかに限られたデータで訓練されています。
先ほど述べたように、物事は見たままではないかもしれません。モデルを作成するのに560万ドルというコスト数字は完全なものではないかもしれません。実際、DeepSeek自身が発表した論文では、その560万ドルという数字にはDeepSeek V3の公式訓練のみが含まれており、アーキテクチャ、アルゴリズム、またはデータに関する事前の研究実験のコストは含まれていないと述べています。これは、このものが600万ドル未満で構築されたというすべての見出しに疑問を投げかけます。しかし、実際の数字が何であれ、米国企業が費やしているものよりはるかに少ないでしょう。
最新のニュースでは、DeepSeekはオープンイメージモデルもリリースしており、このペースでビデオモデルもすぐに続くでしょう。それはOpenAIのSoraやGoogleの期待されるV2に匹敵する可能性もあります。検索の関心度では、DeepSeekは現在チャットGPTを上回っており、App Storeで最もダウンロードされたアプリの1つとなりました。そして1月末になると、事態は絶対的に爆発し、狂乱状態となりました。
中国の旧正月の期間中、中国は熱狂しました。まずAlibabaがQwen 2.5 Maxを発表します。これは非常に優れたAIで、コードアニメーションを一度で作成できます。コンピュータにアニメーションのコーディングを依頼すると、それが実行するというのは非常に直感的で、将来の子供たちはコーディングは常にこのように機能していたと信じるでしょう。AlibabaのQwen 2.5 MaxはDeepSeekやGPT 4oをいくつかのタスクで上回っています。
そして同じ頃にリリースされたKimi K 1.5もあります。これも素晴らしいパフォーマーで、マルチモーダルでリアルタイムでウェブを閲覧できます。
皆さんがDeepSeekにサインアップする前に、何かご注意いただきたいことがあります。チャット履歴、テキストや音声の入力、アップロードされたファイル、キーストロークのパターン、基本的にモデルに入力する全てのデータを収集します。OpenAIも同様のことを行っていますが、違いはDeepSeekの場合、データが中華人民共和国のサーバーに直接送られることです。
つまり、米国に監視されたいのか、中国に監視されたいのか、という選択です。何をすべきかは私からは言えませんが、これは注意点として覚えておいてください。しかしプライバシーの観点からは明るい面もあります。完全なプライバシーのために、インターネット接続なしでローカルマシン上でDeepSeekを実行できるということです。
YouTubeチャンネルの「Some Ordinary Gamers」がローカルでの実行を示しています。「例えば、DeepSeekに『シンプルなログインウェブページのコードを書いて』と頼むことができます。この時点で、それは考えて『ユーザーがシンプルなログインページのコードを要求している』と理解し、まずHTMLを構造化し、次にスタイルを設定し、そして検証を行います。そしてここで実際にHTMLコードを書いています。」
「今日、私は本当にジュニアコーダーたちが心配です。なぜなら、AIが人々が最も失うと予想していなかった仕事から先に奪っているからです。再度、これは実際のログインページを書き、もちろん完了すると、このチャットボックスソフトウェアでプレビューを提供するので、実際の本番環境やテストに投入する前に自分で確認できます。ここでプレビューボタンを押すと、ほら、そこにあります。」
この記事を作成している最中、週初めにDeepSeekは「大規模な悪意のある攻撃」により、一時的にユーザー登録を制限せざるを得なくなりました。これは多くの人々への警告でもあり、プログラムが思われているほど準備ができていないかもしれないことを示しています。
Sam Altmanはどう考えているのでしょうか?彼は一度だけ直接この企業に言及し、「DeepSeekのR1は印象的なモデルで、特に価格に対して提供できるものが素晴らしい。我々はもちろんはるかに優れたモデルを提供するが、新しい競合を持つことは本当に活力を与えてくれる」と述べました。我々はいくつかのリリースを引き上げることになるでしょう。OpenAIにとって何が待ち受けているのかを見てみましょう。
冗談として「AIがチャットGPTの仕事を奪った」と言われていますが、真面目な話、これで終わりだとは思いません。これは主要な競争のほんの始まりだと信じています。我々が目にしているのは、トゥキディデスの罠の技術版です。基本的に、台頭する勢力が既存の勢力に挑戦するとき、衝突が生じるというものです。
2024年半ばに中国科学院で再公開されたWavesのインタビューで、DeepSeekの創業者Liangは彼の野心を明確にしました。「長年、中国企業は他の場所で開発された技術革新を活用し、アプリケーションを通じて収益化することに慣れてきました。しかしこれは持続可能ではありません。今回の目標は短期的な利益ではなく、エコシステムの成長を促進するための技術フロンティアの前進です。」
「シリコンバレーがなぜそれほど革新的なのか?それは彼らが挑戦する勢いを持っているからです。チャットGPTがデビューした時、中国はフロンティア研究に自信がありませんでした。投資家から主要テック企業まで、多くの人々がギャップが広すぎると感じ、代わりにアプリケーションに焦点を当てました。しかしイノベーションには自信が必要で、若い人々はそれをより多く持つ傾向があります。」
このようなマインドセットで、DeepSeekはAIイノベーションを前進させ、中国が世界のAIレースの最前線に立つ可能性があります。世界中の競合他社はコストを削減し、AIモデルの作り方を見直すことを余儀なくされるでしょう。どのように展開するかはわかりませんが、今後数年で急速な進歩があることは確かです。
ポジティブに考えれば、医学、材料科学、数学、さらには理論物理学でブレークスループが見られる可能性があります。長期的には、より安価に製品を作り、より長持ちさせ、より効率的に生産できるようになるかもしれません。しかし一方で、悪意ある使用や悪質な主体についてはどうでしょうか?
地政学的にも、このAIの急速な進歩の中で人間はどうなるのでしょうか?それは未来が決めることです。AIが爆発的に広がる前に、私はこのトピックについて数年前にビデオを作成しましたので、このビデオの後にご覧いただけます。
しかしいつものように、私たちはこれをよく見守り、どうなっていくのかを見ていきましょう。とにかく、私からは以上です。これがDeepSeek R1の現状、その効率的な動作方法、そして世界中に与えた絶対的なショックについてです。
今日、多くの人々が消費者向けAIを煩わしく感じているかもしれませんが、それを避けることはできません。AIは既にここにあり、毎週進化しています。それはすぐに日常生活の重要な部分となるでしょう。しかしそもそもAIはどのように機能するのでしょうか?
今日のスポンサーであるBrilliantを使えば、それと他の多くのSTEM科目について楽しく簡単に学ぶことができます。Brilliantの人工ニューラルネットワークコースはそのために最適です。私はAIのエピソードを作る際に、いくつかの背景知識を確認するために使用しました。
Brilliantの各レッスンでは概念を実践することができ、この方法は講義ビデオを見るよりも6倍効果的であることが証明されています。さらに、Brilliantのすべてのコンテンツは、MIT、Caltech、Duke、Microsoft、Google、その他の教師、研究者、プロフェッショナルによって作成されています。
仕事のプロジェクトの復習や、単に自己啓発と好奇心のために、自分のペースで学習できます。Brilliantが提供するすべてを30日間フルに試すには、URL brilliant.org/coldfusionにアクセスしてください。年間プレミアムサブスクリプションも20%オフになります。
ご視聴ありがとうございました。私はDagoです。Cold Fusionをご覧いただき、また次回のエピソードでお会いしましょう。それでは、良い一日を。

コメント

タイトルとURLをコピーしました