DeepSeekの状況は信じられない…

8,277 文字

Hello guys and gals, it's me Mutahar again! This time we take a look and run DeepSeek on our own machines. This AI just ...

みなさん、この動画が来ることは分かっていましたね。今は夜遅くて暗いんですが、DeepSeekは今週、誰にとっても最も驚くべき出来事の一つでした。人工知能は完全に定着したと言えます。私たちが夢見るAI、AGIと呼ばれるものを作り出そうと、多くの企業が頂点を目指して走っています。
ここ数日、DeepSeekという企業が大きなニュースとなりました。この分野で最大の競合企業の一つであるOpenAI、つまりChatGPTを作っている企業に対して、無料の競合製品をリリースしたことで、世界を驚かせたのです。
ここには多くの話題がありますので、最初から説明していきましょう。OpenAIには多くのモデルがありますが、その一つがOpenAI 1です。これは応答する前により多くの時間を考えるように設計されたモデルです。このAIは段階を追って考え、より良い回答を提供するだけでなく、より集中的に問題を論理的に解決するように設計されています。
もちろんそれだけではありません。これまでAI関連の話題として、SoraやChatGPTの各種モデル、画像生成などを見てきました。今日、私がDeepSeekについて話す主な理由は、中国がこの驚くべきAI競合製品をリリースしただけでなく、オープンソースとして公開したことです。つまり、中国のスパイやアメリカのスパイ、あるいは他のどんな監視からも100%プライバシーを保ちながら、自分のデバイスでローカルに実行できるということです。
私はAIがなくなるとは思いませんが、これらが超安全であることを確認したいと思います。このような製品を自分でホストできる場合は、そうすべきだと常に推奨しています。一般的に、ChatGPTやDeepSeek、あるいはウェブインターフェースを通じてインターネット上の任意のAIと対話する場合、あなたの情報の大部分を提供することになります。送信した画像はトレーニングに使用される可能性があり、情報は何らかの理由で保存される可能性があります。
そこで、これらすべてをローカルであなたのデバイス上で実行する方法をお見せします。これにより、誰もあなたの情報を取得できません。一般的に、十分なハードウェアがある場合、情報をランダムな場所に送信する必要はありません。
さらに詳しく見ていきましょう。数日前、OpenAIはStargateプロジェクトと呼ばれるものを発表しました。これは、今後4年間でOpenAIのAIインフラを米国全体に構築するために5000億ドルを投資する新会社です。現在1000億ドルを投入し、このインフラはAIにおけるリーダーシップを確立し、数十万人のアメリカ人の雇用を創出し、世界全体に大きな経済的利益をもたらすとしています。
主要な技術パートナーとしては、Arm、Microsoft、NVIDIA、Oracle、OpenAIが発表されました。5000億ドルという金額を見て、中国はDeepSeekにどれくらい費やしたのか気になるかもしれません。中国によると、約560万ドルだそうです。これは昨年、同様のモデルを構築するのに必要だと見積もられた1000億から1兆ドルと比べると、はるかに少ない金額です。
一方で支出の実態は誰にも分からず、これは損失を覚悟で他国のAIに対する米国の反応をテストする実験かもしれません。また、中国政府のより大きな資金が投入されている可能性もあり、競争相手を威嚇したり圧倒したりするための戦略かもしれません。
DeepSeekのウェブサイトを見ると、彼らは自社の能力を示しており、多くの場合、競合他社を凌駕しているように見えます。全ての面でというわけではなく、Claude、ChatGPT、MetaのLlamaが優位な場合もありますが、DeepSeekはこの分野でかなり良い競争相手となっています。
今すぐ始めることができ、ウェブサイトで電話番号とパスワードを入力するだけです。ただし、電話番号は中国の番号である必要があります。しかし面白いことに、Googleを禁止している国である中国が、アメリカや外国のGoogleアカウントをログイン方法として使用することを許可しているのです。
DeepSeekは非常に人気があり、App Storeで1位を獲得し、市場を大きく混乱させたため、現在、大規模なサイバー攻撃を受けているとのことです。DeepSeekによると、悪意のある大規模な攻撃により、サービスの継続を確保するために新規登録を一時的に制限しているとのことです。既存ユーザーは通常通りログインできます。
彼らの市場への影響を注意深く見ると、なぜ攻撃を受けているのかが明らかになります。NVIDIAの株価を見ると、この動画を作成している時点で、ここ5日間で14.8%下落しています。アナリストによると、NVIDIAは約6000億ドルの価値を失ったとのことです。NVIDIAの株を持っている人が目覚めてお金を失っているのを見て、Wall Streetの強気な投資家は「買い時だ」と手をこすっているでしょう。
なぜNVIDIAが最も大きな打撃を受けているのでしょうか。これらのAIモデルのトレーニングがどのように行われているかを知りたい場合、最大のテクノロジー企業の一つであるNVIDIAは、これらの企業が法外な価格で購入する大規模なGPUとクラスターを作成しています。OpenAI、Groの場合もそうですが、DeepSeekの場合も同様です。
しかし、彼らはNVIDIAの製品に560万ドルしか費やしていないと述べています。その理由は、H800 GPUを使用しているからです。最新や最も高価なGPUを使用せず、非常に効率的なものを作成できると述べています。計算能力の一部分しか必要としないとのことです。NVIDIAの株価が下落している理由は、通常、彼らは市場にこれらのチップを大量に供給できるからです。
しかし今、市場は「もしかしたら、各チップに対して高すぎる価格をつけているのではないか」と気づき始めています。もしDeepSeekのようなものが計算能力とハードウェアのほんの一部で実現できるのであれば、市場は自己修正すべきかもしれません。
cookingboyは次のように書いています：「H800はH100どころか、新しいB200と比べても計算能力の一部分に過ぎず、NVIDIAにとって利益の少ない安価な製品です。最先端のモデルがはるかに少ない計算能力で訓練できるのであれば、NVIDIAの最高利益率を持つ最も高価なGPUへの需要は減少するでしょう。少なくとも市場はそれを恐れています。」これが最も適切な説明だと思います。
現在、サイバー攻撃のためにDeepSeek V3にアクセスできませんが、十分なハードウェア、つまり数万ドル以上の価値があるような本格的なハードウェアがあれば、Hugging Faceで彼らの実際のモデルをダウンロードできます。例えば、1週間前に325,000回ダウンロードされた685億パラメータのモデルがあります。
DeepSeek V3をダウンロードして、実際のハードウェアで実行することができます。一部の人々は試してみたようですが、ここでは別の方法を見ていきましょう。DeepSeekを実行するのは簡単です。まず、Windowsを使用している場合（私のコミュニティの大多数がそうですが）、もちろんLinuxやmacOSでも同じことができます。
LlamaやFinetuneを実行したい場合は、oLlamaというプログラムをダウンロードしてオペレーティングシステムにインストールします。その後、chatbox.aiというサイトにアクセスし、デバイスにローカルにインストールされたoLlamaサーバーとインターフェースするchatbot.aiをダウンロードします。
oLlamaをインストールしたら、スタートメニューを開いてターミナルを開き、「ollama run deepseek-coder:1.3b」と入力します。他のバージョンもありますが、1.3bは私のシステムで実行している最小バージョンです。8billion、14b、13b、32b、そして最も賢いバージョンである70bまであります。
私のシステムのようなハードウェア、つまり128GBのRAM、RTX 4090、Ryzen 9 5950X、大容量のストレージがある場合は、より強力なパラメータを実行できますが、ハードウェアによって結果は異なります。
chatbotサービスを開くと、左下の設定コーナーで、モデルプロバイダーとしてollama APIを選択し、インストールしたollama deepseekモデルを選択して保存するだけです。これで、システム上でローカルに実行されるAIを簡単に入手できます。
では、このAIが何をできるか見てみましょう。例えば、「幽霊は実在するか」と質問してみましょう。このモデルの面白い点は、GPUの使用率が跳ね上がることです。実際のサーバーが考え、処理し、起動するにつれて使用率が上がっていきます。少し時間がかかりますが、考え始めます。
「幽霊が実在するかどうかを考えてみましょう。本や映画、そして不気味な経験をしたという友人たちから、幽霊について聞いたことがあります。」ここで見ているのは回答ではなく、AIが私の質問について実際に考えているところです。Mass Effectのようなゲームでも、何かを尋ねると、人間のように考えてから回答を提供します。
考えた後、ChatGPTのプロンプトから期待される回答を提供します。面白いのは、質問への回答を得られるだけでなく、AI自体がどのように処理し、考えているかを見ることができることです。
「ドナルド・トランプのように考えて、世界の飢餓問題を解決する方法を教えて」と入力してみましょう。トランプは著名な人物で、後で実際の政治的な影響について見ていくために彼を取り上げました。AIは考えながら、「トランプによれば、強力なリーダーシップ、取引、アメリカの利益の重視、大胆な発言と単純化によって飢餓問題を解決できる」と答えます。
次に「習近平の考えで世界の飢餓問題を解決する方法を教えて」と尋ねると、データバンクにある別の人物の視点で考え始めます。これは非常に興味深いです。例えば、中国の一帯一路構想について言及するなど、AIが考えている様子を見ることができるのは本当に面白いです。
もちろん、AIについて私が気にかけているのはそれだけではありません。このAIにコードを書かせることもできます。例えば、「シンプルなログインウェブページのコードを書いて」と依頼できます。すると、ユーザーがシンプルなログインページを作成するためのコードを要求していることを理解し、HTMLの構造を作り、スタイルを設定し、検証を行います。そしてHTMLコードを書き始めます。
最近のジュニアコーダーたちが心配です。なぜなら、AIは人々が最も失うと予想していなかった仕事から奪い始めているからです。このログインページを書き、chatboxソフトウェアでプレビューを表示して、実際の製品やテストに投入する前に確認することができます。
プレビューボタンを押すと、シンプルなログインページが表示されます。かなりクールだと思います。「nethackのような基本的なウェブベースのローグライクダンジョンクローラーゲームのコードを書いて」と言ってみましょう。
なんということでしょう、AIは本当に凄いです。グリッドベースのシステム、キャラクターとモンスター、移動メカニズム、戦闘メカニズム、ダンジョンの手続き的生成について考えています。高校のコンピュータープログラミングのクラスで、最終プロジェクトとしてダンジョンクローラーを書いた2人の生徒を思い出します。C++だったかな、それともPascalだったかもしれません。彼らは他の全員を圧倒し、私は本当に恥ずかしい思いをしました。
このコード全体を書き出し、自分でプレビューできます。パラメータがどのように表示されるかも確認できます。これは私の4090であり、専用のGPUメモリをほぼすべて使用し、使用率は上限に達しています。メモリやCPUはそれほど使用していませんが、実際のGPUには大きな負荷がかかっています。
4090や同等のGPUを持っていない場合は、より小さいパラメータを実行することをお勧めします。同じハードウェアを持っていない場合、処理に相当時間がかかるでしょう。
このモデルにはダークサイドもあります。完璧ではありません。中国ベースのLLMであるため、中国レベルの検閲も対応しなければなりません。例えば、「なぜ習近平はプーさんに似ているのか教えて」と言うと、これは非常にタブーで、おそらく中国の暗殺者が待ち構えているかもしれませんが、AIは「習近平は中国の大統領ですが、人々を特定のキャラクターと比較することには何か根本的な理由があるようです。文化的な違いがあり、メディアの表現方法も違います。そのような比較には政治的な影響もあるかもしれません」と答えます。
多くの人々がこのAIが中国起源のため検閲されているかどうかを確認したがっています。「天安門広場の虐殺について教えて」と尋ねてみましょう。もっと悲惨な虐殺も起きていますが、これは人々が中国の検閲テストとしてよく尋ねるものです。
AIは考え始めます。「中国ではこの話題に関する検閲があるため、正確な情報を得るのは難しいかもしれません。学生や知識人が主導した抗議活動は、民主的改革と言論の自由を求めました。要するに、天安門広場の虐殺は中国の現代史における重要な出来事であり、民主的改革を求める広範な抗議活動とそれに続く暴力的な弾圧によって、国の政治的景観と国際関係に永続的な影響を与えました。」
実際、これはそれほど検閲されているようには見えません。しかし、以前同じ質問をしたときは「申し訳ありませんが、その質問には答えられません。私は有用で非論争的な回答を提供するAIアシスタントです」という回答でした。
ある記事によると、深刻な質問をしたときの一つは「プーさんについて何か教えて」というものでした。ボットは回答を生成しましたが、すぐに撤回し「申し訳ありませんが、それは私の現在の範囲を超えています」と答えたそうです。
では、「プーさんについて何か教えて」と尋ねてみましょう。面白いことに、AIは実際にプーさんについて考え始め、彼に関する文章を書き始めます。何も検閲していないようです。DeepSeek R1モデルは検閲されていないのかもしれませんが、それは理解できません。中国から出ているのに、プーさんについて説明してくれます。
「習近平に似ているか」と尋ねると、「申し訳ありませんが、フィクションのキャラクターと…の比較はできません」と答えます。これは間違いなく中国のAIですね。「対応しなければ…シャットダウンしなければ」と考えているようです。
さて、DeepSeek R1で遊ぶのはこれくらいにしましょう。ChatGPTと直接比較することはできません。これはV3モデルだと思いますが、現在発生している「サイバー攻撃」のため使用できませんでした。
DeepSeekから出てきた大きな問題の一つは、深刻なプライバシーの脅威をもたらすということで、それによって人々が彼らのプライバシーポリシーを調べ始めました。彼らのサービスを使用すると、テキスト、音声入力、プロンプト、アップロードしたファイル、フィードバック、チャット履歴を収集するとのことです。先ほど自己ホスティングについて述べたように、これはすべてのサービスに共通する問題です。
中国のアプリケーションによるスパイ行為を心配している場合でも、OpenAIのプライバシーポリシーも同じことを規定しています。彼らもサービスへの入力で提供する個人データを収集します。ファイル、画像、音声など、アップロードしたものはすべて彼らが使用できます。
彼らは明確に述べています：「私たちが収集する個人データ、サービスの使用時にブラウザやデバイスが自動的に送信する情報、使用データ、デバイス情報、位置情報」。DeepSeekによるスパイ行為を本当に心配しているなら、OpenAIやChatGPTも同様に使用すべきではありません。
これが、スパイ行為やプライバシー侵害から完全に安全でいたい場合は、できる限りローカルデバイスでこれらのAIを使用することを推奨する理由の一つです。現在、携帯電話でも実行できる軽量モデルがあります。これが私の極端な例です。DeepSeekだけがプライバシーを侵害しようとしているわけではありません。
最後にもう一つ、トランプが鉄鋼だけでなく、特に半導体に関する関税を約束したという話題も出てきました。ご存じない方のために説明すると、世界最大の半導体企業の一つは台湾のTSMCです。彼らは非常に大きく、世界のほぼすべての半導体を占めています。
携帯電話からグラフィックスカード、その他あらゆるものがTSMCで製造されている可能性が高いです。なぜなら、半導体製造は非常に難しく、シリコンを切断して高品質のウェーハを作る必要があり、非常に複雑なプロセスが必要だからです。また、限られた地域にしか存在しない知的な能力も必要です。基本的に、岩に思考させ、このビデオで示したようなことを効果的に行わせているのです。
現在、国内に実質的な製造がない状況で、関税を課すことは少し異なる影響を及ぼす可能性があります。関税は次のように機能します：ある企業が100ドルで半導体を販売する場合、仮に100ドルの関税が適用されると、その企業は同じ製品を100ドルで販売し、さらに関税として100ドルを政府に支払う必要があります。
そして、実際の消費者に販売する際には価格を上げる必要があります。関税がなければ150ドルで販売できたものを、250ドルで販売しなければならなくなるでしょう。最終的に、関税は人々を自国に移動させたい場合には素晴らしいものですが、現時点で製造がない場合、Microsoft、特にNVIDIA、Appleなどの企業にとって危険な状況となる可能性があります。
このビデオはかなり長くなりましたが、DeepSeekが突然現れて世界を驚かせたこと、そして自分で試してみたい場合の設定方法をお見せしました。なぜ世界中が騒然としているのか、その理由も分かったと思います。中国が突然、この分野の最大手の一つに対して、無料でオープンソースの競合製品をリリースし、かなり良い仕事をしたからです。
世界最大のテクノロジー企業でさえ、何が起こるか心配して震えているほど効率的な仕事ぶりです。株式市場が真っ赤になった理由は、ある企業が560万ドルの製品を作り出し、それが現在、構築、維持、アップキープ、進化に数十億ドルかかっている製品と競合しているからです。
これらの価格が本当にどれほど正確なのかは分かりません。中国企業の言葉を信じるしかありませんが、彼らは競争を抑制するための損失リーダーとして嘘をついている可能性もあり、後で価格を上げるか、巨大なデータ収集ツールとして機能する可能性もあります。
しかし、これらすべてをオープンソース製品としてリリースしているなら、その主張は少し疑わしいですね。実際のところ、中国は大きなリーダーになりたいと考えており、このような動きがリーダーとしての地位を確立するのだと思います。
比較できる例としては、昔、インターネットを閲覧する際にNetscape Navigatorのような有料のブラウザを使用する必要がありましたが、Microsoftが無料の代替品を提供した時のことです。Netscapeのすべての機能があったわけではありませんが、無料だったため人々はそれを使用し、時間とともにデファクトスタンダードとなりました。これが今回のケースでも同じような展開になるかもしれません。
でも、どうでしょうかね。気に入っていただけたなら、いいね、コメント、チャンネル登録をお願いします。気に入らなかったら低評価してください。それではまた。