OpenAI は怯えている(これは不条理だ)

6,216 文字

OpenAI is TERRIFIED (this is absurd)
It's no secret that OpenAI is scared of Deepseek, so much so that they just requested that the US government ban Deepsee...

AIのオープン性をめぐる争いについて考えていきましょう。OpenAIがDeepSeekを恐れていることは秘密ではありません。彼らの「O3」の価格設定や、よりオープンソースへの取り組みへのコミットメント、そして今回新たに出てきたこと——アメリカ政府にDeepSeekをアメリカから締め出すよう要請していることからも明らかです。
ここには考えるべきことがたくさんあります。「AI」の「オープン」の意味から、Samが行っている奇妙な行動、彼がこの業界に対して持っている支配力、そしてDeepSeekチームの驚くほど誠実な運営まで。掘り下げるべきことは山ほどあります。
もし私がDeepSeekのモデルを失い、もっとお金を使わなければならなくなったら、誰かがそれを払わなければなりません。むしろ皆さんに負担してもらいましょう。スポンサーに任せることにします。すぐに戻ってきますので。
ここに集まっている皆さんは、おそらく素早く構築することに慣れていると思いますが、あなたのコードは素早く構築されていますか?それは全く別の問題です。十分なコードを構築していれば、コード自体の構築が遅くなり始めているでしょう。今日のスポンサーはそれを解決するのを手伝ってくれます。
Blacksmithは私のビルドをはるかに速くしてくれました。おそらく皆さんにも同じことができるでしょう。彼らの秘密は、最先端のゲーミングCPUを使用してコードをより速く、より安くビルドしていることです。さらに、それを速くするためにできることをすべて行っています。
彼らはキャッシュを25ギガバイト提供していますが、GitHubは10ギガバイトしか提供していません。彼らはDockerビルドを信じられないほど速くしました。PostHogのようなビルドが約9分から1分27秒に短縮されました。Dockerの部分だけでも。そして、GitHub Actionsに関しては、さらに驚くべき成果を上げています。Nodeが180分(そう、3時間)から2分未満になり、コストも3分の1になりました。
あなたの会社がGitHubの待ち時間に多くのお金や時間を費やしているなら、これは行うべきことです。また、セットアップも難しくありません。文字通り1行のコード変更だけです。カスタムアクションについて心配されるかもしれませんが、彼らはGitHubに既に存在するほぼすべてのアクションをサポートしているだけでなく、GoからRust、Ruby、さらにはZigまであらゆる言語のキャッシュレイヤーのような独自のカスタムアクションも作成しています。
信じられないなら、試してみてください。クレジットカードも必要なく、毎月3,000分を無料で利用できます。Blacksmithのスポンサーに改めて感謝します。今日、sol/blacksmithでチェックしてみてください。
Samよ、なぜ私たちにこんなことをするのですか?新しい政策提案で、OpenAIは中国のAIラボDeepSeekを「国家から補助金を受け、国家によって管理されている組織」と表現し、米国政府がこの組織やその他の中華人民共和国が支援する同様の組織からのモデルを禁止することを検討するよう勧告しています。
この提案が彼らのプラットフォームやサービスへのアクセスを禁止することを示唆しているなら、理論的には理解できますが、それは勧告内容ではありません。100%確実にするために読みたいと思います。
実際、彼らの表現では、「知性の自由」を確保する必要があるとしています。これは、人々の自由を奪おうとする専制的な権力からも、これらのことを実現するのを妨げる法律や官僚制の層からも保護された、AGIにアクセスし、その恩恵を受ける自由を意味するとのことです。
驚くべきことに、世界中で40万人以上がChat GPT-4を使用して、私たち自身が現在できる能力を超えて、アイデアを出し、発見し、突破口を開き、民主的なAIを進歩させています。アメリカは、2030年までに世界的リーダーになることを決意した中国共産党と競争しています。
だからこそ、DeepSeek R1のモデルのような最近のリリースが非常に注目に値するのです。その能力ではなく(R1の推論能力は印象的ではあるものの、せいぜい他のいくつかのアメリカのモデルと同等レベルです)、DeepSeekが同時に国家から補助金を受け、国家によって管理され、そして自由に利用可能であるためです。ユーザーにとってのコストは、彼らのプライバシーとセキュリティです。
これこそ私が探していた絶対的な虚偽です。私が自分のマシンと自分のインフラでモデルを実行している場合、私のプライバシーとセキュリティは侵害されません。OpenAIとは異なり、OpenAIのものを使用すると、Azureとのパートナーシップがあって彼らのもので実行できる場合を除いて、彼らのインフラストラクチャー上で実行する必要があります。
あなたはOpenAIのものを、本質的にあなたのプライバシーとセキュリティを危険にさらさない方法で実行することはできません。これは絶対的な虚偽です。だから私はこれを読みたかったのです。彼らが実際に言っているように見えることを言っているかどうかを確認したかったのです。そして彼らはそう言っています。
彼らは、オープンモデルが本質的にプライバシーとセキュリティが低いと言っています。なぜなら彼らは「中国は悪い」と考えているからです。もし私たちがモデルを使用するために、すべてのプロンプトデータを中国やDeepSeekの実際のビジネスに送信しなければならないとしたら、確かにそれは悪いことでしょう。しかし、DeepSeekのAPIがDeepSeekの使用の主要な方法かどうかさえ分かりません。高い割合だとは思いますが、50%を超えるとは思いません。
DeepSeekが行った魔法は、ほとんどの以前のモデルよりもオープンだったことです。彼らは昨年12の論文を発表しました。彼らが発明したさまざまなこと、彼らがトレーニング方法を改善するために考案したさまざまなトレーニング方法や技術について、特に中国に存在した輸入制限に関してです。
中国のAI企業がアクセスできない大きなものの一つはGPUではありません。A100へのアクセスを制限しているだけではありません。より大きな問題は、それらのGPU間を非常に高い帯域幅で接続する技術へのアクセスを許可していないことです。NVLinkのような技術を使用すると、これらの巨大なGPUを大量に取り、それらの間で非常に高速な転送を行うことができます。
現在、中国ではそれにアクセスできません。そのため、GPU間で転送されるデータ量を最小化するための新しい革新的な方法を構築しなければなりません。そして彼らはそこで本当に驚くべき画期的な研究と革新を行っています。それは彼らが仕事をするためだけでなく、そのような制限なしに他の場所でモデルを作っている人々にも利益をもたらします。
このすべてを無視して、競争相手を排除したいから、そしてより開かれた選択肢があるから見劣りするから「中国は悪い」と言うのは、私は嫌いです。OpenAIにうんざりしています。そしてより重要なことに、彼らがそうではないのに開かれた選択肢であるかのように装うMollaiに疲れています。
ありがたいことに、OpenAIはもはや彼らがオープンであるふりをしていません。彼らの名前だけがそうなっています。しかしMollaiは、彼らがいかにオープンであるかを自慢するのが大好きですが、彼らに巨額のライセンス料を支払わない限り、彼らのインフラ外で彼らのモデルを使用することはできません。そして彼らは面白いことを何もオープンソース化していません。
現在、彼ら自身のインフラストラクチャでMollaiを彼らが行うように高速にホストする方法はありません。それはオープンではありません。DeepSeekは彼らがどのようにトレーニングしたか、どのような技術と革新を行ったかを私たちに示しました。彼らはトレーニングをより速く行うために発明したファイルシステムから、新しいトークンを生成する際のコンテキストサイズを圧縮する革新的な方法まで、多くのことをオープンソース化しました。
彼らが行ったことは本当にクールなことがたくさんあります。Welch Labsによるこのビデオは非常に素晴らしいです。このような種類のことに興味があり、DeepSeekが行っている実際の革新的な仕事と提供していることを見たいなら、このビデオをチェックしてください。このビデオが説明にリンクされていることを確認します。Welch Labsはこれで本当に素晴らしい仕事をしました。
このビデオのおかげで、私はこれらのことについて話す資格が多少あるように感じました。このビデオを実際に理解するために約4回見直さなければなりませんでした。非常に詳細だったからです。しかしDeepSeekが行っていることと、彼らが共有している情報量は実際には信じられないほど素晴らしいものです。
彼らのインフラストラクチャを使うべきだとは言っていません。それに対しては反対するでしょう。すべてのデータを国家主体に送信することは、行うべきことではありません。その点では完全に同意します。しかしDeepSeekを使うためにそうする必要はありません。私たちは皆それから学ぶことができますし、Metaが何ヶ月もLlamaについて一言も言っていない理由があります。
彼らはDeepSeekの成功に基づいて、どれだけ間違ったことをしていたかを理解したので、内部ですべてを再構築しています。この提案で彼らが主張しているのは、特にDeepSeekは中国の法律の下でユーザーデータの要求に応じる義務があるため、このモデルは禁止されるべきだということです。
いいえ、おそらくそのプラットフォームを禁止するか、これらのことのAPIに異なる制限を設けるかもしれませんが、これらのモデルの使用を禁止することは狂気の沙汰です。以前提出された提案はあまりにも不条理だったので、私はカバーさえしませんでした。その提案は、これらのモデルをダウンロードする人に罰金を科すべきだというものでした。それは狂気の沙汰です。
OpenAIのモデルへの言及が、DeepSeek APIを指しているのか、研究所のオープンモデルを指しているのか、あるいはその両方を指しているのかは不明確です。しかしここでは、DeepSeekがCCPによってモデルを操作して害を与えるよう強制される可能性があると明確に述べています。彼らはモデルが禁止されるべきだと具体的に言っているのです。
そしてここでDeepSeekが自由に利用可能であると指摘していることから、彼らが言及しているのはAPIではないと思われます。なぜならAPIはお金がかかるからです。彼らがここで言及しているのはモデル自体、あるいはもしかしたらモバイルアプリかもしれませんが、それについてはどこにも言及していません。
CCPがアメリカの知的財産権の侵害を特徴ではなく欠陥と見なしているという指摘が面白いです。なぜなら、あなたのモデルで著作権を侵害することはできないからですよね、OpenAI?あなたがもはやオープンソースではない理由は、人々がそのようなことを行うことができるからだと言い始めるのでしょうか?あなたがそう言ったら本当に面白いでしょうね。
ここで認識する価値がある最後の良い指摘があります。中国政府とDeepSeekの間に明確なつながりはありません。中国政府が非常に直接的に明らかに関与している多くの大企業があります。Alibabaのように、中国政府の関与がはるかに多い企業については、このような議論をすることができるかもしれません。DeepSeekについてはできません。
中国の法律のため、彼らのAPIはリスクがあるかもしれないと主張することはできますが、これはヘッジファンドのプロジェクトです。DeepSeekの多くの人々は以前は暗号通貨業界の人々で、GPUで何かをしようとしていただけでした。これは政府のプロジェクトではなく、中国による狂気の努力でもありません。
DeepSeekがこれほど優れているとか、彼らが見つけた成功を見つけるとは誰も予想していませんでした。確かに中国も、確かに私たちも、おそらく彼ら自身さえもそうではなかったでしょう。DeepSeekが行った仕事は信じられないほど素晴らしく、彼らがそれをオープンソース化したことは信じられないことです。
DeepSeekは、間違いなく、これまでに作られた最もオープンなAI企業です。DeepSeekは昨年、おそらくAI界の残りの部分を合わせたよりも多くのオープンな作品と研究を発表しました。彼らが行ったことは途方もなく、OpenAIが勝つためには何でもするから、彼らがこのように軽視されるのを見るのは痛いです。
Paul Grahamの引用を見ました。「サム・アルトマンを人食い族の島にパラシュートで降ろし、5年後に戻ってくると、彼はその王になっているだろう」と。彼らが何を意味しているのか分かり始めました。これは良いことではありません。
私はオープンソースの大ファンです。もしあなたがここにしばらくいるなら、おそらく私についてそれを理解しているでしょう。あなたもそうである可能性は十分にあります。「オープンAI」という会社が、これまでに存在した最もオープンなAI企業を破壊しようとしている事実が嫌いです。
DeepSeekの仕事は軽視されるべきではなく、確かにアメリカから禁止されるべきではありません。OpenAIのような企業がここで行っていることを見るのは悲しいことです。私は失望しています。彼らがこの要請の不条理さを再考し、おそらく将来、DeepSeekを破壊すべきものとしてではなく、彼ら自身の仕事を改善する機会として見るでしょう。そしておそらく、ほんの少しだけ、彼ら自身がよりオープンになるかもしれません。
最近、OpenAIが再び私に好感を持ち始めていたのは悲しいことです。O3 miniは信じられないほど素晴らしいモデルで、現在私のお気に入りのモデルです。多くの難しい問題を解決するために使用しています。4.5は正しい方向への大きな一歩です。私は彼らとより多く仕事をしており、彼らは一緒に仕事をするのに素晴らしかったのですが、これは不必要な破壊的な道であり、彼らがそれに進んでいることに失望しています。
これは、Appleの奇妙な法的訴訟を思い出させます。Appleのロゴが付いているという理由で、壊れた電話の基板を輸入して交換する人々を訴え始めたようなものです。これはそれに似ています。法律と人々の特定の行動や世界のものについての理解を絶対的に回避して、あなたが勝つ可能性を少し高くするためであり、私はそれが嫌いです。
少なくとも、あなたのお気に入りのDeepSeekモデルをダウンロードして、将来も持ち続けられるようにすべきです。次回まで、プロンプトを続けてください。

コメント

タイトルとURLをコピーしました