先週のAI #175 – GPT-4o Mini、OpenAIのストロベリー、100万の専門家たち

Last Week in AI #175 - GPT-4o Mini, OpenAI's Strawberry, of A Million Experts
Our 175th episode with a summary and discussion of last week's big AI news!With hosts Andrey Kurenkov ( and Jeremie Harr...

「先週のAI」では、ニュースをお届けし、最新の動向やブレイクスルーをお知らせします。あなたの道を作るすべての見出しを。さて、私たちはそれについて話し合います。それについて、それについて、それについて、それについて、それについて、それについて。最新情報を入手し、遅れをとらないようにしましょう。
こんにちは、最新の先週のAIポッドキャストエピソードへようこそ。ここでは、AIに関する最新の出来事についてお話しします。いつもの通り、このエピソードでは先週の最も興味深いAIニュースのいくつかを要約し、議論します。また、いつもの通り、さらに多くの記事が掲載されている先週のAIのテキストニュースレターを見るために、last week in.にアクセスすることもできます。私はホストの一人、アンドレ・カーパシーです。以前スタンフォードでAIの博士課程を始め、現在は生成AIのスタートアップで働いています。
みなさん、こんにちは。もう一人のホスト、ジェレミー・ハワードです。グラッドストーンAIの共同創設者で、AIの国家安全保障会社です。このポッドキャストで以前に聞いたことがあると思います。毎回ポッドキャストの冒頭で言っているので、これは楽しいですね。本当にメタになってきました。はい、それが私の言うべきことです。
実際には、はい、毎回言うのは変な感じがしますが、新しいリスナーのために背景を提供するのは良いことだと思います。人々が必要とする、または望む情報です。
そうですね、ジェレミー。オーディオの品質を改善できたと思います。録音を少し調整しただけですが、今は別の場所にいます。公平を期すために言えば、それはあなたが井戸の底から参加しているように聞こえるかもしれません。それは公平です。多分エコーが少なくなるように後処理できるかもしれませんが、もしそうだとしたら、それは私が旅行中だからであり、突然オーディオを良くする方法を知らなくなったわけではないことを知っておいてください。
ニュースに入る前に、いつもの通り、いくつかの新しいコメントとレビューを紹介したいと思います。Apple Podcastsで、blasting Fondaから新しいレビューをいただきました。かなりバランスの取れたレビューで、「まさに適量の破滅感」と言っています。これが私たちの主な目標です。そのレビューに感謝します。
YouTubeでもいくつかのコメントをいただきました。いつも通り、フィードバックに感謝します。地政学をどれだけ取り上げるかについてのポイントに関するコメントがありました。少し反論して、取り上げることは良いことだと言っていますが、私たちはそれを取り上げ続けます。ただし、少し少なめにします。
また、先週の主な収穫は「I knew gonna come back yes yes」だったと指摘した人もいました。私たちの奇妙な冒頭のジョークでしたね。奇妙な相互作用でした。
はい、時々話し始めて、文がどのように終わるかわからないという経験をしたことがありますか。マイケル・スコットのように。そして、ただ続けて、「ああ、これは本当に私を困らせている」と思いながらも続けてしまう。今もそうしています。
前回のエピソードで何を言ったか忘れましたが、特に3〜4人の子供を持つ母親の側にいると言ったと思います。それについて奇妙なコメントがあったからです。とにかく、私は依然として母親を支持しています。それは価値があることです。
はい、まだそうです。
さて、コメントについては十分です。いつも通り、言及しなくても見ています。レビューやコメントをくれる皆さんに感謝します。
さて、ニュースに移りましょう。いつも通り、ツールとアプリのセクションから始めます。
最初のニュースは、先週の大きなストーリーの一つです。GPT-4o Miniです。OpenAIからの最新リリースです。
名前が示すように、これはGPT-4oのより小さく安価なバージョンです。彼らの最小のモデルのティアを置き換えることになります。GPT-3.5 Turboが最小のモデルでしたが、今はこのGPT-4o Miniモデルに実質的に置き換えられます。100万入力トークンあたり15セントで価格設定されます。とてもお得ですね。
はい、GPT-3.5 Turboよりも60%安いです。Anthropicの最小モデルであるClaude Haikuよりもかなり安いです。Claude Haikuは100万入力トークンあたり25セントだと思います。これは本当に価格競争の底への競争のダイナミクスを示しています。
はい、GPT-4oと同等で、GPT-3.5 Turboよりも優れているようです。また、今年何度も見てきたように、主要な研究所が、パフォーマンスを印象的な程度に維持しながら、モデルを最小化し、より小さくする方法を見つけていることを示しています。本当に重要な発表です。
はい、そして明らかに、背景で起こっていることがたくさんあります。OpenAIは深い技術的な報告書を出していません。他の研究所と同様に、長い間そうしていません。しかし、ここには注目すべき興味深いことがたくさんあります。
まず、経済的な側面です。100万入力トークンあたり15セント、100万出力トークンあたり60セントで価格設定されています。これがいかに安いかを見てください。以前のフロンティアモデルよりも1桁以上手頃になっています。GPT-3.5 Turboよりも60%以上安いです。
そのような数字を見ると、ChatGPTスタイルの単純な対話でこのモデルからお金を稼ぐことは不可能だということがわかります。100万出力トークンあたり60セントというゾーンに入ると、ほとんどのユースケースが一種の推論時間の推論を含むことが保証されます。つまり、1つのクエリに1つの応答を得るだけでなく、モデルに複数回クエリを行って答えを洗練し、繰り返すようなものです。
私たちがポッドキャストで何度も話してきたような、エージェントに向かっていくグレーゾーンにますます近づいています。推論のコストが下がり続けるにつれて、まさにそれが起こっています。
これは、OpenAIがこの発表の最後に置いている一種の小さな声明の一部です。彼らはサム・オルトマンの言葉を借りて、「測定するには安すぎるインテリジェンス」の世界に向かっていると言っています。それが目標です。
そして、それは興味深いものがすべて、OpenAIのような会社になるためのROIがすべて、最終的にはゼロショットの顧客クエリへの応答よりも、推論時間の推論のようなものに見えることを意味します。
また、このモデルがどれほど小さく、安価であるにもかかわらず、印象的な能力を持っていることを強調しました。MLUで82%を達成し、LMシステムリーダーボードのチャット選好でGPT-4を上回っています。
LMリーダーボードに行くと、どのモデルが人々に好まれるかについてのヘッドツーヘッドがあります。彼らはそこでELOのような評価システムを使用しており、基本的にチャットベースでどのモデルが最も良いパフォーマンスを示すかについてのユーザーの意見を比較しています。
このモデルは、絶対的なフロンティアモデルと非常に競争力があるようです。これは、アンドレがあなたのポイントを指摘したように、私たちが小さなモデルが以前はずっと大きなモデルが行っていたことを行うのを見ていることを示しています。山を動かすようなものです。
これは、スケーリングが壊れているという意味ではありません。むしろ逆です。OpenAIのリリースサイクルは、実際にはすべてのフロンティア研究所がこのように機能しています。彼らは大量のコンピュートを集約し、それを巨大な訓練実行に使用して、GPT-4のようなものを生成します。
そして、その後の1年ほどは、そのモデルを様々な用途に活用します。知識蒸留のようなことも含まれます。つまり、その大きなモデルを取り、より効率的でコンパクトな小さなモデルにすべての知識を蒸留するより巧妙な方法を見つけることです。
これにより、次の訓練実行でさらに効率的にさらに多くのコンピュートを使用できる学習を適用できます。これが、私たちが能力の指数関数的な増加を見ている理由です。より多くのコンピュートに、これらのモデルをコンパクトにし、より効率的にするためのすべての学習が加わっているからです。
パフォーマンスについては多くの素晴らしい情報がありますが、はい、私はこれが推論時間のコンピュートに関する経済学に本当に興味深い変化をもたらすと思います。
そうですね。予想通り、これもまた高速です。GPT-3.5 TurboやGPT-4oの約2倍の速さだと言っています。
少し文脈や視点を与えると、100万出力トークンあたり60セントと言いました。100万出力トークンは約750,000語に相当します。
ChatGPTの有料サブスクライバーは月額20ドルを支払っています。その20ドルで、推論出力のコストを完全に活用するか、利益を上げるためには、約2500万語を出力する必要があります。
もちろん、無料でGPT-4にアクセスできます。しかし、これらの価格でどれだけのことができるかを考えると興味深いですね。
また、少なくともカジュアルユーザーにとっては、これが単に質問に答えるために使用されているものではないことを完全に示していると思います。これは、このために構築されている対話タイプではありません。
明らかに、すべてのクエリに大量のトークン、大量のコンピュートが dedicatedされているに違いありません。そうでなければ、ここでの経済性が機能する他の方法はありません。本当に興味深いですね。
また、OpenAIがGPT-4o Miniに加えて、規制産業を扱う企業顧客向けの新しいツールも発表したことも言及する価値があります。これらは、コンプライアンスなどが必要な、より細かい事項です。
タイムスタンプ付きの対話、ChatGPT EnterpriseでのデータをAuditする能力など。これは、本当にお金を稼ぎたいならEnterprise向けに行くという、そのようなステップの一つです。規制とコンプライアンスに対処するために、これらのより細かい事項が必要です。
おそらく、OpenAIが本当にお金を稼ぎたいのはChatGPT Plusではなく、このような事柄だと思います。
はい、ちなみに安全面では、最後にメモがあります。約70人の外部専門家が、心理学や社会心理学、誤報などを含む様々な分野でGPT-4oをテストし、潜在的なリスクを調べました。
彼らは準備スコアカードを持っており、これは今年初めに発表した準備フレームワークと一致すると思われます。これは後で公開される予定ですが、まだ出ていません。セキュリティや安全面に興味がある場合は、それを見守る価値があるかもしれません。
次は、Hyper 1.5です。SoraとRunwayに挑戦する新しいAI生成モデルです。
これは、ロンドンを拠点とするHyperスタートアップからの新しいテキスト動画モデルです。このスタートアップは元GoogleのDeepMind研究者によって設立されました。これは彼らの以前のモデルのアップグレードです。
これで、4秒の生成から8秒のクリップに移行できます。また、完全にHDになりました。以前は解像度が少し低かったです。
はい、テキスト動画空間にまた別のプレイヤーが登場しました。正直に言って、私はHyperについて知りませんでした。本当にこの分野がどれだけ忙しくなっているかを示していますね。
そうですね、あなたと同じく、私もこれを初めて聞きました。彼らは150万人以上のユーザーをプラットフォームに取り込んだと主張しています。これは驚くべきことです。
人々はよく生成AIのユースケース、特により投機的な側面について話します。特に、ChatGPTのような同じレベルの実証済み市場価値をまだ持っていない多モーダルな領域についてです。
そうですね、150万人のユーザー。その背景にある詳細を知りたいところです。シリコンバレーには、急激に成長した後に急激に崩壊する有名な例がたくさんあります。昔のSocial Camなどのように、垂直に成長するけれど、ユーザーを引き付けておくだけの価値がない会社です。
これは単なるウェイトリスト爆発の状況で、実際の価値はないのかもしれません。しかし、そうでない可能性もあります。8秒の動画は短いですね。4秒バージョンから150万人のユーザーベースを構築したと思われます。8秒バージョンは今回初めて発表されたものですから。
思いつくのは、ストック動画のようなものです。Pexelsなどと競合する可能性があります。それが彼らの狙いかもしれません。
ええ、確かに印象的です。明らかに、VentureBeatの記事に埋め込まれた動画があります。かなり良いですね。赤毛の女性が映っていて、髪が風になびいています。背景に雲があります。それがポイントだと思います。本当に印象的です。
はい、そして他のこの分野の参入者、例えばLumaと同様に、まだSoraのようなクオリティには達していないようです。私が見る限り、まだAIが明らかに分かります。
この会社が4ヶ月前の3月初めにステルスモードから出てきたのは興味深いですね。1380万ドルのシード資金を調達しています。ビデオ生成モデルのトレーニングにしては適度な金額ですが、巨額ではありません。
これが、テキスト動画の分野で支配権を争う会社の一つとして残るかどうか、興味深く見守る必要がありますね。今や3、4社ありますか?たくさんありますね。
彼らの主張も非常に似てきています。これらのテキスト動画の発表を読むたびに、AGIのセクションを探さなければならないような気がします。Soraが最初に公に主張したように、ビデオ生成と世界モデル開発の間にリンクがあると主張しています。
これは、テキストデータでも既に起こっていると主張する人もいます。しかし、ここでは、これは世界理解に向けた興味深い一歩であり、現実の感情的・物理的要素を複製できるAGIのようなものを作り出すものだと主張しています。
彼らは、製品にいくつかの欠点があることを強調しています。ちなみに、年間契約で月額24ドルです。実際にはかなり高額ですね。
明らかに、ビデオのぼやけや、被写体や物体の詳細の過度の使用など、いくつかの問題があるようです。プロンプトに対する感度が高すぎるようです。これは必ずしも良いことではありません。
しかし、やはり別のプレイヤーですね。彼らがどのように競争できるか見てみましょう。再び、この分野は商品化のリスクがあるように思えます。実際にどこに価値が集まるのか、どの会社が時の試練に耐えられるのか、全く明確ではありません。しかし、ここにいます。
先週、テキスト動画の分野の別の参入者であるOdysseyについて取り上げたことを思い出しました。彼らはハリウッドグレードであり、照明などに対する追加の制御があると主張していました。
はい、ビジネスケースのいくつかの進化がすぐに起こると思います。競合他社がたくさんいて、まだあまり収益が上がっていないようですから。
ライトニングラウンドに移りましょう。まず、AnthropicがAndroid用のCloudアプリをリリースしました。
これは、ユニークなChatGPTタイプのチャットボットであるClaudeとチャットする機能です。Claude 3.5 Sonnetに無料でアクセスでき、ProまたはTeamサブスクリプションに加入していれば追加機能も利用できます。
Anthropicが商業化を進め、ユーザーを増やそうとしている、つまりOpenAIに追いつこうとしているというストーリーです。
はい、そして興味深いことに、主要な機能の1つは、デバイス間でClaudeとの会話を同期する機能のようです。また、リアルタイムの画像分析のために写真や動画をアップロードすることもできます。
クロスプラットフォームの部分は興味深いと思います。特に、より多くのエージェントのようなモデルの世界に入っていくにつれて、対話の一貫性や連続性が欲しくなります。ある部屋から別の部屋に移動しても、何かが自分についてくるような感覚が欲しいかもしれません。または、何かが自分についてくるという感覚は少し恐ろしいかもしれませんが、とにかく…
より自然なユーザー体験のためには、これが重要な要素になるかもしれません。
ちなみに、iOSアプリは2ヶ月前の5月に最初にリリースされましたが、彼らの言葉を借りれば「冷ややかな」反応だったようです。全世界で約15万回のダウンロードがありました。
これは、ChatGPTの初期リリースと比べるとかなり悪いですね。ChatGPTは最初の5日間で50万回ダウンロードされました。
はい、Anthropicは遅れを取り戻そうとしているようです。Claude 3.5 Sonnetが現在市場で最高のパフォーマンスを示すモデルである、この狭い窓があります。これはすぐに変わるかもしれませんが、誰にもわかりません。
優位性がある間に、それを押し進めるのは彼らにとって素晴らしい時期だと思います。AndroidアプリのClaudeをリリースするのはいいタイミングですね。
ちなみに、curiosityから調べてみました。iOSのChatGPTは生産性カテゴリーで1位です。100万件のレビューがあります。Claudeは生産性カテゴリーで38位で、4800件のレビューがあります。
はい、彼らは少し遅れを取っていますが、このような新製品のリリースでは非常に速く動いていますね。
次は、GoogleのVidsについてです。Gemini AIを使用して動画プレゼンテーションを作成することができます。
これは、Google Workspaceのラボセクションにある新しい生産性アプリです。ドキュメント、スライド、ボイスオーバー、ビデオ録画をタイムラインにドロップして、プレゼンテーションビデオを作成できます。
厳密に言えば、ビデオを生成するわけではありません。ユーザーの指示に基づいてGeminiがプレゼンテーションを生成し、それから…はい、現在プレビュー中なので、Workspaceサブスクリプションが必要ですが、将来的にはより広くロールアウトされると思われます。
はい、彼らが強調している主要な機能がいくつかあります。Geminiに自動的にストック映像を挿入させたり、ビデオのスクリプトを作成したり、さらにはAIボイスオーバーを提供したりすることができます。
かなりの数のビデオを制作する者として、この分野への侵食が始まっているのを見ています。これらのものを作成する能力…
これは、SoraやそのようなZroducts。私達が話してきた他の製品とは異なり、よりピースミールなアプローチです。これは、ビデオ制作プロセスの一つのサブセットを一度に自動化しているようなものです。
もう一つのストーリーは、YouTube Musicのサウンド検索機能がロールアウトされ、AIによる会話型ラジオのテストが行われていることです。
YouTube Musicは、ご存じない方のために、GoogleのSpotifyタイプのアプリです。彼らは現在、サウンド検索機能をリリースしました。再生中の曲の短いクリップを録音して検索できるようになりました。これは他のプラットフォームでは既にありましたが、このプラットフォームにはありませんでした。
そして、Premiumサブスクライバー向けに、AIが生成する会話型ラジオのテストを行っているようです。聞きたいものを説明することで、カスタムラジオ局を作成します。SpotifyのAI DJに少し似ているようですね。
はい、その通りです。YouTube Musicでは、「ラジオを開始」という機能があります。ラジオとは、曲やアーティスト、その他に基づいてプレイリストを作成することです。
ここでは、プロンプトを入力するだけで、どのような方法でも音楽をリクエストでき、雰囲気やその他のものを求めることができ、それがプレイリストに解釈されるようです。
この場合、AIが生成する会話型ラジオと言っていますが、これは同じことを意味しています。基本的に、会話的な入力を与え、出力はただのプレイリストになります。
私は完全に誤解していました。これは記事の最初の文だったので、全体の解釈を間違えてしまいました。とても混乱していました。
ああ、そうですね。理解できます。
ちなみに、SpotifyのAI DJはある意味でそうですね。AIが生成した声のDJがいて、曲と曲の間で話しかけてきます。これはそこまでではありませんが、チャットボットにプレイリストの説明を求め、そのプレイリストを生成するようなものです。
はい、音楽ストリーミングサービスにAIをより多く統合する例ですね。Spotifyが始めたことと似ています。
そうですね、ある意味でサービスになっていますね。本当に検索パラダイムを超越しています。コンテンツをその場で生成するにはどうすればいいでしょうか。
先ほどの推論時間と推論コストに関する会話に戻りますが、これは100万トークンの出力、または音楽や動画の同等のものを生成するのに60セントしかかからない場合に始められるようなことです。
本当にクールですね。いつかYouTubeでライブストリーミングではなく、ライブ生成のようなものを見ることになるかもしれません。
次はアプリケーションとビジネスのセクションに移ります。まずはOpenAIについてです。彼らは「ストロベリー」というコードネームの下で新しい推論技術に取り組んでいるようです。
これはかなり秘密裏に進められているようです。ロイターからの報道があり、彼らは情報に詳しい人物と話し、内部文書を見たようです。
詳細はあまりわかりませんが、本質的にこれはよりインテリジェントなシステムにつながる内部プロジェクトのようです。昨年、プロジェクトQについて似たような話がありましたね。内部で、より高いレベルで推論するようAIをトレーニングしていました。
これもほぼ同じ線上にあります。彼らが何をしているのか正確にはわかりませんが、高度な推論能力を提供するために新しいものに取り組んでいるようです。
はい、実際に、一部の人々によると、これは以前QARとして知られていたプロジェクトの別の内部コードネームのようです。
以前にそれについて詳しく取り上げましたが、この会話の目的のために少し振り返る価値があります。OpenAIが内部で「ディープリサーチ」と呼んでいるものを達成するのが目標です。
これは、単にパターンマッチングをするのではなく、人間のようにより複雑な問題を解決できるように、システム的に考える能力を持つことです。
明らかに、OpenAIは開発者や他の人々に対して、より高度な推論能力を持つ技術をリリースする直前にいるという信号を密かに送っているようです。
4人の人物から聞いたところによると、会社のピッチを聞いたそうです。そのため、このいわゆる「ストロベリー」プロジェクト、またはQARと呼ぶかもしれませんが、そのプロジェクトの発表が差し迫っているかもしれません。
ここでは、これがどのようなものかについていくつかの情報があります。「自己教師推論者」というこの方法があります。これはQARの重要な部分でした。
基本的に、AIモデルが自分自身のトレーニングデータを繰り返し作成し、レビューアーモデルにそのデータを評価させることで、より高いレベルのインテリジェンスへと自己向上させることができます。
これは、イリヤ・サツケヴァーが先駆けとなり、OpenAIでリードしたものです。これは、彼らがMath GenとCode Genチームを統合してこのプロジェクトに取り組んだ時のことです。「Let’s Verify Step by Step」という論文がこのチームから出されたようです。
基本的に、計算の中間推論段階を検証し、検証者を使ってそれらの中間段階が正しいことを確認するというアイデアに基づいています。数学的問題解決に焦点を当てていたようです。なぜ数学かというと、正解が既知の真実であり、検証可能だからです。
そのため、検証者は推論チェーンの特定の推論ステップが正しいことを証明できます。これは良いトレーニング信号を提供します。
そのような数学的推論パラダイムでモデルをトレーニングすると、その推論能力の重要な側面が根付きます。そして、そのモデルをより広範な設定、より一般的な言語モデルの設定に適用すると、通常の言語モデルが陥りがちな論理的な罠に悩まされることがないかもしれません。
これは非常に重要です。なぜなら、モデルが自分自身をトレーニングし、良い基盤を持つ自身のトレーニングデータを生成するという自己学習のダイナミクスの基礎があるからです。これはデータに制限されない方法です。トレーニングがデータの壁に当たっているという話がたくさんありますが、これはその一部を解決する方法かもしれません。
明らかに、OpenAIは内部でこのQARまたはストロベリーモデルかもしれないモデルをテストし、Math Datasetで90%以上のスコアを達成したようです。これは大きなことです。私が知る限り、それに近いスコアを達成したのはGeminiだけで、それも数学データセットに微調整されたものでした。
ここでは、より広範な能力のセットの副作用として、一般的な目的のモデルがそれを行っています。しかし、トレーニングの詳細については何も知らないので、それがどのように対応するかは不明確です。
ここでは本当に興味深いことがたくさん起こっています。明らかに、大きな目標は長期的な課題、深い研究やシステム的思考が必要な課題です。これはOpenAIが向かっている方向です。
これは彼らの全体的な戦略と一致しています。本質的に、AIにAI研究を自動化させることでAI研究を加速させ、hopefully安全性研究も自動化することです。しかし、私が話した内部告発者の多くは、OpenAIが正しいことをするという点では楽観的ではありません。
しかし、確かに能力の面では、OpenAIでは非常に速く前進しているようです。
そうですね、先週カバーした話題と密接に関連しています。OpenAIが社内の全体会議で公開したランキングシステムについてです。人工知能の5つのレベル、5段階がありました。
レベル1は現在の状況です。チャットボット、AI会話言語。そしてレベル2は推論者と人間レベルの問題解決です。おそらく、彼らはストロベリーでそれを達成しようとしており、近づいているのでしょう。
レベル3はエージェント、レベル4は発明を支援できるAI、イノベーターです。これは、AIを改善するための研究を行うAIという長期的な目標です。
彼らがこのようなランキングシステムを選び、このプロジェクトでレベル1からレベル2に到達しようとしているのは理にかなっています。
また、これを知ることができたのは、OpenAIが社内の全体会議でこれを発表したからだということも注目に値します。明らかに、彼らはこのプロジェクトのデモを行い、新しい人間のような推論スキルを持っていると主張したようです。これはブルームバーグの報告によるものです。
OpenAI、特に最前線の研究所で働く多くの人々と話をすると、これは時間とともに変化する可能性があると考えているようです。必ずしも同じレベルの公開性が続くとは限りません。OpenAIでさえ、時間とともにサイロが出現すると予想しています。かなり秘密主義の文化を発展させているからです。
そのため、サムとグレッグに忠実な人々が、非常に忠実な少数のグループによってのみ監督されるサイロに設置される可能性があるという感覚があります。なぜなら、彼らはかなりの数のリークを経験しているからです。
ここでこのフラグを立てておきたいのは、今後数ヶ月間、同じレベルの公開性を見ることはないかもしれないということです。とにかく、これはOpenAIの内部の動きについて、非常に高いレベルの可視性を持っている珍しい例です。非常に曖昧ではありますが。
次は、イーロン・マスクとxAIに関する話題です。メンフィスで巨大なxAIスーパーコンピューターを構築する狂気の急ピッチについての内部事情です。
先週、イーロン・マスクとxAIがOracleと協力する代わりに、約100億ドルで独自のスーパーコンピューターを構築する計画があるというニュースを取り上げましたね。この記事では、その計画がどのように進んでいるかについて、興味深く、少しスパイシーな詳細に踏み込んでいます。
スーパーコンピューターはメンフィスに建設される予定で、その契約は非常に迅速にまとまったようです。3月に交渉が始まり、市の当局者たちはxAIとの契約を迅速に承認しようと努力しました。
この記事では、それが少し早すぎたかもしれないと指摘しています。例えば、メンフィス市議会からの反発があります。議員のパール・ウォーカーはForbesに対し、彼女の選挙区民の間に「ヒステリー」があると述べました。水や電力供給に何が起こるかを恐れているのです。
正直に言えば、これはとても合理的な懸念です。このプロジェクトは膨大な電力を使用すると予想されますからね。
マスクが「コンピューティングのギガファクトリー」と呼んでいるこのプロジェクトの建設はすでに始まっています。地方政府レベルでこの契約がどのように受け止められているかについて、多くの詳細がここにあります。
はい、これは多くの企業が直面する「レッドテープのパラドックス」の典型的な例です。アメリカ国内で能力を構築したいのに、様々な障害に直面するのです。
国家安全保障の文脈でもこの話をしました。OpenAIのサム・アルトマンがUAEに目を向け、データセンターを設置しようとしているのはそのためです。彼らが必要とするようなデータセンターの大規模な構築を処理できる電力インフラがないからです。スターゲートクラスターのようなプロジェクトのためにね。
これはその裏側です。国内でこれをしようとするとどうなるかを示しています。多くの場合、健全な根拠に基づく反発があります。小さなコミュニティには余分な電力がないのに、ここに来て…
いくつかの統計を取り上げる価値があります。xAIは最初に最大50メガワットの電力を必要とします。参考までに、1メガワットは約1000キロワットで、それはおおよそ1000世帯分です。1世帯は年間約1キロワットを使用します。
xAIは最終的に最大150メガワットの容量を要求しています。この記事では言及されていませんが、ここから大まかな計算をして、およそのGPU数を推測することができます。
大まかに言えば、冷却やデータセンター運用に必要な他のインフラを考慮すると、1つのGPUは約600キロワットのエネルギーを消費します。つまり、おおよそ1つのGPUは1世帯と同じくらいのエネルギーを使うことになります。
50メガワットバージョンを見ると、約30,000台のH100 GPUを意味します。そして150メガワットまで拡張すると、100,000台のH100 GPUになります。これはかなりの数です。
比較的小さなコミュニティにとって、10万世帯分のオーダーの電力消費は大きな問題です。これが反発の一因です。また、これらのシステムを冷却するために必要な膨大な水の需要も問題です。重大な影響があります。
記事によれば、現在使用している水源の1%か2%の水を使用すると思います。
つまり、ある種の判断をしなければなりません。明らかにこのコミュニティにとって大きな経済的利益があります。高品質の仕事がたくさん来るでしょう。データセンターの建設には多くのメンテナンスと維持が必要です。
しかし、これらのコミュニティに何が起こるのかという疑問が生じます。彼らには全面的な関与を行う権利があるのでしょうか?確かに、このエコシステム内には「私は相談されなかった」と言う人々がいます。これはすべてメンフィス市議会とxAIの間で、かなり秘密裏に行われたようです。
また、NDA(非開示契約)の下で行われたようです。これにより、おそらく人々は取引の詳細について、より広いコミュニティや都市全体と関わることができなかったのでしょう。
はい、これは米国が航行するのが非常に難しい問題です。現在、外国直接製品規則という手段を持っています。
今、日本のTokyo Electronや、オランダのASMLのような企業が、国際的な半導体サプライチェーンの重要な部分を担っています。彼らに対して「あなたの製品に米国製の部品が含まれている場合、特定のエンドユーザーに出荷できない」と言えるのです。
これは米国政府が適用できる非常に広範な管理レベルです。現在まで、ASMLやTokyo Electron、つまり日本やオランダに対してこれを適用していません。外交的に対処しようとしているのです。
オランダと米国の間には緊張した綱引きがあります。オランダは国内チャンピオンであるASMLが中国市場へのアクセスを増やすことを望んでいますが、米国はそれを望んでいません。
そこで今、説得ゲームが始まっています。企業がFDPR(外国直接製品規則)の適用を望んでいないのは明らかです。日本やオランダからの反発を引き起こし、協力が止まることを恐れています。
これは本当に難しい課題です。ASMLが中国に出荷する可能性のある技術は、非常に高度なリソグラフィ装置で、中国の半導体サプライチェーンの国内化を大きく前進させる可能性があるからです。
はい、多くの動く部分がある大きな話です。
最後の話題は、OpenAIの内部プロセスに関するさらなるドラマです。タイトルは「OpenAIは違法に従業員が安全性リスクを表明することを禁止した、内部告発者によると」です。
これらの内部告発者は、証券取引委員会(SEC)に申し立てを提出しました。申し立てによると、OpenAIは従業員が技術の潜在的リスクについて規制当局に警告することを禁止していたとのことです。
情報源によると、従業員が署名しなければならない契約は、内部告発者への連邦補償の権利を放棄し、連邦当局に情報を開示する場合はOpenAIの事前の同意を得る必要があるというものでした。これは、内部告発者が匿名で、報復の恐れなく情報を明らかにすることを保護するための連邦法や規制に違反しているようです。
もちろん、これは以前に明らかになった情報の後に来ています。従業員が会社を去る際に署名しなければならない非常に厳しいNDAに関する情報です。基本的に、OpenAIについて二度と否定的なことを言えなくなるというものでした。
明らかに、OpenAIが従業員に課したものはNDA以上のものがあったようです。これも、テクノロジーセクターで通常行われているものと比べてかなり攻撃的で、非伝統的に見えます。
はい、私たちも多くのこのような契約に署名してきましたが、自分の会社の問題を指摘できなくなるようなNDAに署名するのは普通ではありません。確かに将来的にもです。
公平を期すために言えば、OpenAIは今年のスキャンダルの一つで窮地に立たされた後、これを撤回せざるを得ませんでした。彼らが方針を変更する兆候はありませんでした。これについて知っていたかどうかの否定がありましたが、私には非常に信じがたいように思えます。
ここでの根拠は、これらの退職金や機密保持契約が、懸念を提起した労働者に対する罰則につながる可能性があるということです。この手紙は、これが内部告発者保護だけでなく、AIの企業が安全に技術を開発することを要求するホワイトハウスの行政命令にも違反する可能性があると主張するでしょう。
この手紙はSECに送られています。ジャーナリストがFOIA(情報公開法)のようなメカニズムを通じて取り上げたか要求したものだと思います。
彼らは、SECがOpenAIに対し、機密保持条項を含むすべての雇用、退職金、投資家契約を提出するよう要求すべきだと主張しています。また、SECがOpenAIに対し、SEC法の下で「不適切な各契約に対して」罰金を科し、過去の慣行が引き起こしたと彼らが主張する「萎縮効果」を是正するよう指示すべきだと言っています。最後に一つ注目すべき点があります。OpenAIのスポークスパーソンが声明を出し、「私たちはこの技術についての厳密な議論を信じています」などと言っています。ある時点で、これだけ多くの内部告発者がいると、「はい、まあ…」という感じですね。公的な声明はありますが…
ここで興味深いのは、アイオワ州の共和党上院議員チャック・グラスリーの発言です。彼はこの記事で引用されており、「OpenAIの方針と慣行は、内部告発者が発言し、保護された開示に対する正当な補償を受ける権利に萎縮効果を与えているように見える」と述べています。
「連邦政府がAIの一歩先を行くためには、OpenAIの機密保持契約を変更しなければならない」と彼は言っています。私はこれに完全に同意します。はい、グラスリー上院議員はここで問題の核心を指摘していると思います。より多くの透明性が必要です。OpenAIがここでこのようなゲームをするには、賭け金が高すぎます。
はい、これは法的措置ではありませんが、規制上の大きな一歩です。SECとその権限をこのプロセス全体に関与させることになります。
これで、いつものようにOpenAIからの刺激的なドラマでこの週を締めくくります。今週のラストウィークインAIのエピソードをお聞きいただき、ありがとうございました。
いつも通り、記事やテキストニュースレターはlast week in.で見つけることができます。私たちのメールアドレスはエピソードの説明にあります。YouTubeでコメントを残すこともできます。
もちろん、ポッドキャストのレビューをしていただき、知り合いの皆さんに共有していただければ幸いです。しかし、それ以上に、聞き続けていただき、このエピソードを締めくくるAI生成の歌を楽しんでいただければと思います。
先週のAI[音楽]では、ニュースをお届けし、最新の情報を提供します。今日の動向とブレークスルー、あなたの道を作るすべての見出し。私たちはそれについて話し、話し、話し、話し、話し、話します。テキストを更新し、最新のAIストーリーで遅れをとらないようにしましょう。ラストウィークインAIがあなたを刺激します。ブレークスルーからトレンドまで、私たちはあなたを鼓舞します。さあ、参加して、深く潜りましょう。リズムと共に、あなたを立ち上がらせます[音楽]。研究室からあなたの耳へ、私たちが共有する旅です。珍しいリズムでコードを分析します。すべてのバイト、すべての行を、私たちは分解します。AI世界で、あなたが勝利するのを助けます。プラグインして、充電して、カーブの先を行きましょう。あなたが本当に価値を感じるであろう洞察とレッスンと共に[音楽]。

コメント

タイトルとURLをコピーしました