AIの進化が加速：OpenAIのスターゲート、Deepseek R1、その他のAIニュース

19,465 文字

AI開発は続々と進展しており、5000億ドル規模のプロジェクト「スターゲート」が発表されました。このプロジェクトは、がんを過去のものにすることを目指しています。OpenAIの関与、資金提供者について説明しますが、驚くべきことに政府からの出資は0ドルです。さらに重要なのは、イーロン・マスクの反応についても見ていきます。なぜなら、誰かが怒りを爆発させたからです。
競合他社も手をこまねいているわけではありません。Anthropicのディオはエキサイティングな2025年を予告し、Googleは素晴らしい新モデルを発表しましたが、またも奇妙な名前を付けました。さらにDeepseekは、OpenAIの最高モデルを凌駕するケースもあるオープンソースモデルを公開し、これは無料でローカル実行が可能です。つまり、あなたのコンピュータやスマートフォンで動作するということです。
未来は既に到来しており、新しいAIツールの概要をお伝えします。さらに、文字通り脳を読み取ることができるAIの話題も。AIは私が「It’s AI for humans」と言いそうなのを予測できるでしょうね。AIは不要ですよ、ケビン。あなたがそう言うのは分かっていましたから。
これは大きなAIニュースの週でした。このショーのリスナーや私の母も知っているように、最大のニュースはプロジェクト・スターゲートの発表です。古いSFムービーのような名前ですが、これは5000億ドルの投資を約束する、OpenAI、Oracle、SoftBank、アブダビ投資グループの共同事業です。
中東から資金が投入されてAIインフラストラクチャプログラムを作るという噂は以前からありました。これは基本的にAIモデルを実行するためのデータセンターを構築するものです。大統領が出てきてこれを称賛し、サム・アルトマン、ラリー・エリソン、SoftBankのCEOの3人全員が、新大統領なしではこれは実現不可能だったと述べました。
サム・アルトマンの最初の反応と、彼が言ったことを聞いてみましょう。サム・アルトマンが関わっているのは驚きではありません。彼はAIの追求のために何兆ドルも調達したいと考えていましたが、ここに5000億ドルが確保されたということです。後ほど、これに疑問を投げかける人々の意見も見ていきます。
全員が新大統領の取り組みなしでは実現不可能だったと主張し、発表のタイミングは非常に興味深いものでした。このプロジェクトは数ヶ月、おそらく数年にわたって準備されてきたことは明らかです。新政権の下での予測に基づいていたとも言えますが、政治やタイミングよりも、この計画が国にとって何を意味するかの方が興味深いですね。
私たちはAIで勝利したいと考えています。マンハッタン計画と比較する人もいれば、インフレ調整後の金額で見ると、国家高速道路システムに匹敵する規模だと指摘する人もいます。しかし、これは公共事業プロジェクトではありません。ホワイトハウスで発表されたからといって、政府が実行するわけではなく、単にインフラ構築のための規制緩和を支援するということです。
これは大きな混乱の原因になっています。新政権発足2日目に大統領が発表したため、政府のプロジェクトのように聞こえますが、そうではありません。これは民間企業のプロジェクトです。もしこれが本当のマンハッタン計画なら、Meta、Google、Anthropicなど他の大手AI企業も参加しているはずです。
The Informationは昨年半ばに、テキサス州アビリーンでのデータセンター建設に関する記事を掲載しました。AIモデルが大きくなればなるほど、より多くのコンピュート能力が必要になります。これらは巨大なデータセンターを建設し、より多くのチップを設置してAIモデルを実行する場所になります。高速道路システムの建設と同じように、より大きなAIモデルを実行する場所を作るのです。
ホワイトハウスでのサム・アルトマンの発言を聞いてみましょう。「アメリカでこれができることを嬉しく思います。これは時代の最も重要なプロジェクトになると思います。Masaが言ったように、AGIがここで構築され、数十万の雇用を生み出し、新しい産業の中心地を作る。大統領なしではできませんでした。エキサイティングなプロジェクトになり、皆さんが話したような素晴らしいことができると思います。アメリカでできることは素晴らしいことです。ありがとうございます。」
Oracleのラリー・エリソンは、このシステムががんを治療できる可能性について詳しく説明しました。採血によりAIを使って血流中のラジカルを詳細に分析し、血流中のがんを特異的に標的とする治療法を設計し、48時間以内に個別化されたワクチンを提供してがんを根絶できるというのです。
以前、黒いタートルネックを着て小さな装置を持ち出し、少量の血液で同様の約束をした人がいましたね。Theranos社のことです。Walgreensの裏部屋は実際にその機械の血で汚れていました。これは新しいJuiceroになるかもしれません。スムージーの代わりに…でも言うのはやめておきましょう。
多くのAIの権力者たちが描くユートピアのビジョンの中で、ラリーはがんの治療に焦点を当てることを選びました。他の企業もAIでその方向に進んでいることは知っていますし、この巨額投資の副産物としてそうなることを皆が望んでいるでしょう。
お気に入りのTwitterフォロワーの一人、イーサン・モリックは、AGIに向かって突き進んでいるが、それが私たちや経済に何をもたらすのか十分な理解がないという興味深いツイートを投稿しました。AGIやASIを手に入れたとき、がんの治療以外にも経済の方向性を大きく変えるなど、多くの可能性があります。誰がアクセスできるのかという問題もあります。
ラリーががんについて話すのは、最も分かりやすい例だからです。このポッドキャストでも、AGIやASIができたときにAIで実現したい素晴らしいことがたくさんあると話してきましたが、一般の人々が最もよく理解できるのは科学の進歩です。後ほど、GoogleのDeepMindのデミス・ハサビスが薬品を素早く開発する製薬会社を立ち上げる話も出てきます。
興味深いもう一つの側面は、イーロンとサムの間で本格的な対立が起きていることです。サム・アルトマンは時機を捉えて最大限活用することが上手く、イーロンも最近話題を呼んでいます。イーロンの印象の悪いクリップが拡散していますが、彼はOpenAIの発表に対して、資金がないと主張しました。
「彼らには資金がない」という彼のツイートは200万以上の閲覧数を記録し、「SoftBankの確保資金は100億ドルをはるかに下回る。確かな情報源からの情報だ」とも述べました。面白いのは、サムが返信したことです。X、AI、SpaceX、Neuralink、Teslaで知られるイーロン・マスクですが、彼もAI業界で同じ人材を求めて数十億ドルを調達し、インフラを構築しようとしています。
サムは最初「あなたの功績を心から尊敬し、私たちの時代で最も重要な起業家だと思います」と返信し、その後SoftBankの資金に関するツイートに対して「違います。ご存知の通り、最初の建設現場を見に来ませんか？これは国にとって素晴らしいことです。あなたの企業にとって最適でないかもしれませんが、新しい立場では🇺🇸を第一に考えてほしい」と返信しました。
億万長者たちがばかげたツイートで戦っているのです。イーロン「資金は確保済み」マスクからの発言は皮肉です。かつてTeslaを非公開化する資金を確保したと有名なツイートをし、今でもその件で問題を抱えています。サムが反論するのは素晴らしいですね。
かわいそうなマイクロソフト…いや、時価総額1兆ドル近い企業をかわいそうと言うべきではありませんね。彼らはOpenAIの親友になりたかったのです。マイクロソフトのCEOがCNBCのインタビューで、SoftBankの投資について聞かれた時の発言を聞いてみましょう。
「800億ドルを既に投資していて…このプロジェクトにどのくらいの資金を投入するのですか？」「マイクロソフトは毎年800億ドルの資本を投資しています。今年は…彼らが投資する詳細については特に…」「1000億ドルのコミットメント、5000億ドルの可能性について、イーロン・マスクがTwitterで『資金はない、存在しない』と言っていましたが、これは実現しないということですか？」「私が分かっているのは、800億ドルを投資する用意があるということです。Azureの構築に800億ドルを使います」
このような数字が飛び交うのは信じられません。私たちのショーのリスナーは様々な立場の人がいて、ケビンと私は普通に働いて生活している人間ですが、このような数字を聞くと狂気のように感じます。しかし、今どんなゲームが行われているのか、そしてその重要性が分かります。
AIのバブルについて語る人は多いですが、このバブルは2年目に入り、資金は減少するどころか、むしろ増加しています。私は常に電気のメタファーを考えています。インテリジェンスは、電気が最初に登場した時のようなものです。AJアグラワル、ジョシュア・ガンズ、アヴィ・ゴールドファーブの「Power and Prediction: The Disruptive Economics of Artificial Intelligence」という素晴らしい本があります。
電気は登場してから普及まで時間がかかり、世界を完全に変革し、勝者と敗者が生まれましたが、電気自体が勝者でした。電気は突然誰もの生活を変え、より良くし、これまでにない可能性を生み出しました。最終的にインテリジェンスも勝者になると思います。
後ほどDeepseekの新モデルなどについて話しますが、この莫大な資金が投入されていることを考えると、これらの企業が1兆ドルの価値があるとは思えませんが、インテリジェンスとインテリジェンスコミュニティは勝者になるでしょう。OracleはCIAと提携していることで有名です。なぜラリー・エリソンがこれらのデータセンターを担当し、元NSAメンバーがOpenAIの取締役会にいるのでしょうか？
去年OpenAIから多くの人が離れた理由はこれなのでしょうか？私はホワイトボードを用意して、ドットを結びつけています…PJの話は前回のポッドキャストでコメントがあったので、繰り返す必要はありませんね。
簡単に2つ追加します。トランプはバイデンのAI規制を撤廃しました。これは人々を受け入れるドアを開くようなものです。多くの人はこれをポジティブに見ていますが、AIの安全性を重視する人々は懸念しています。
もう一つは、The Informationが今朝報じたOpenAIのニュースです。今週、オペレーターをリリースする予定のようです。これはインターネットと対話できる小規模なAIエージェントです。OpenAIは同時に多くのことを行っていて、7年前に9人で始まった会社が1000人以上の規模になり、このような野心的な計画にどう対応していくのか興味深いです。
オペレーターが今週か来週に出るかは分かりませんが、主要なものがOpenAIから出たとき、人々がカーソルが自動的に動くのを見てどう反応するか興味深いです。既にそのようなアプリはありますが、これはAnthropicのMCPシステムとは少し異なります。
画面を読み取り、カーソルを操作し、クリックし、フォームに入力するというのは不気味な感じがします。試してみますが、まだ受け入れる準備ができていない気がします。ケビン、オペレーターのベータテストで最初にできることは、AI for humans YouTubeチャンネルの登録だと聞きました。ボットではありません、人間がそう言っているんです。AI for humansのポッドキャストのレビューも書けます。
私たちのポッドキャストの視聴者数は毎週増えていて素晴らしいです。Apple Podcastsでの5つ星レビューをもっと見たいですね。とても意味があり、アルゴリズムにも影響します。ぜひ登録してください。Patreonもありますので、投げ銭もできます。ショーをより良くするためのご支援をいただき、毎週続けられることに感謝しています。
ボットを待たずに、今すぐクリックしてください。無料ですが、私たちにとってはとても意味があります。
次の大きな話題は、AnthropicのCEOであるダリオ・アモディがダボス・フォーラムで語った、Anthropicの今年の方向性についてです。ダボスは世界の富裕層が集まり、彼らの生活について話し合う場所です。ダリオは興味深い発言をしました。
「3-6ヶ月前まではかなりの不確実性がありました。今でもありますが、大幅に減りました。今後2-3年で、職場や消費者が使用するモデルが登場し、人間の助手としてだけでなく、徐々にほとんどすべての面で人間より優れていくことを、比較的確信しています。ポジティブな結果は素晴らしいものになりますが、ネガティブな結果にも注意を払う必要があります。」
これは、AIの誇大宣伝について語り、ダリオが従来より慎重なアプローチを取っていたことに続く発言でした。実際のインテリジェンスの解決に向けて見通しが立ってきたと、より楽観的になっているようです。これは大手企業のリーダーたちに共通する主張のようです。
重要な点は、ダリオの会社Anthropicは最も慎重なAI企業の一つとして見られていることです。彼らは非常に慎重に進めていますが、他の企業が急速に前進しているため、彼らの手も少し動かされているのかもしれません。GoogleがAnthropicに10億ドルの追加資金を提供したという発表もありました。
面白いことに、GoogleはAnthropicの大口出資者で、AmazonもAnthropicモデルの大口バッカーです。GoogleとAmazonがこの件で協力しているようです。
去年末に出たダリオ・アモディの「Machines of Love and Grace」というエッセイを読むことをお勧めします。私たちも動画を作りましたが、AGI/ASIの世界のプラスとマイナスについての興味深い考察です。ラリー・エリソンのがん治療の話にも通じますが、ダリオは科学の進歩について詳しく説明しています。
しかし、これらについて話すたびに頭に浮かぶのは、人間はとても奇妙だということです。人類全般について言えば、私たちは奇妙で、これが私たちの生活にもたらす混乱は前例のないものかもしれません。賢い人々が、それが私たちにどのような影響を与えるかについて語っています。
これらのことを聞くたびに、学び、理解しようとすることが重要です。そうしないと、数年後に目覚めたら、コンピュータが朝食を作り、仕事の最初の3時間を代わりにこなしていて、「何が起こったんだ？私はどこで間違えたんだ？」となりますよ。
飲みすぎた夜のように目覚めると、隣でロボットが電子タバコを吸っている。部屋に入ってくる2台のロボットが二日酔いの薬を持ってくる。まるで熱に浮かされたような状態です。これはロボットのインフルエンサーハウスなのか？人間とロボットが一緒にコンテンツを作るブロハウスみたいな。目が覚めると600 Vineにいて、枕の横には半分残ったコーベルがあり、ロボット達が「出て行った方がいい」と言っている。鏡を見ると額に「バカな人間」と書かれていて、動画も撮られている。そんな事態にならないことを願います。
Anthropicは明らかにダボス会議でこれらについて議論を進めています。OpenAIに対して少し皮肉を込めた発言もありました。聞いてみましょう。みんな大好きな皮肉です。かわいそうなサム・アルトマン。
進歩は人々が考えているほど速いと思います。批判したいのは、急速な進歩が比較的確実になった今、それを適切な重みを持って受け止め、真剣に議論することが非常に重要だということです。他の企業名は挙げませんが、奇妙なTwitterの噂や、従業員が「すごいことをやっている」といったような意味ありげな目配せをするようなことがあります。これは危険だと思います。外部の人から見ると「ああ、あれは誇大宣伝だ」という印象を与えてしまうからです。
いや、ダリオ、そういうコミュニケーションこそが私たちのYouTube動画のクリックベイト見出しを生むんです。それは私たちのエッセンス、私たちのマナなんです。ダリオは大人で退屈な人ですね。私たちのハイプハウスには呼べません。ロボット達も「彼を追い出せ、必要ない」と言うでしょう。でも彼は正しいですよね。
OpenAIの世界は、こういった事について直接的なコミュニケーションを取っていないですから。私たちはイチゴの噂など全てを追いかけてきました。今では少し直接的になってきていますが、ダリオはもっと真剣に受け止める必要があると感じているようです。今後どうなるか見守りましょう。
サム・アルトマンも最近ツイートで、誇大宣伝が制御不能になっていること、OpenAIは来週AGIを発表するような密室での作業はしていないと述べています。良いプッシュアンドプルがあると思います。また、先ほど再生したクリップでは、ダリオが急速な進展があり得ること、AGIやASIが実現する可能性があることについて、より確信を持つようになっている様子が伺えます。まあ、それは1年前に誇大宣伝されていたことですが、今はより話しやすくなっているのかもしれません。私はハイプが大好きです。どんどんやりましょう。
中国についてはどう思いますか、ケビン？
申し訳ありませんが、現時点ではお答えできません。他の話題について議論させていただけますでしょうか。
これはDeepseek R1が与えそうな回答ですね。そうですね、その方向に向かっています。
Deepseek R1は中国企業Deepseekが新しく発表したモデルです。これは推論モデルです。OpenAIには01や最近発表された03などのOシリーズモデルがありますが、これは問題を考え抜いて答えにたどり着くオープンソースの代替モデルです。今すぐノートPCで実行できます。性能を抑えた蒸留版もありますが、OpenAIの何分の一かのコストでフル機能版をクラウドで実行できます。
興味深いのは、このモデルが人間のフィードバックによる強化学習ではなく、純粋な強化学習だけで訓練されたことです。AlphaGoと同じ方法です。千個の囲碁の勝ち試合からゲームの勝ち方を学ぶのではなく、何億回も試行錯誤して勝利条件にたどり着く方法を見つけ出すのです。これは極めて単純化した説明ですが、基本的にこのモデルは「正しい答えを見つけ出せ」と言われ、数学の問題や論理パズルを解いていったのです。
そしてDeepseekの思考の連鎖を抽出して、他のモデルの訓練に使用することもできます。1年前の単純なオープンソースモデルや、決して単純ではないMetaのLLamaなどにも、この推論ステップを適用して賢くすることができます。
ここで2つ興味深い点があります。ケビンが指摘したように、これは非常に安価で無料で使えます。中国発であることには明確な問題があり、天安門広場に関する質問には答えないなど、中国からのデータには問題のあるハードコードされた制限があります。
もう1つ興味深いのは、Oモデルがなぜこんなに急速に進化しているのか、イリヤ・スツケヴァーが言及した2つ目のブレークスルーかもしれないということです。Transformerが最初のAIモデルとニューラルラーニングのブレークスルーだとすれば、この推論ステップが次のバージョンと言えるでしょう。このデータを使って他のモデルを訓練できれば、信じられないほど速くスケールすることができます。
実際のR1モデルは01と同等かそれ以上のベンチマーク結果を示しています。7億パラメータの小規模モデルがGPT-4と同等のベンチマーク結果を出しているのは驚くべきことです。
オープンソースでモデルの重みも全て公開されているため、Deep seek R1のリリースから24時間以内にスマートフォンで実行できるよう蒸留され、さらに24時間以内にウェブを検索してリアルタイム情報を取得できるようになりました。24時間後にはスマートトースターで動作するでしょう。
これらのオープンソースを活用して改良を重ねていく能力は前例がありません。これは、巨額の資金を持つクローズドソース企業の競争優位性が3-6ヶ月で消滅するという傾向を裏付けています。これは知能の民主化において非常に重要です。特定の企業や政府、悪意のある集団が知能エコシステムを完全に支配することを防ぎます。
また、最新のスマートフォンや1万ドルのスーパーコンピューターがなくても、一般的な消費者向けデバイスで実行できるようになります。これは素晴らしいことです。また、情報を他人と共有する必要のない、自分専用のデバイスを持つこともできます。
今週はもう1つ大きな進展がありました。少し見過ごされがちでしたが、試してみて感銘を受けました。GoogleがGeminiモデルを更新しました。ケビン、製品名を正確に読み上げたいと思います。素晴らしい製品を作るものの、命名が下手なGoogleの人々へのシャウトアウトです。
これは「Gemini 2.0 flash thinking experimental 0121」と呼ばれ、1月21日にリリースされた全く新しいGemini 2.0 flinkingモデルです。Google AI studioを通じてアクセスする必要があります。
Googleの Logan Kilpatrickの共有のおかげで、ドロップダウンメニューを見つけて使ってみたのですが、すぐに感銘を受けました。数学や問題解決能力が大幅に向上したと言われていますが、もちろん私は重要なベンチマークとして、世界で最も危険な動物によるマーチマッドネスのトーナメント表を作成してみました。
今回は少し違うアプローチを取りました。通常は単にブラケットを作成して戦わせて勝者を決めるよう指示するのですが、今回は各動物にステータスシステムを割り当て、運の要素も加えるよう指示しました。テキストでの出力は素晴らしく、ホッキョクグマが優勝するのは納得の結果です。
いくつか小さな問題点に気付いたので、システムが少しおかしいのではと指摘したところ、ステータスと運の要素を調整して新しい結果を出してくれました。さらに、共有可能なコードも生成してくれました。いくつか問題はありましたが、これは素晴らしい成果です。
そこで、このコードを共有して人々と試してみることができるようにしてほしいと頼んだところ、使えるコードが得られました。あなたにそれを渡したところ、いくつか問題はありましたが、これは驚くべきことでした。この新しいGoogleモデルはとても優れていると感じます。あまり注目を集めていないため、人々は見過ごしているかもしれません。
Google AI Studioに行ってみてください。今は無料で試すことができます。バイブチェックに合格したというのは常に重要なことですが、技術的な観点から見ると、このモデルは100万トークン以上の制限があります。ハリーポッターの小説をすべて何度もコピーして貼り付けて、システムに入れることができ、それらすべてを文脈の中で覚えておくことができます。そのため、大量のテキストやデータにわたって詳細な分析を行うことができます。
コード実行も組み込まれているので、サンドボックス環境で安全にコードを実行・生成できます。これは密かなリリースです。大々的に宣伝されているのを見たことがないし、大規模な動画やスプラッシュなども見ていませんが、今は無料でAI Studioで試すことができます。Googleに賞賛を送りますが、Gemini 2.0 フラッシュシンキング実験的0121、0121が重要な部分です。同じ名前の別のモデルがあるので、モデル名を正確に指定してください。
これらすべてを要約すると、性能は向上し続け、コストは下がり続けています。先ほどの電気のアナロジーのように、知能は商品化され、私たち全員が無料で即座にアクセスできるようになることを願っています。そしてこの傾向は続いています。
ケビン、その流れで新しいテーマソングを作る時が来ました。申し訳ありません、それは…シャツに水がついていますか？はい、自分にこぼしてしまいました。それは残しておきましょう。ポッドキャストを巻き戻すと、ケビンが話している間に私が水を飲んで顔にこぼれ、その時は何事もなかったように装おうとしましたが、大丈夫です。
さて、このすべての驚くべき変化について、ケビン、今週は私を本当に驚かせたいくつかの話がありました。新しいセグメント「マインドブロワーズ」を紹介します。この話は本当にクレイジーです。AIに関して長い間、これほど驚かされたことはありませんでした。
これは現在、信頼できる情報源からと思われる論文です。これは、AIが脳波を見て5秒先の未来を実際に予測できるという考えです。とても信じられないような、超常識はずれなことに感じます。これについて見る機会はありましたか？人間の生活を根本的に変えるようなものだと思いますか？それとも、これが本当に実現できるのかどうかわからない、ただのクールなパーティートリックなのでしょうか？
TSAがこれを導入するのが待ちきれませんね。これはfMRI（機能的磁気共鳴画像法）を使用しています。研究で見かけるような、電極が付いた帽子をかぶって、脳の血流の変化を見るものです。特定のトピックについて考えたり、特定の手足を動かそうとしたりすると、脳の運動スキル部分や異なるセクションが活性化します。
この研究が行っているのは、基本的にそのデータをトランスフォーマーモデルに送り、「この領域がこのように活性化したとき、5秒後に何が起こるか」を問うことです。脳のどの部分が活性化するかをかなり正確に予測しました。これは確かに興味深いことです。少なくとも私たちの現在の宇宙の理解の仕方について、まったく異なる考え方を示唆しています。
科学的研究があり、ポップサイエンスの本をたくさん読んで、人々が脳の機能は体より先に起こり、物事を早めに決定すると話しているのを見てきましたが、これは本当にクレイジーです。これは非常に初期段階ですが、この世界が現実のものだとしたら、ここで私たちが見ているのは、行動を予測できるような何らかの…私には何と言っていいかわかりません。本当にマイノリティ・リポートのようなものです。
確かに5秒は大した時間ではありません。つま先をぶつけるのを防ぐとか、何かを落とすのを防ぐとか、今回はそのピーを飲まないようにするとか、そんなことができるでしょうか。良いジョークですね。私の人生で何度か起こした失態を防ぐことができたかもしれません。5秒あれば十分なバッファーになったでしょう。
しかし、これはfMRIだけで5秒です。EEGやMEEG、あるいはニューラリンクのような他のニューロンの直接記録を得るものはどうでしょうか？このようなモデルに入力できるデータはもっとたくさんあり、10秒や15秒先を予測できるかもしれません。ガビン、ポッドキャストでシャツに水をこぼすのを防げたかもしれません。
アダム・サンドラーの「クリック」のように、私たち自身のリモコンを手に入れて、人生を巻き戻すことができるかもしれません。「クリック」、なんてすごい映画でしたね。いつも支援してくれるクリックヘッズの皆さん、ありがとうございます。大きなクリックコミュニティがいることを感謝しています。
ケブ、もう一つの大きなマインドブロワーは、先ほど話したように、デミス・ハサビスが今年後半にAIデザインの薬物試験を開始する予定のAI創薬スピンオフについてです。これは何で、なぜ重要で、なぜ驚くべきことなのでしょうか？
まず、Google DeepMindとその科学における進歩について話してきました。実際、デミス・ハサビスは今年、Google DeepMindでの科学的進歩により、ノーベル賞を受賞しました。Google DeepMindは、Gemini Advance Fast Thinkingなどの他に、科学の進歩に本当に焦点を当ててきました。
彼らが常に話してきたことの一つは、人々をより早く治療できる薬をどのように開発し、それらの薬をより早く作ることができるかということです。パンデミックの間、mRNAワクチンを推進したことは知っていますし、それについては自分なりの考えがあると思いますが、ここでのアイデアは、AIによって薬を作り、試すことをずっと早くできるということです。
先ほど番組の冒頭で話したように、将来的にAIでがんを治療しようとする人々についての話をしましたが、これは非常に重要なことだと考えています。これは非常に資金力のある企業が、人々を助ける新しい薬を直接生成することに焦点を当てているということです。
私には全く資金力のないサイドプロジェクトがあり、AIを使って新しい薬を生成しています。Meta LLamaやDeep Thinkに頼んでいます。私が欲しいのは、MDMAのような楽しい、息苦しいような、ただクールでダンスしたくなるようなものですが、その下降は避けたいです。また、価格も考慮して、雑草のように栽培できるものを望んでいます。そのため、AIを使って薬を合成するためのピースを組み立てていますが、誰も私の研究に資金を出したがりません。
多分、アブダビにいるかもしれない人を紹介できるかもしれませんが、お金を得るためにどうするか検討してみましょう。とにかく、これは本当にクールなことで、科学的な観点から見ると本当に驚くべきことの一つです。
最後のマインドブロワーは、Hunan 3D 2.0です。ケブ、私たちはAIから3Dモデルを生成することについて多く話してきましたが、これは新しい3Dモデルジェネレーターで、アセットを生成できるだけでなく、それらをアニメーション化することもできます。これを確認する機会はありましたか？
Hugging Faceのデモを実行しようとし続けていますが、人気のため、ランタイムエラーの連続でした。スペースをクローンしようとしましたが、例を見ることしかできませんでした。テキストプロンプトや既存の画像を使用すると、単一の2D画像から背景を削除し、モデルの完全な3Dビューを解釈しようとし、テクスチャを付けて出力します。品質が高く見えます。
私たちは過去1年半くらいこれらのことをカバーしてきましたが、近づいているものの、半焼けのプレイドーのように溶けているように見えることがありました。しかし、この2.0の例は、実際に2つのモデルを組み合わせています。形状を生成するモデルと高品質のテクスチャを作成するモデルがあり、それらをピーナッツバターとジェリーのように組み合わせてこの3D 2.0製品を作っています。
残念ながら例しか見ることができず、実行しようとするたびに失敗していますが、comfy UIバージョンをリリースする予定なので、これらを無料でローカルにコンピューターで実行できるようになります。サンプルの品質は絶対に信じられないほど素晴らしく見えます。本当に試してみたいです。
これはテンセントですよね。つまり、これは本物の大企業が作っているもので、ベイパーウェアのようなものではありません。これは会社が出しているもので、それを見て、出力されるグラフィックスを見ると、確かに実際に試していませんが、これは私たちがやることの多くを変えるだろうと気付きます。特にビデオゲーム用のデジタルアセットを作成する際にです。
これは本当にクールなことです。これが今週のマインドブロワーでした。マインドブロワーをまた取り上げるかどうか、見てみましょう。マインドブロワーズ！
次のセグメントに移ります。これは私たちのお気に入りで、今週人々がAIで行った面白いことの一部です。AIシー・ワット・ユー・ディド・ゼア（AI see what you did there）です。時には何も考えずにスクロールしていると、突然立ち止まって…シャウト！
ケブ、私たちは新しいロボットのハイプビデオを持っています。このビデオについて、私は今まで以上にワクワクしています。これを見ましたか？
見ましたが、サウンドトラックも聞きました。悪いロボットを思い起こさせます。「宿題したくないよ、ママ。クールな子たちと遊びに行くんだ」というような感じです。これは明らかにスタントビデオです。ロボットがスケートビデオを作れるとしたら、こんな感じになるでしょう。VHSの裏面にあるような感じです。片足でバウンドして前方回転をするロボットがいますから。
YouTubeビデオを見ていない、音声だけを聞いている方は、ショーノートでこれを確認する必要があります。1年前と比べても、私たちが見ているものを理解する必要があります。これは4本足の車輪付きロボットで、複数の地形を移動できるだけでなく、片足での単回転などのクレイジーなことができます。
もちろん、いつもこれを見るときに、将来私たちを殺すものだと言いますが、介護者になるかもしれません。最後のロボットは両側に花火を付けていて、クレイジーに見えますが、これは中国のロボット工学が現在どこにいるかを示す驚くべき例です。
世界には中国の本当のリードは物理的なロボット工学にあると話している人が多くいます。このビデオを見ると、これは実際の仕事からそれほど遠くないように見えるように、これはパートナーやコンパニオンとして実際に機能するようなロボットからそれほど遠くないです。実際の作業ができるほど優秀に見えます。このビデオを見てください。どれだけ素晴らしいか驚くでしょう。
その次に、Halooが音声合成の世界を変えたと言われています。これは彼らのT21 HDモデルで、確かにロボットが別のロボットと握手をしているような機械的な名前に聞こえますが、これを聞いてください。
「私たちの感情の重みを持つ複数の動きの表現力豊かな声。すべてがとても重く感じる。これは人生で最高の日だ。もうこれには我慢できない。もし全てがうまくいかなかったら。そして声には私たち全員を結びつける力がある」
その後、同じ声を異なる言語で再生します。印象的ですが、最初のいくつかのサンプルでは、テキスト読み上げ音声の中に幸せや悲しみ、反抗や怒りを感じたり解釈したりできるかもしれません。これがこのシステムの約束です。
多くの音声に関する事を追っていて、11 Labsのような音声に特化した企業や、playtからの本当に興味深いものがあります。他の企業や既存のものと比べて、これについて何が興味深いと思いますか？
感情を引き出したいということです。現在、11 Labsは声のベースラインパフォーマンスをクローンすることは非常に得意ですが、制御と柔軟性はほとんどありません。6、7個の感嘆符や省略記号を付けることはできますが、モデルが幻覚を見たり、暴走したりする可能性があります。
次のフェーズでは、パフォーマンスの感情をきめ細かく制御することが重要です。これにより、AI音声システム用の新しい種類のスクリプトがどのようなものになるか考えさせられます。11 Labsについて考えることの一つは、数週間前にマヨネーズのCMを作ったように、たくさん生成して適切なものが出てくることを期待するしかないということです。
本当に興味深いのは、感情を行や単語に組み込むことができるスクリプトシステムです。山括弧の中にスラグか何かを入れて、その部分を確実に強調できるようにすることを想像してください。映画のスクリプトを見ると、台詞の言い方を少し定義することがありますが、それはあまり頻繁ではありません。俳優が解釈することが多いからです。
しかし、この場合、AIはほとんどの場合、あなたが感情的に何をしようとしているのか分かりません。Halooのこのプロセスは、そのようなことへの扉を開くかもしれませんが、文字通り何かを言う方法を指示できる音声モデルを見つけることができれば素晴らしいと思います。
これはその約束です。AIとデザインによると、AI少女デザイアの声をクローンして、異なる感情で何かを言うように頼んだそうです。ちなみに、このシステムは数秒の音声だけで声をクローンできます。こちらがクローンされた声で異なる感情を表現したものです：
「ベイブ、今すごく嫌な気分。始めないでよ。冗談でしょ？ああ、すごく興奮してる！これは今まで起きた中で最高のことよ！ウフー！ああ、これが起きているなんて信じられない。泣きそう。助けて、助けて！エイリアンが来る！どうすればいい？すごく怖いの！」
それはそんなに悪くないと思います…まあ、かなり悪いですね。はっきり言いましょう、かなり悪いです。
怖がっているように聞こえなかったと思います。怖いバージョンをもう一度再生してください。「助けて、エイリアンが来る！どうすればいい？すごく怖いの！」
「すごく怖いの」はそんなに悪くなかったです。選択でしたよ。最高の読み方ではありませんでしたが、選択でした。アドバンス音声で素早く試してみたいと思います。同じ怖いセリフを聞いてみましょう：「助けて、エイリアンが来る！どうすればいい？すごく怖いの！」
了解です。あなたに演技をしてもらいたいです。できるだけ恐怖と怯えを込めてこの言葉を言ってください：「助けて、エイリアンが来る！どうすればいい？すごく怖いの！」
「助けて、エイリアンが来る！どうすればいい？すごく怖いの！」
良くなりましたね。ずっと良くなりました。
明らかにオープンAIにはここで進歩があります。これは音声クローンなので、このモデルに入力された声がどのようなものだったのかは分かりません。5秒の音声があり、それを解釈しなければなりませんでした。そう、オープンAIのが断然良いです。ただし、これも依然としてクールです。
このようなものが存在するのはクールです。私たちは常に前進しています。ケビン、もう一つ紹介したいのは、ドアブラザーズです。彼らは、政治家がアイズワイド・シャットのパーティーに入っていく、あるいは政治家が防犯カメラで店を襲っているような有名な動画で知られています。
彼らは8分ほどのTVショーのようなものを作りました。人々が巨大なスターゲートのようなものに入っていくという内容です。かなり説得力があります。AIビデオの長時間版で難しいのは、本当にストーリーテリングだということです。これはストーリーテリングの冒険です。
皆さんにこれを見ることをお勧めします。これらのツールを組み合わせて説得力のある物語を作る良い例だと思います。世界で最高のものだとは思いません。以前紹介したNurov Visのような人々がもっと興味深い長編作品を作っているのを見てきましたが、技術的に最高峰にいる人々が彼らのものをすべて特定の方法で組み合わせるのを見るのはクールです。
現在、少なくともTwitterとYouTubeで見ることができます。とてもクールです。ちなみに、他にチェックすべきものとして、一部の人々は衰退していると言うかもしれませんが、私は勢いが増すばかりだと思うのは、AIフォーヒューマンズニュースレターです。
毎週火曜日の朝にチェックすべきです。最高の情報、面白いリンク、面白い観察、ショーからのクリップを配信しています。無料で簡単に登録できます。AI for humans.showにメールアドレスを入力するだけです。スパムは送りません。毎週火曜日の朝に何かが届くだけです。そして、もしかしたら気に入るかもしれません。
実際、今週AIフォーヒューマンズニュースレターを受け取った人は、私が今週AIで何をしたかの早期情報を得ることができました。Haloo、音声を作る会社がMini Max AIビデオモデルも作っていて、そのキャラクターリファレンスツールを試してみました。
これは、ビデオに顔を追加したり作成したりする機能です。基本的に、誰かの顔の単一の画像を与え、その顔をビデオに付けることができます。しかし、実際にはビデオをゼロから指示することができます。
例えば、私が見た中で本当に信じられないようなバージョンがいくつかあります。私たちのお気に入りの一つ、F AIは、アバターの主演俳優の一人の写真を撮り、東京の街を歩かせ、メインキャラクターをサングラスをかけたアバターに完全に変身させました。
また、X上のボア・ハイは2人のキャラクター、つまり2人シーンの2つの画像を取り、両方のキャラクターに彼らの顔を付けました。これは、本当に興味深いことができる非常に強力なモデルです。ケブ、これで何が行われているか、例を見る機会はありましたか？
面白いのは、例が出てきたのを見たとき、これがどのビデオサービスを指しているのか分からなかったことです。これらのツールがすべて競争しているので、お互いに同等になってきているように感じます。背景、被写体、アクセサリー（バッグやサングラスなど）という3つの要素を扱うことができる他のツールも見てきました。
これらの例の一部が、新しいS21モデルから出てきているとは知りませんでした。これもまたセクシーな名前ですね。これを少し試してみました。注意すべき点の一つは、Mini Maxの購読者になると、月額で限られた数の生成が可能になります。
実際には、replicate経由でこれを行いました。これは異なるモデルをホストし、生成ごとに支払うことができるサービスです。現在、replicateではかなり高価で、生成ごとに約50セントかかります。Mini Maxの購読に登録したくなかったので、250ドルか5ドルで一定量の生成を試すことができます。
非常に簡単で、基本的にプロンプトがあり、開始場所を与えたい場合は最初のフレーム画像を入れるオプションがあり、被写体参照ファイルがあります。ケビン、最初の数枚で分かるように、以前のイベントで大きく笑っている私のヘッドショットとして使っている写真をアップロードしましたが、結果を見ると、それはそれほどうまくいきません。
東京の街を歩いている自分のバージョンと、サイバーパンクの世界での自分のバージョンを作りましたが、両方とも少し変です。顔がうまく合っていないからです。また、サイバーパンクバージョンの私に奇妙なポットベリーが与えられていることに気付きましたか？
あなたを影で表現しようとしています。微妙に体の歪みを与えようとしています。そうですね、その笑顔は、Mr.ビースティのような、ほとんど凝り固まったような感じで、体の残りの部分のように信じられる方法で動きません。でも例は良いと思います。一貫した方法であなたを捉えていると感じますか？それともこれらのレンダリングを見るとき、自分を見ていると感じますか？
笑顔のものではありませんが、2番目のバージョンは、カメラに直接向かって平らな顔をしている私の写真に更新しました。このビデオで見られる5つの生成のうち、1つは彼らが持っていたもので、サングラスをかけて東京の通りを歩くものでしたが、それはかなり良く見えると思います。サングラスをかけているのでより簡単になります。
あなたが腕を怪我して病院を歩いているように見えるプロンプトは何でしたか？
実際に、AIで多くの素晴らしいことをしているヘザー・クーパーという女性からのシャウトアウトでした。私は彼女のプロンプトを借りました。もともとは白いセーターを着た女性が病院を歩いているというものでした。ある時点までは顔はそれほど良くありませんが、バイキングのものはかなり良く見えました。私にはかなり合っています。
TED Talkをしているステージ上の私は、明らかにその顔に苦労していました。そして最後のDJのものは、本当に私ではなく、それほど面白いこともありません。ただし、白いタキシードを着て歩き回るのは面白いですね。
余分なお金があり、何か試してみたい場合は、これは試す価値があります。新しいことをしているAIモデルを試す簡単な方法です。同様のことができる他のモデルもあります。cingにはこのバージョンがあり、RunwayやSoraからもいずれバージョンが出てくると確信しています。
これは、進行中のAIビデオを作ることを可能にするものです。これまでのビデオの課題の一つは、キャラクターの一貫性でした。今、あなたはキャラクターを作成し、それを多くの異なる場所に入れることができるポイントに入っています。
もちろん、私たちの視聴者の多くは、これはオープンソースで長い間可能だったと言うでしょう。はい、comfy UIの専門家であれば、これを理解できたでしょう。しかし、それは普通の人が試すには多すぎます。
多くのこれらのツールのワンクリック性を軽視することはできません。それが普及する時です。個人的には、私たちのPatreonの少なくとも5ドルを使って、カジノロワイヤルのような状況にあなたを置くべきだと思います。AIが幻覚を見たルーレットテーブルに座っているあなたを見てみたいです。そのテーブルには、車輪の周りと側面にランダムな数字と形があり、チップの山が変形して移動します。カジノのすべてのゲームをプレイしているあなたを見たいです。12個全部になるダイスや、偽の幻覚を見たシンボルを持つスロットマシンのように、溶けるクラップステーブルを見たいです。
このビデオモデルの面白いことの一つは、顔を処理しようとしているため、背景のものが少し変になることがあり、それも面白く興味深いものになります。とにかく、replicateで試すか、Mini Maxの購読者であれば今利用可能です。これは今まさにリリースされたところです。
本当に興味深いAIツールがどんどん登場しています。最初にリリースされたときに試さないと、実際に忘れてしまう可能性があります。試してみる価値は確実にあります。
1000億ドルの資金調達について話したいですか？発表する準備はできていますか？いいですよ、それについて話しましょう。何か言いたいことはありますか？
オスカー・マイヤー社からの大きな支援に感謝したいと思います。ホットドッグシティを建設しているのを見て、インフラ整備、基盤作りが必要だと判断してくれました。オスカーとマイヤー、お二人に感謝します。実は、今まで知らなかったのですが2人なんですよ。実際、シンガポールでは米国内では許可されていませんが、私たちは許可されています。もしかしたらあなたもそうかもしれません。
彼らは私のメールとウォレットアドレスを尋ねてきました。ケビン、それが何を意味するのかわかりませんが、ありがとうございます。また楽しいエピソードでした。来週、YouTubeやその他の場所でお会いしましょう。いろいろなことを試して、楽しんでください。できるときにやりましょう。さようなら。