
6,756 文字

ほな、OpenAIの大騒動の週に隠れてしまったニュースがいくつかあったんで、皆さんに手短に説明させてもらいますわ。せやから、今何が起こってんのか、さっそく見ていきましょか。
まず一つ目は、信じられへんかったんやけど、Google Geminiが大幅にアップグレードしたんです。Gemini 1.5 Proのアップグレードやったんやけど、これがめっちゃすごかってん。全体的にめちゃくちゃ良くなったんやけど、残念ながらこのニュースは完全に影に隠れてしもたんです。
要するに、Gemini 1.5 Pro2とGemini 1.5 Flash2をリリースしたんです。これはGemini 1.5 ProとGemini 1.5 Flashの2回目のアップデートやねんけど、ちょっとわかりにくいかもしれへんな。1.5 Pro2やから、Gemini 1.52みたいな感じになるんやけど。
簡単に言うと、ChatGPTが時々アップデートされるみたいに、Google Geminiも同じようにモデルをアップデートしたんです。
で、一番びっくりしたんは、もし普段からGeminiを使ってはる人やったら、こんな感じになってるんです。現在のベンチマークを見ると、Gemini Flashが以前のGemini Proと同じくらいのパフォーマンスを出してるんです。
Gemini 1.5 Flashについて知らん人のために説明すると、これは同じことができる軽量版のモデルなんです。MLU Proでのベンチマークを見ると、Geminiとの差は2%くらいしかありません。コーディングのベンチマークでは3%くらいの差で、数学では実際もっと良くなってます。隠れた数学の問題ではさらに良くなってるし、推論能力も大幅に向上してます。
つまり、このGemini 1.5 Flashバージョンは、今まで使ってたGemini 1.5 Proよりもずっと優秀になったんです。これはめっちゃ驚きやと思います。なんでかっていうと、今までと同じように画像認識、ビデオ認識、長文脈認識ができるのに、コストがめっちゃ安くなったからです。
Gemini 1.5 Proで開発してきた人にとっては、これはすごい成果やと思います。コストが大幅に下がるからです。モデルを試してみたい人にとっても、これはええニュースです。モデルがどんどん安くなってるんで、これはめっちゃええことやと思います。
もちろん、これらのモデルは似てるんやけど、新しいバージョンのGemini 1.5 ProがOpenAIに追いついてるっていう事実も無視できへんです。MLU Proのベンチマークでは75%まで上がってて、コーディングの自然言語からコードへの変換ベンチマークでは85%まで上がってます。
驚いたことに、一番大きく伸びたのが数学のベンチマークでした。Googleのモデルは数学が苦手やと思ってる人もおるかもしれんけど、今や86.5%まで上がってます。それから隠れた数学が52%、推論が59.1%まで上がってます。
Arena投票の結果をまだ確認してへんけど、めっちゃすごい進歩やと思います。これを見ると、Googleの文化が変わってきてるんちゃうかなって思います。昔ほど新しいものをリリースせえへんって言われてたけど、今はもっと役立つものをどんどんリリースしてるんです。
長文脈の評価に関しても、診断の面で82%まで上がってます。これは針と干し草の山の話とは別の話やけど、Google独自の優れた技術を考えると、めっちゃ印象的な結果やと思います。
Googleの最高経営責任者(CEO)が何をしてるか気になる人もおるかもしれへんけど、スンダー・ピチャイCEOは、コンピューティングインフラを拡張して、1ギガワットのデータセンターの開発に取り組んでるって言うてます。さらに、小型モジュール原子炉を含む電力供給のオプションも探ってるらしいです。
これらの企業は、将来的にAIモデルやコンピューティングスタックのための電力生成能力を本気で増やそうとしてるんです。なんでかっていうと、将来的にはコンピューティング能力がめっちゃ価値のあるものになるからです。独自のコンピューティング能力を持ってる企業や、できるだけ多くのコンピューティング能力を持ってる企業が、世界で最も価値のある企業になるんちゃうかなって思います。
スンダー・ピチャイの話を聞く機会ってあんまりないんで、これは結構面白いと思います。普通はGoogle I/Oみたいなイベントで事前録画されたものしか見られへんからね。ほな、ちょっと聞いてみましょか。
スンダー・ピチャイ: 短期的には課題がありますが、中長期的には楽観的です。なぜなら、新しいエネルギー源の開発にも多くの資本投資がもたらされているからです。我々は風力と太陽光発電にかなり早い段階で投資しました。そこに機会があると見ていたからです。今日、我々の最大のデータセンターの多くは、約90%がカーボンフリーベースで運営されています。
最近、ネバダのデータセンターでは地熱を利用して運営しています。我々は新しい源を導入し、他の企業にもそうしてほしいと思っています。小型モジュール原子炉(SMR)に投資されている金額を見ると、原子力エネルギーのための小型モジュール原子炉ですね。資本とイノベーションの流れを見ると、中長期的に楽観的になれます。
GoogleだけやなくてOpenAIもAGIと人工超知能のための巨大なデータセンターの建設に力を入れてるんです。OpenAIがホワイトハウスに前例のないデータセンター建設を提案したっていうニュースがありました。
このスタートアップ企業は、5ギガワットもの大規模なデータセンターをアメリカのいくつかの州に建設することで、経済と国家安全保障にメリットがあるって政府関係者に説明したんです。これはGoogleが要求してる規模の5倍にもなります。
ちなみに、5ギガワットっていうのは、原子炉5基分くらいの電力か、300万世帯分の電力に相当するんです。これはめちゃくちゃすごいことやと思います。
新しい雇用を生み出したり、GDPを押し上げたり、アメリカがAI開発でリードし続けられるようにするって意味では、これはええことやと思います。サム・アルトマンCEOの話を聞いてると、将来的にはコンピューティング能力が最も価値のある資源の一つになるって言うてます。だから今のうちにインフラを整備しておけば、将来的に外部委託せんでもええようになるってことですね。
OpenAIは「アメリカのAIインフラを強化することが、アメリカがグローバルイノベーションの最前線に立ち続け、国内の再工業化を促進するために重要やと信じてる」って言うてます。
これは必要なことやと思います。今のAIの状態だけを考えてる人が多いけど、AIが使う電力量をまだ過小評価してると思うんです。将来的にAIが主要な電力消費源になることを考えると、ChatGPTみたいなシステムが毎月3億人のユーザーを抱えてるっていう現状から、将来的には何十億人もの人がAIを使うようになるってことが予想できます。
そのためのインフラがなければ、取り残されてしまうんです。だからこそ、インフラの整備が必要なんです。確かに今はAIバブルの中にいて、AIが日常的なものになってるって思ってるかもしれへんけど、実はまだまだ初期段階なんです。
2、3年後には、AIが何をできるようになるかがもっとはっきりしてくると思います。エージェントみたいなものが出てくればね。でも、需要に備えておくのはいつでもええことやと思います。
それから、トークンのコストが下がってるっていうのも見せたいと思います。これはめっちゃクレイジーで、次の話題につながるんですけど…でもその前に、ニューヨーク・タイムズがOpenAIの最近の資金調達ラウンドの資料を入手したっていうニュースも見せたいと思います。
その資料によると、8月にChatGPTを使った人は3億5000万人もいたんです。匿名ログインを導入してからユーザー数がめっちゃ増えたんです。それに、サブスクリプションの料金も年末までに2ドル上がるらしいです。つまり、年末までにChatGPTは22ドルになる可能性があるってことです。
さらに、2029年にはChatGPTは月額44ドルになるかもしれへんって書いてあります。これはなかなか面白いですね。
個人的に、ChatGPTはその機能に比べてめっちゃ安いと思うてます。ビジネスを経営してたり、YouTubeチャンネルを運営してたり、なんでもええんですけど、アイデアを出し合えるセカンドオピニオンを持つことの価値は過小評価できへんと思うんです。
でも、一般の人にとっては、ChatGPTの価値がわかりにくいかもしれへんね。日常的に特定の問題に取り組んでない限り、月20ドルの価値はないかもしれへん。
でも、将来的なモデルであるOrionや01プレビューは、月2000ドルまでは行かへんにしても、かなり高くなるんちゃうかなって思います。OpenAIもそういう話をしてますしね。
ChatGPTのサブスクリプションについて、たぶんこんな感じになるんちゃうかな。Soraをアドオンとして提供したり、画像モデル部門をアドオンにしたり、最も高度な推論モデルをアドオンにしたり、エージェントをアドオンにしたりして、全部合わせて月50ドルか60ドルくらいになるんちゃうかな。
個別のサービスだけ欲しい人向けに、それぞれ月20ドルくらいで提供するかもしれへんね。OpenAIはいろんな個別のサービスを持ってるから、それぞれを違う分野に適用することで、めっちゃ儲けられると思うんです。
さらに、さっき言うたように、OpenAIのトークンの価格がめっちゃ下がってるんです。これは長期的に見て、この会社の利益がどんどん増えていくってことです。
多くの人が「この会社、お金失ってるやん」「現金燃やしてるやん」って思ってるかもしれへんけど、UberやGoogleみたいな会社も初期の頃はめっちゃお金失ってたんです。これは決して珍しいことやあらへん。
そやから、恐怖を煽るのはやめましょ。確かにOpenAIの現在の経営陣はめちゃくちゃやけど、現金を燃やしてるってのは全然問題やないんです。
AIテクノロジーは、これまでに発明された中で最大のコスト削減技術やってことを理解するのがめっちゃ大事です。我々がモデルをリリースした時は、使用コストがめっちゃ高かったんです。100万トークンあたり36ドルやったんです。
でも今や、最先端のモデルでも2セントくらいになってます。もうすぐAIが無料になるところまで来てるんです。この技術のコストがどんどん下がってるから、何をするにしてもAIを応用できるようになるんです。
これによって、めっちゃパワフルな例がいくつも生まれるんです。OpenAIでは、毎日何千人もの人がフォームに記入してくれてます。これらの情報を理解するのはめっちゃ難しくて、どの情報を聞いて読むべきか、どの情報を無視すべきかを判断せなあかんのです。
ほとんどの人は、誰も読まへんからテキストフィールドをフォームに追加したりせえへんのです。でも、我々は自然言語処理を使った自動化を行って、すべてのフォームを読み、興味深い情報を拾い上げ、それぞれの回答を評価して、社内の適切な人物に自動的に振り分けるようにしてます。これで、会社に入ってくる情報の収集方法を完全に自動化できたんです。
それから、AlphaChipについても話さなあかんな。AlphaChipはすごかったんです。AIモデル構築用の最先端のTPUの設計から、データセンター用のCPUまで、AIがマイクロチップの設計方法を変えてしもたんです。
2019年には、強化学習を使ってコンピューターチップの物理的なレイアウトを設計するAIが初めて登場しました。これは人間のエンジニアなら何ヶ月もかかる作業やったんですけど、強化学習でできるようになったんです。
2020年には、AlphaChipが次世代のGoogle TPU、つまり大規模AIモデルのトレーニング用に最適化されたカスタム設計のAIアクセラレーターの動力源になりました。
そして、AlphaChipのコードがオープンソース化されて、研究コミュニティがその可能性を最大限に引き出せるようになりました。
さらに、GoogleがAlphaChipによって設計されたTrilliumを発表しました。これは最先端のTPU、つまりAIモデルの構築に欠かせない特殊なチップです。
ちょっと難しい話になってもうたかもしれんけど、デミス・ハサビスがこれを簡単に説明してくれてます。彼はこれをフィードバックループって呼んでます。
まず、最先端のチップ設計モデルであるAlphaChipをトレーニングします。それを使ってより良いAIチップを設計し、そのより良いチップを使ってより良いモデルをトレーニングし、そのモデルでさらに良いチップを設計する…っていう具合です。
これが、Googleの TPU スタックがめっちゃ優れてる理由の一つなんです。サイクルが回るたびに、より良いチップを設計できるAIができて、次のサイクルがちょっとずつ速くなっていくんです。
完全な再帰的自己改善とまでは言えへんけど、それに近いものがゆっくりと進んでるんやね。これはGoogleのすごいところやと思います。マジで、Googleを過小評価したらあかんで。
それから、Googleの元CEOが2025年、つまり来年のAIについて、めっちゃ面白い予測をしてくれました。ちょっと聞いてみましょか。
元CEO: あなたが望むことをAIがやってくれて、実際にコードを書いてくれるようになります。私の生きてる間に、おそらくプログラマーの大半が置き換えられるという証拠もあります。
プログラマーにとっては悪いニュースですが、他の人にとってはいいニュースです。だってプログラマーって、ちょっと面倒くさくて高くつくでしょ?コンピューターサイエンティストでプログラマーの私が言うのもなんですが(笑)
この三つのことが今年起こると思います。これらが起こることで、非常に興味深い問題が浮上してきます。私はこの三つが必ず起こると断言します。皆さんはこれらを使うことになるし、めちゃくちゃパワフルで、きっと気に入ると思います。
この話はめっちゃ面白いと思います。色んなことを示唆してますからね。
プログラマーにとっては大変な時期やと思います。「この業界に残るべきか」「転職すべきか」っていう悩ましい問題がありますからね。トップリーダーたちが「AIがあなたたちの仕事を奪う」って言い続けてるから、めっちゃ厳しい状況やと思います。
NVIDIAのジェンセン・フアンCEOもこんなこと言うてます。「AIがあなたの仕事を奪うんじゃない。AIを使う誰かがあなたの仕事を奪うんだ」って。これは多くの場合、その通りやと思います。でも、そうじゃない場合もあるかもしれへんね。
ジェンセン・フアン: AIが自分の仕事を奪うんじゃないかって心配してる人がいるなら、AIを使う誰かが自分の仕事を奪うかもしれないって心配した方がいいでしょうね。だから、この新しいツールを学んで、自分の強みにすることが大切です。もちろん、我々企業としてもそうするし、国としてもそうすべきです。
最後に、アリババが「MiMo」っていう制御可能なキャラクターのビデオ合成技術を発表しました。これは空間分解モデリングを使ってるんですけど、どんな画像でも入力して、その画像を使ってどんな動画でも置き換えられるんです。
最初にこの技術を見たのはVigle AIやったと思うんですけど、たぶん初期のバージョンやったんでしょうね。今のこの技術を見ると、めっちゃ効果的になってます。
これをどこで使うんかはわからへんけど、例えばプレビズ(事前可視化)なんかで使えそうですね。ここに見えてる新しい3Dモーション制御技術は、めっちゃ効果的に見えます。
こういう技術が、いろんな企業の裏側でどんどん進化してるんです。つまり、こういうニュースを直接聞くことはあんまりないけど、アップデートのたびにどんどん良くなっていってるってことです。
今日の動画を楽しんでもらえたなら、いいねボタンを押してくれたら嬉しいです。この話についてどう思ったか、コメントで教えてくださいね。次の素晴らしい動画でまた会いましょう!
コメント