
3,023 文字
昨日、GoogleはGemini 2.0を一般公開しました。残念ながら、これによってFireshipはまた新しいAI動画を投稿することになり、JavaScriptフレームワークの信者たちは落胆することになりました。恒例の通り、この新しい大規模言語モデルには紛らわしい名前のバリエーションがあり、GoogleはまたもやAIレースで敗北を喫することになりそうです。最も強力な深い思考モデルはOpenAI O3、Mini High、DeepSeek R1のいずれにも及びません。これはLive Benchの結果であり、Google にとって1位以外は失敗に等しいのです。
しかし、Gemini 2.0のリリースは実際、これまでのAIレースにおけるGoogleの最大の勝利となっています。なぜなら、最も実用的なユースケースの一部で競合を上回り、しかもコストは競合の一部で済むからです。あるインターネットユーザーが説明したように、Geminiは6,000ページのPDFを処理でき、同じコストで他のモデルはそれに近づくことすらできません。しかもGeminiの方が精度が高いのです。これは多くの例の一つに過ぎません。今日の動画では、なぜGeminiをバカにするのをやめるべきなのか、詳しく見ていきましょう。
2025年2月6日、これはThe Code Reportです。Googleは近年多くの敗北を喫してきました。独占禁止法違反、過度に配慮的な画像生成器の件があり、昨日はクラウド収益が期待値に届かなかったためアルファベット社の株価が下落しました。しかし、これらの敗北の中にも多くの勝利がありました。「邪悪になるのをやめない」と決めた後、彼らのAIキルボットは飛ぶように売れています。しかしより重要なのは、Geminiが十分に優秀で賢く、そして人々に好かれているため、AIレースを制する正当な候補者となっていることです。
主に人々が好む理由は、それが安価だからです。しかも少し安いだけでなく、90%以上も安いのです。GPT 4oで100万トークンを使用すると10ドルかかりますが、GPT 4oよりも優れているとされるGemini Flag 2で100万トークンを使用すると、わずか40セントで済みます。これはほぼ100%の割引です。DeepSeekよりも安価です。少なくとも彼らが価格を引き下げるまではそうでした。もっともDeepSeekの真の価値はオープンソースであることですが。Geminiにはさらに安価で高速なライトモデルもあり、より高価なプロモデルもあります。
本当に素晴らしいのは、APIを使用する開発者でなければ、これらのモデルすべてを無料で chatbot で使用でき、他のLLMにはできないことができるということです。例えばYouTube動画を視聴することができます。実際、画面の前で目を使ってこの動画を見ているなら、あなたは遅れを取っています。今すぐ実験的アプリケーションを備えた深い思考モデルに行き、Geminiにこの動画を要約させて、Civilization 7で遊ぶ作業に戻るべきです。
さらに驚くべきことに、Flashは100万トークンのコンテキストウィンドウを持ち、プロモデルでは200万トークンまで拡張されます。これは約10万行のコードまたは16冊の小説に相当し、128Kトークンに制限されているO3 miniやDeepSeekと比較して、はるかに多くのデータを開始点として入力できることを意味します。ベクトルデータベースやRAGのスタートアップを持っている人にとっては恐ろしい機能です。なぜなら、ほとんどの人が必要とする以上のコンテキストだからです。
私が試したもう一つの驚くべきことは、Flash 2.0を使用したGeminiとのチャットです。子供たちが「私たちは曲がった球体に住んでいるのに、なぜ水は常に水平を保つの?」といった質問をすると、Geminiはとても自然な方法で話しかけてきて、不気味の谷にいることをほとんど忘れてしまいます。「地球は丸いけど、水はとてもクールで自分の流れに従い、完全にフラットな雰囲気を作り出すんだよ」と。
ベンチマークに関して、GeminiはまだOpenAI O3に後れを取っており、PhD レベルの数学や科学を行う場合には最適な選択ではありません。しかし驚くべきことに、Geminiは現在、人々が異なるLLMを試して順位付けする基本的なブラインドテストであるLM Arenaベンチマークでトップに立っています。DeepSeekやO1を含むすべてのモデルを上回っています。ただしO3はまだこのリストには含まれていません。
しかし、Webデベロッパーにとってより良いベンチマークはWeb Deinaで、そこではGemini 2は O3 miniと同点の5位につけています。一方、SonetとDeepSeekがトップにいます。これは、カーソルのようなツールでこれらのモデルを使用してコーディングした私の経験と一致します。また、GoogleのImagenが現在テキストから画像生成のリーダーボードでトップに位置していることも注目に値します。
Geminiはプロプライエタリですが、Googleは最近、オープンソースコミュニティに大きな勝利をもたらしました。Pebble Watchのオペレーティングシステムをオープンソース化したのです。このスマートウォッチは長い間前に終了しましたが、これまでで最高のスマートウォッチでした。ちなみに、実は彼らはPebble Watchを復活させようとしています。さらにGoogleには、Gemmaと呼ばれるオープンなLLMファミリーもありますが、DeepSeekのようなものと競争するには大きなアップデートが必要でしょう。
しかし、このような技術でアプリを構築する場合、最も重要な選択の一つはコードをどこにデプロイするかということです。そのため、本日の動画のスポンサーであるSavolaについて知っておく必要があります。Herokuが実際に良かった時代を覚えている方なら、Savolaは現代的な優れた後継者のようなものです。Google Kubernetes EngineとCloudflareによってバックアップされた完全なフルスタックアプリケーション、データベース、静的ウェブサイトをすべてデプロイできます。しかも最も重要なのは、面倒なYAML設定なしで行えることです。
お気に入りのフレームワークでアプリを構築するために指を骨まで擦り減らした後、以下の手順で簡単に本番環境にデプロイできます:1. GitリポジトリまたはDockerイメージをSavolaに接続する、2. リソースをプロビジョニングする、3. デプロイボタンをクリックする。DDoS保護、CDN、エッジキャッシング、それを視覚化する美しいグラフを備えたWebアプリケーションとデータベースをホストするだけでなく、CI/CDパイプラインを構築することで、開発から本番環境までのコードの移行を完全に自動化することもできます。以下のリンクを使用して、50ドルの無料クレジットでSavolaを今すぐ無料でお試しください。
これはThe Code Reportでした。ご視聴ありがとうございました。また次回お会いしましょう。
コメント