
2,452 文字

今日はGoogleのGeminiが実験版としてPro 2.0モデルをリリースしたことについてお話しします。主な機能を見ていき、実際にテストもしてみましょう。皆さんも自宅で無料でテストできます。ご覧の通り、200万トークンが使えるので、これは驚異的です。2時間分の動画、22時間分の音声を分析用にアップロードしたり、6万行のコードや約140万語を分析することができます。
これらのモデルは音声、動画、コードの処理に優れています。Geminiについて人々の反応を見てみましょう。ご覧の通り、約2時間前に実験版2.0をリリースしたところです。2.0 FLと同様に、約1ヶ月後には正式版がリリースされる予定です。
今日はついでにフラッシュ実験版の正式版もリリースされています。これは現時点で最高のモデルで、コーディングタスクやフィードバック付きの複雑で洗練されたプロンプトに最適です。世界に関する知識の理解が向上し、200万トークンのコンテキストウィンドウを備えているので、多くのことができます。
まずはリリースされたプレゼンテーションシートを見てみましょう。2月5日に一般公開され、Proバージョンについて見てみると、このモデルはコーディングと複雑なプロンプト処理において最高のパフォーマンスを発揮すると説明されています。
12月6日にリリースされたGemini実験版のフラッシュ版から2ヶ月後の今日、正式版がリリースされました。開発者コミュニティからは、コーディングなどの強みとユースケースについて素晴らしいフィードバックを受けています。
このため、本日2.0 Pro実験版をリリースし、そのフィードバックに応えています。コーディング性能が向上し、より複雑で難しい大規模なプロンプトを処理する能力が向上しました。Googleが今まで発表したどのモデルよりも世界に対する理解力と推論能力が優れています。
200万トークンのコンテキストウィンドウで大量の情報を理解できます。典型的なベンチマークでは、以前のProバージョンと比較すると、75.8から3.3ポイント上昇しています。コードは34から36に、54から59に、推論は59から64に向上しています。モデル間の差は大きくありませんが、小さな進歩も重要です。
2.0フラッシュと2.0フラッシュLiteも公開されていますが、これらについては別の動画で話す予定です。無料版のGeminiでは、フラッシュ、フラッシュシンキング、実験版フラッシュシンキングはありますが、2.0 Proはありません。
解決策として、下記リンクのGoogle Studioに移動してください。クレジットカードは不要で、登録するだけです。このプラットフォームでモデルを選択すると、今日リリースされた多くの新しいモデルが表示されます。Gemini 2、Gemini 1.5、Gemaモデルなどですが、今日注目するのは2月5日の2.0 Pro実験版です。
カードにある通り、無料で使用できます。Googleの説明によると、マルチモーダル、リアルタイムストリーミング、ネイティブツール使用に対応しています。典型的なユースケースとしては、10万行のコードの処理や、検索やストリーミング画像・動画などのネイティブツール呼び出しがあります。
このモデルは2024年8月までの知識を持っています。そのため、昨日の試合の結果などは答えられません。Proモデルは最も重いモデルなので、レイテンシーが最も高くなっています。フラッシュLでは青いバーがはるかに短くなっています。
それでは実際に試してみましょう。いつものプロンプトを使って、偶数のリストを渡すトリックを発見できるか見てみます。総当たり方式を使っていますが、それほど遅くは感じません。エラーは総当たり方式を使用していることですが、生成されたトークンは悪くありません。
続けてテストしていきましょう。プロンプトをリセットして、Gemini 2.0 Proで新しいプロンプトを試してみます。今度はマルタと時間のプロンプトです。
実行すると、かなり速く応答しましたが、誤った回答をしています。洗濯物の中にパンツがあるはずなのに、その情報がないため間違えています。
Twitterで見つけた別のプロンプトも試してみましょう。私のTwitterをフォローしていただければ、YouTubeの動画で使用するプロンプトを共有しています。このプロンプトは思考モデルでも解決できていないものです:
「寝ている間に、ページ50にしおりを挟んでいたのですが、友人がページ65に移動させました。目が覚めたとき、しおりはどこにあると思いますか?」
答え:「ページ65にあると思います。友人がそこに移動させたので、私が寝ていたという事実は、しおりが移動されたという事実を変えません。」
正確です。このプロンプトは興味深く、思考モデルでも解決できていないのが面白いところです。応答は速いですが、このような種類のプロンプトは解決できない、あるいは解決すべきではないものです。
最後にPythonでのコード作成を見てみましょう。AIの言語として知られるPythonで、このモデルはコードの分析と作成に特に推奨されています。コードの書き方が気に入りました。GBDゲームのコード生成は比較的速く、これをコピーして自分のコンピュータで実行できます。
プラットフォームでは、消費されたトークンが全て表示されます。入力トークンが13で、コメントが完了すると、入力トークンと出力トークンの合計が2,856になります。13を引くと2,843トークンを出力したことになります。
新しいモデルはコードに特に興味深いかもしれません。現時点でこれらのProモデルを全てのアプリケーションに使用する必要はありませんが、200万トークンを処理できるため、コードの修正などには試してみる価値があります。この点については別の動画で試してみたいと思います。
コメント