Gemini 2.5 Proはコーディングが素晴らしい！

3,703 文字

Learn how to build with AI and AI agents in my new courses: code AGENT25 for a 25% discount. This is a limited-time offe...

皆さんこんにちは。週末に行った簡単な実験について、この短い記録を残そうと思います。Gemini 2.5 Proを使った実験です。これはGoogle DeepMindの新しいモデルで、私はWindserv内でアクセスすることができました。実際に試してみて、非常に良い結果を得ています。特に、このモデルが一貫したコード、つまり非常に長い一貫したコードを生成できることに気づきました。これは以前のGeminiモデルと比べてコード生成において大きな改善です。
この特定の例では、Next.jsアプリ、つまり完全に機能するアプリを作成するよう依頼しました。実際には、Pythonを使って開発したスクリプトを渡しました。これらのモデルで私がよくやることは、まずスクリプトを開発して、すべてが正常に動作し、欲しい機能がすべて得られることを確認してから、それをウェブアプリに変換することです。
今回はまさにそれを行いました。渡したコードは基本的に私が書いたスクリプトで、ここに動作するコードがすべてあり、Pythonで書かれています。基本的に検索エージェントを提供するNext.jsウェブアプリの構築を手伝ってもらいました。これは検索エージェントアプリケーションです。このフォルダ内のスクリプト、ここにあるこれらのスクリプトは、検索エージェント機能の動作コードを提供しています。そのコードを参考にして、Next.jsで完全に機能する検索エージェントアプリの構築を手伝ってもらいました。
それがここに表示されているアプリです。ここで見えるすべてのフォルダは、Gemini 2.5 Proが私のために生成したものです。実際にこのフォルダ内に新しいフォルダを作成しました。ここがwebappで、ウェブアプリが存在する場所です。UIの参考としてPerplexityからの画像をいくつか提供しました。結果は同じではありませんが、それでも使える良いものを提供してくれました。
全体的に、長いスクリプトや長いコード行を生成する能力と、コードを理解する能力の高さに非常に感銘を受けています。ここでテストしていたのは、私が渡したコードを理解できるかどうかです。この特定のスクリプトは、300行以上のコードがあると思います。
ここにCascadeログを開いて、正確に何をしたかを示しています。アプリを構築し、ここで私が渡したコードを分析しているのが分かります。通常は計画を与えるべきですが、ここでは大丈夫でした。単に動作するかどうかを素早くテストしたかっただけです。そして、「コードを分析しました」と言い、私が提供した異なるファイルを分析し、ベストプラクティスとして新しいフォルダを作成する必要があると判断しました。そして、すべてのコードをここに書き、EXA Nodeをインストールしようとしました。私はすべての検索クエリにEXA APIを使っています。
それから私が訂正して、「これはパッケージです、xjsです」と伝えました。それが正しいと思います。少なくとも私が見つけたJavaScriptバージョンです。それが私がした唯一の訂正でした。ここでの判断のため、実際にはエラーが発生しました。
通常、これらのモデルを使う場合、Winder rulesやCursor ruleなど、使用しているものに合わせてルールを設定する必要があります。システムが使用したいライブラリや、インストールする必要があるライブラリを認識できるようにするためです。ここで間違いを犯しがちです。通常、ここでミスをするとコードの一部が古くなったり、間違ったコードが含まれることになりますが、まさにそれが起こりました。実際にコードを変更し、その後コードを修正しました。
そこからは、すべてがスムーズに進んだと思います。ここでAPIキーについて説明があり、そのファイルを作成しました。それは自分で行いました。再度実行すると、R.Sからのエラーが表示され、それを渡したところ、修正を手伝ってくれました。それで基本的に完了です。5分もかからなかったと思います。このアプリ全体を作成するのに。
結果を見てみましょう。私にとって最も重要なことは、コードが実際に動作しているか、アプリケーションが機能しているかを評価することです。この時点で私にとって最も重要なことです。ここから機能を追加したり、UIを改善したりできます。それらすべてのことができます。
新しいプロジェクトを始める際に本当にうまく機能するモデルは、私にとってはClaude 3.7 Sonnetであり、ある程度はClaude 3.5 Sonnetです。これが現時点での私のデフォルトモデルですが、このGemini 2.5 Proモデルは、Claude 3.7 Sonnetと非常によく似た働きをしていると思います。それは予想通りです。これは最高のモデルの一つであり、Claude 3.7 Sonnetと競合していると思います。これは変化しています。更新や新機能により、これらのモデルは非常に急速に改善されています。それが素晴らしいこと、印象的なことです。
皆さんにもこれらのモデルを試して、自分に最適なものを見つけることをお勧めします。私はこの二つのモデルを切り替えて使っています。このモデルで問題があれば、おそらくこちらに切り替えるでしょう。このモデルには多くの人が不満を持っているレート制限があり、生成が遅くなる原因にもなっているかもしれませんが、それでも、アクセスがあれば実験してみてください。品質が非常に似ていると思いますし、場合によってはこちらの方が良いこともあります。少なくともこの特定の例では、Gemini 2.5 Proは素晴らしい仕事をしたと思います。
アプリを見てみましょう。これがアプリの外観です。非常にシンプルなアプリケーションで、ローカルで実行されています。AI検索エージェントで、検索クエリを入力するようになっています。ここで「テスラに関する最新情報」と入力すると、EXA検索APIを使用します。テキストの表示はあまり良くないですね。それを改善する必要があります。それはUIの部分の問題です。Claude 3.7 Sonnetはこの点でずっと優れていると思います。ワンショット生成をする時、UIの部分でより良い傾向がありますが、このモデルにもその可能性はあると思います。
私がすべきだったのは、使いたいコンポーネントや、例えばShad CDNなどのUIライブラリなど、特定のライブラリを使いたい場合はそれを伝えることです。それは役立ったと思いますが、それはデモの焦点ではありませんでした。ただ、そのままで動作するかどうかをテストしたかっただけです。
では、ここで検索してみましょう。検索しています…読み込み中…それは動作しているようです。ここで答えが表示されています。「最新の更新によると、テスラに関するいくつかの重要な展開があります」というものです。これらが返された記事で、引用が表示されています。ここに引用は表示されていませんが、それは改善できるかもしれません。でも機能していることは分かります。
もう一つは、これは単純な検索エージェントなので、モデルは今が何年かという情報を持っていません。それは追加する必要がある改善点です。AI エージェントを開発する際によく遭遇する問題です。おそらくこれらは古い記事ですが、テストだけが目的だったので全く問題ありません。
これはいくつかのデバッグ情報です。これを追加しましたが、私は頼んでいません。ただここに表示されています。検索をどのように実行するかを決定した方法など、私は役立つと思います。検索するかどうかを判断するためにツール呼び出しを行います。また、検索クエリを最適化する関数も持っています。これは私が与えた初期クエリを最適化します。その最適化されたクエリがEXA検索APIに供給されます。
つまり、私が渡したコードスクリプトを理解したということです。それが大いに役立ちました。そして見てください、動作するものがあり、ここから機能を追加し続けることができます。Gemini 2.5 Proを使い続けて機能を追加し、ここにサインインボタンなども追加するかもしれません。どうなるか楽しみです。
これについて非常に興奮しています。Gemini 2.5 Proのようなものに加えて、Claude 3.7 Sonnetのような他の優れた推論モデルがあることは、開発者にとって本当に刺激的です。この2つを試して、短所と長所を確認することができます。
要約すると、このモデルは明らかに長いコンテキストを持ち、より長いコードを理解し、より長いコードを生成できると言えます。マルチモーダル機能については、まだテストしていないので、サポートされているかどうかはわかりません。しかし、これで遊び始めたばかりで、Gemini 2.5 Proを使った自分の実験の一部を少し共有したかったのです。