新しいGrok-3で何でも作れる方法

4,650 文字

Grok-3で何でも作る方法をご紹介します。なぜGrok-3がこれほど大きな話題を呼んでいるのでしょうか？なぜ昨日インターネットを席巻したのでしょうか？
イーロン・マスクのAI企業であるxAIには課題がありました。OpenAIと競合できる最先端の大規模言語モデルを構築したいと考えていましたが、そのための計算能力が不足していました。そこで彼らは巨大なGPUクラスターのサーバーファームであるコロッサスを構築しました。20万台のH100を使用しており、その費用は想像を絶するものです。そしてその莫大な計算能力の結果がこのGrok-3なのです。競合他社を完全に圧倒しています。
最も驚くべきことは、xAIは2023年に設立されたばかりにもかかわらず、OpenAIのGPT-4oと同等の品質に追いついたことです。さらに信じられないことに、Grokは大規模言語モデルの評価アリーナで14,400点というスコアを達成した初のモデルとなりました。xAIは推論モデルもリリースしており、現在Grokのウェブサイトで試すことができます。これらはOpenAIのo1とo3を上回る性能を示しています。
なぜGrokモデルで開発すべきなのでしょうか？その答えはきっと気に入るはずです。Grokは毎月150ドルの無料クレジットを提供する唯一のAIモデルサービスだからです。つまり、顧客に課金する小規模なSaaSアプリケーションを運営している場合、Grokを使って無料で運用できるということです。これは驚くべきことで、わずか5ドルを支払い、入出力データをモデルの追加学習に使用させるだけでよいのです。
始めるには、xAIコンソールにアクセスし、APIキーのセクションに移動して、Cursorプロジェクトで使用する新しいAPIキーを作成するだけです。
Grokを始める前に、どのようなことが可能か見てみましょう。彼らは新しいディープサーチ機能を追加しました。これはPerplexity AIのDeep Researchに似た機能で、基本的にGoogleキラーと言えるほど素晴らしいものです。私はGrokにゼロからアーケードゲームを作らせてみました。コーディング能力がどれほど優れているか確認してみましょう。
コードをここに貼り付けた結果をご覧ください。ページを更新すると、ゲームが動作しているのが分かります。要求通り、ボールが小さな破片に分かれ、発射体があり、さらにスコアと異なるレベルまであります。素晴らしいですね。
推論モデルについて興味深い点は、これがモデルからの思考トークンの全てではないということです。イーロン・マスクはライブストリームで、他社がモデルをコピーできないように一部のトークンを隠していると明確に述べています。
Grok-3が私たちのプロジェクトの初期化を手伝えるかどうか確認してみましょう。Grok-3に「あなたであるAIモデルのGrok APIを呼び出すPythonを初期化してください」とお願いしました。ディープサーチ機能を使用しているので、更新された情報を検索してGrokを呼び出すことができるはずです。
開発者向けxAIページを閲覧しているのが分かります。これは良い兆候です。そして、コンソールに正しいコードが表示されました。これをCursorプロジェクトにコピーしましょう。すでにコピーして、ターミナルでpython main.pyを実行しており、その結果、Grokが起動して最初の結果を返してくれました。
これで最も基本的なGrokアプリケーションが動作しています。次は少し複雑なものを作ってみましょう。ニュースアシスタントとして機能するAIエージェントを作ってみましょう。エージェントと会話をして、興味がありそうな記事を返してもらうことができます。
Grokは外部ツールに接続するためのファンクションコールに特化して微調整されているため、これを構築できます。ドキュメントには、使用できる様々なツールや、それらのツールにGrokを接続する方法について多くの情報が記載されています。最も素晴らしい点は、このAIエージェントを1行もコードを書かずに構築できることです。
なお、インターネットへのアクセスにはcrawl for AIパッケージを使用します。エージェントが記事にアクセスする必要があるため、これらの例を全てコピーして、Cursorがファンクションコールを参照できるようにします。
Grokのドキュメントを上部に貼り付け、区切り線を入れ、そして「ユーザーがチャットボットと会話でき、チャットボットがcrawl for AIライブラリのツールを使用して記事を推薦できるエージェントアプリケーションを作成しましょう」と指示し、その例を提供しました。
Cursorが返してきた変更は全て良さそうです。ファイル全体をそのまま受け入れましょう。試しに、Cursorが提供したコードを一切変更せずに実行してみましたが、一発で動作しました。私たちの新しいアプリケーションと短い会話を交わし、その結果は実に素晴らしいものでした。
イーロン・マスク関連の記事に興味があると伝えると、Grokはツールを使用してウェブ検索を行い、記事を返してくれました。ちなみに、Cursorに貼り付けたcrawl for AIの例は、単にGitHubページから取得したものです。
次に、エージェントにウェブサイト全体をクロールする機能を追加したいと思います。Cursorが作成したのは単一のウェブサイトをクロールするだけの機能でした。「エージェントがウェブサイトの複数のページをクロールできるようにコードを更新してください」と指示し、区切り線を入れ、crawl for AIのドキュメントからAPI参照のrunManyの部分を全てコピーして貼り付けました。
Cursorがツール定義に新しいツールを追加したのが分かります。これで私たちのAIエージェントはユーザーとの対話においてより柔軟に対応できるようになりました。プロンプトも更新され、「crawl web pageツールを使用して単一のページをクロールするか、対応するツールを使用して複数のページをクロールできます」という内容になっています。
python main.pyをCursorが返した変更をそのまま使用して実行し、イーロン・マスク関連の記事が欲しいと伝えました。アシスタントと会話を続けると、最終的にアシスタントはマルチページツールを使用してCNNウェブサイトを検索し、イーロン・マスクに関する多くの記事と情報を返してくれました。
これをモバイルアプリで実行し、ユーザーがAIエージェントと会話してニュースの好みを伝え、エージェントが毎日ユーザーの好みに合った記事を返すアプリケーションを作ることができます。
ターミナルの単純さに惑わされないでください。さらに良いものを作れることを証明するために、エージェントにアプリのUIを作成するよう指示してみましょう。Cursorに「gradioを使用してこのアプリのUIを作成し、main.pyを改良してください」と伝えます。gradioはPythonの使いやすいユーザーインターフェースアプリです。
Cursorが返した内容を見てみましょう。チャットボットクラスを作成し、エージェントとのチャット機能、そしてUI作成機能も追加されています。全て良さそうですが、実行してみましょう。python main.pyを実行すると、Cursorは私がまずpip install gradioを実行する必要があることを指摘しました。
Cursorが常に100%完璧ではないことを示すために、新しいGrokアプリケーションのUIで実際にエラーが発生しました。エラーメッセージ全体をコピーして貼り付け、「何が問題なのか」と尋ねたところ、動作するはずの新バージョンのアプリケーションが提供されました。
python main.pyを実行すると、ローカルURLが作成され、ブラウザで開くことができます。そこに私たちのGrok-3記事推薦チャットボットが素敵なUIと共に表示されました。Grok-3チャットボットにTechCrunchのDogeとイーロン・マスクに関する記事について尋ねると、多くの情報とそれらのページへのリンクを見つけてくれました。
改善したい点として、ユーザーが記事のウェブサイトを指定する必要がないようにしたいと思います。プロンプトにTechCrunchを使用し、ユーザーに尋ねないように追加します。
このGrok-3 AIエージェントを本当に便利にする機能として、興味のある記事を保存できるようにしたいと思います。チャットボットと会話すると、記事をデータストアに保存し、これを実際のiOSアプリとしてリリースすることもできます。
しかし、面白くするために、「見つけた記事を要約と共にローカルファイルに保存できる新しいツールを追加してください」というプロンプトを作成し、これをGrok-3とCursor内のClaude 3.5 Sonnetの両方に与えて、どちらのAIがより良い応答を返すか見てみましょう。
Grok-3は推論モデルを使用しているため、推論モデルではないClaude 3に対して優位性があると思われますが、すぐに分かるでしょう。
AIで未来を築いている他の人々のコミュニティに参加することに興味がある方は、私たちの新しいDiscordサーバーに参加することをお勧めします。個人的なプロジェクトを構築している場合でも、ソフトウェアアプリケーションで実際に収益を上げたい場合でも、参加する価値があります。技術レベルに関する要件はなく、コーディング経験が全くなくても参加できます。
Grok-3のような大規模言語モデルの品質向上により、事実上誰もが、そしてすでにCursor AIで実現されているように、誰でもコーディングやソフトウェアアプリケーションの構築が可能になり、以前の10倍の速さで学習できるようになると強く信じています。興味のある方は、説明欄にあるリンクから必ず参加してください。
テストの結果を先に言ってしまうと、Grok-3はClaude 3 Sonnetよりもはるかに優れた応答を出力しました。これは驚くことではありません。191秒もの間考え続け、今では私たちのAIエージェントは、ファイル構造に表示されている保存済み記事フォルダに記事を保存する機能を備えています。
全体的に、Grok-3には非常に感銘を受けました。これほど優れているとは予想していませんでした。OpenAIの推論モデルより少し遅れをとっているだろうと思っていましたが、20万台のH100 GPUを使用し、大規模にカスタマイズされたデータセンターで学習させるとこうなるということですね。
このチュートリアルを一緒に進めなかった方は、最初に戻って試してみることをお勧めします。Cursorに自分でプロンプトを試したり、私のプロンプトをコピーしたり、途中で自分のプロジェクトに分岐したりしてみてください。それによって、これらのモデルを実際に使って構築する方法を学ぶことができます。
この内容を楽しんでいただけたなら幸いです。コメント欄でご意見をお聞かせください。また次回お会いしましょう。