Grok 3が制御不能に…

10,329 文字

YouTube
作成した動画を友だち、家族、世界中の人たちと共有

皆さん、シートベルトを締めて離陸の準備をしましょう。スロットルを上げて、上下にピッチを変えていきます。わあ、これは想像以上にすごいですね。一人称視点で見てみましょう。本当に感動しました。このままクラッシュしそうですが。そうそう、ミサイルも撃てるんです。本当にミサイルが撃てちゃうんです。とても感動しています。
何が何だか分かりづらいですが、かなり良さそうに見えます。あ、ボスが出てきましたね。とてもクールです。これもGrokですが、もちろんズームしたり、同じように動き回ったりできます。これはかなりいいですね。
Grok 3はWordleがそれほど得意ではありません。私もそうなので非難はできませんが、そこにはMとAがあるので、elusiveではないはずです。見てみましょう。うわ、かなり強く当たったようですね。
私はGrok 3の基本的な機能をテストして、私たちが与えるさまざまなタスクをどれだけうまくこなせるか確認してきました。お気に入りのユースケースのいくつかを見てみましょう。o3 miniハイとも比較してみます。これらのいくつかはとてもクールだと思います。
VRシューターを見てみましょう。コードはたった127行で、シンプルで自己完結型、Grokから直接出力されたものをそのまま使っています。こんな感じに見えます。VRゲームで、コントローラーを使って、ご覧の通り両手で独立して射撃できるのが面白いところです。このゲームをプレイできますが、私は必要なコントローラーを持っていないのでプレイできません。それでも3Dバーチャルリアリティシューターとしてはとてもクールです。
Gr 3を使ってサイバーマンハッタンの3Dシミュレーションも作れます。276ブロックの長さ、幅、深さがあり、デジタルエネルギーで完全に充電されています。こちらです。回転させて、宇宙を漂うこれらの素晴らしいものを見ることができます。とてもクールですね。
フライトシミュレーターはできると思いますか?確認してみましょう。
はい、とても面白いです。離陸の準備をしましょう。シートベルトを締めてください。スロットルを上げて、上下にピッチを変えていきます。わあ、これは想像以上にすごいですね。一人称視点です。本当に感動しました。このままクラッシュしそうですが、それはゲームのせいではなく、完全に私のせいです。
そうそう、ミサイルも撃てるんです。やった!本当にミサイルが撃てちゃうんです。これは感動しました。言葉遊びではないですよ。このフライトシミュレーターでミサイルが撃てることに本当に興奮しています。
はい、3Dリモートのような見た目のカメラと、GTAスタイルのゲームオーバー画面まであります。
Cursorを使って作られているようですが、詳細は間違っているかもしれません。Anthropic AIを使っていたようですが、Anthropic AIはゲームにミサイルを追加することを望まなかったようです。「申し訳ありませんが、このフライトシミュレーターに武器やミサイルを追加すべきではありません」と言ったそうです。もちろん、Grokにミサイルの追加を依頼すると「了解です」と答えて追加してくれました。
ちなみに、Cursorは実際に史上最速で成長しているSaaS(Software as a Service)のようです。AIの成長を活用して、わずか12ヶ月で年間経常収益が100万ドルから1億ドルに成長しました。AIを搭載したソフトウェア開発環境を作り、AIを統合して大きな成功を収めました。これは何が作れるかの良い例であり、また互換性のあるモデルを使用して、あるモデルがミサイルを拒否した場合は、より制御の効かないモデルに頼むことができます。
Gosu Coderにも素早く感謝を述べたいと思います。Grokのテストに関して、いくつかのかなりクールなプロンプトを提供してくれました。この動画は下にリンクを貼っておきます。他のモデルではうまくいかなかったことをGrok 3で成功させており、使用したプロンプトについて説明してくれています。
Connect 4や、異なるモニターやオーディオなどを取り込めるスクリーンレコーダー、リアルな物理演算を備えたプールゲーム、そして私が特に気に入ったのは、手の動きを追跡してジェスチャーを音楽要素に変換し、ユーザーがジェスチャーを通じて音楽を作り演奏できるコンピュータビジョンベースのアプリケーションを作るというものです。これは試さずにはいられませんでした。
Grokとo3 miniハイの両方がとてもよくできていました。o3 miniハイは両手を同時に画面に表示できるという点で少し優れていましたが、それでもとてもクールなプロンプトでした。
こちらは別の人がGrok 3で作った例です。Ben Duという人です。本名かどうかは疑わしいですが、一発で3Dゲームを作りました。かなりクールに見えますね。素晴らしいです。再現できるか試してみましょう。
プロンプトの中には、キャラクターが正しい方向を向くようにする方法のヒントも含まれているようです。これをGrokとo3 miniハイの両方に入力してみましょう。
これがGrokのバージョンのゲームです。かなり印象的ですね。唯一おかしいのは、AキーとDキーが逆になっていることですが、それは簡単に修正できます。とてもクールです。はい、3Dゲームです。衝突判定があり、さまざまな障害物を回避できます。これができることにはかなり感心しています。
なかなかいいですね。こちらがo3 miniハイです。AキーとDキーは正しい方向を向いています。正しいというのは、Aが左、Dが右に進むということです。カメラの位置が高いので、物事がより見やすくなっています。衝突判定など、他の機能も良好です。これは良いと言わざるを得ません。
Grokバージョンのゲームでは、アクションにより近い位置にいますが、こちらはより遠くから見えます。カメラは物事がより見やすい位置に配置されています。両方とも非常に優れています。Grokのゲームでは、グラフィックスやキャラクターの解像度、走り回る兵士の方が良いですね。こちらではその人物がほとんど見えません。
マウスのスクロールホイールでズームインできます。実際にズームインしてみると、同じテクスチャを使用しているようですね。キャラクターにズームインできて、なかなかクールです。Grokでもズームができるか確認してみましょう。それはちょっと気づかなかった機能なので。
はい、これがGrokですが、もちろんズームしたり、同じように動き回ったりできます。これはかなりいいですね。
PRを見ると、Benという人物(本名かどうかは別として)が使用したものを詳しく説明しています。ライブラリと依存関係を説明し、スクリプトの後半で3D兵士モデルの取得元を指定し、シーンの設定方法を指定しています。
これは興味深いことです。時間とともにこのようなプロンプトを持つことで、人々はただ使用する言葉、つまり自然言語を知ることでコーディングができるようになるからです。そのゲームを再現したい場合は、ここから始めて、その上に構築していけばいいのです。
英語で書かれたこれらの言葉を取り込んで始められます。「ブラウザウィンドウ全体をカバーするWebGLレンダラーをセットアップし、ライティング、半球ライト、指向性ライトなどを含める」というように、ここから始めて、その上に何か構築できないか試してみることができます。
迷路ジェネレーター、壁、衝突判定のセットアップを説明し、兵士モデルを指定し(だから両方とも同じなのです)、アイドルアニメーション、走るアニメーション、それらがいつ再生されるべきかを指定しています。
HTMLゲームに3Dアセットを追加できることに注目してください。例えば、その小さな兵士には複数のアニメーション(アイドル、走る、Tポーズ、歩くなど)があります。これを使ってできることはかなりあります。
次のテストでは、Grok 3とハイがWordleゲームを作れるかどうか確認してみましょう。プレイ方法はこうです。6回の試行で今日の単語を当てます。ここでは実際に5文字なので、「train」と入力してみましょう。
黄色は文字が単語の中にあるが位置が違うことを、灰色はその文字が単語の中にないことを、そして緑(ここにはありませんが)は文字が正しい位置にあることを意味します。「steer」はどうでしょう。
ご覧の通り、T、E、Rが正しい位置にあります。では「other」…「otter」…ビンゴ!これがWordleゲームです。
Grok 3かo3 miniハイがこれを再現できるか見てみましょう。7文字の単語と7回の推測機会を持つWebベースのWordleクローンのコードを書くように指示します。ランダムな7文字の単語を使用します。
GrokがHTMLを提供したら、それを小さなテキストファイルに保存します。game.HTMLと呼ぶことにして、ブラウザで実行できるようにします。
はい、7文字のWordleができました。試してみましょう。「feedlot」は7文字ですね。3つの黄色です。Grokに解かせてみましょう。これについてそれほど深く考える必要はないと思いますが、単語を推測できるか見てみましょう。「word」「word」「word」。
Eが黄色だと分かりました。つまり単語の中にありますが、位置が違います。Fは灰色です。「leing」…見てみましょう。実際、これらは酷い推測です。2つのEが同じ位置にあるので、あまり役に立ちません。
もう一度「thinkon」で試してみましょう。Grok 3に「thinkon」を試させてみます。次の単語の推測を見てみましょう。これを見て、次に何が来るかを考えてもらいます。「blaze」という提案が来ました。試してみましょう。おお、かなり良くなりました!
Eの位置を特定できました。3つの文字が、その位置ではありませんが単語の中にあります。もう分かりましたか?次の推測を求めてみましょう。同時にo3 miniハイもテストしています。どちらがWordleが得意か見てみましょう。
これについてこんなに長く考えていることと、結論に至るまでに多くの単語を一行ずつテストしていることに非常に感心しています。すでに2分近く考えているのですが、これは面白いですね。ブルートフォースアプローチのように、単語を一つずつテストしているようです。
面白いのは、実際の単語ではないものもテストしていることです。「alternative」、「L」かもしれない、「clude」と言いましたが、「それは単語ではない」と気づきます。「elusive」という単語が何度も出てきているようです。「elusive」「elusive」。
そうですね、Grok 3はWordleが得意ではありません。私も同じですが、MとAがあるので「elusive」ではないはずです。o3 miniはクラッシュしたようです。かなり長時間推論ループに入っていたようです。
これらのAIすべてを困らせる一つのことを見つけたようですね。それはWordleのようです。もう一つ試してみましょう。画像を与えるのではなく、文字が何かを伝えてみましょう。
これまでに得たヒントをすべて文字で書き出してみました。画像ではなく、単語だけで分かるか見てみましょう。両方とも「example」だと考えています。今となっては、それが正解だということは明らかですね。「example」…ビンゴ!よくできました、AI達!
ちなみに、気になる方のために、左側は同じプロンプトをo3 miniハイに与えたものです。まず、ダークモードは非常に良いですね。下に入力する代わりに、その中に入力します。「example」と入力してEnterを押すと、そこにあります。「pleases」と入力すると、「単語リストにありません」と表示され、そこで行き詰まってしまいます。これ以上何もできません。「pleases」は単語ではないのでしょうか?「これは私を喜ばせない」というように。
人々がDeep Researchを使ってGrokに何かの作り方を完全に研究させているのを見かけています。必要なアセットをすべて収集し、ゲームの特定のメカニズムを実装する方法についてオンラインリサーチを行うなどして、その研究を基に「think」機能を使ってゲームを一つのテキストブロックとして作成します。
これがいかにうまく機能するかを示す、非常に優れたデモを2つ見ました。一つはFlappy Bird、もう一つはGrand Theft Autoです。
そこで、GTAスタイルのゲームを試してみました。最初のプロンプトは「p5.jsでGrand Theft Autoを実装してください。非常に洗練されている必要があり、スプライトとアセットを自分で作成してください。アセットをインポートしないでください」というものでした。
このプロンプトには、Deep Researchを使用します。ウェブを検索し、多くのソースを見つけ、物事の作り方を考え出すことができます。次のプロンプトでは「このゲームを1つのコードブロックで作成してください」と言い、そこで「think」機能を使用します。
ご覧の通り、私たちが求めていることを考え、衝突判定の改良、視覚効果の強化、プレイヤーの視覚的な詳細などを考えていました。かなり良いですね。アセット作成、クラスとゲームステート、衝突判定などについて、かなり多くのことを考えました。
ゲーム機能と実装の詳細についての小さな表もあります。とても良いですね。これを書くために使用した引用もいくつかあります。そしてこのゲームの作成を開始し、考え、これが最終出力です。
editor.p5js.orgを使って、与えられたものを投稿してみましょう。こちらがゲームです。矢印キーで動き回れます。ドラは、動いているときにキャラクターがアニメーションすると言っています。Eキーで車に乗れますが、ご覧の通り、キャラクターは動いていません。動きがありません。
Grokに戻って文句を言ってみましょう。キャラクターの足は動くのですが、キャラクター自体が動かないと。それが役立つか見てみましょう。
その間に、スーパーマリオワールドの作成も依頼しました。ご覧の通り、それに必要なさまざまなアセットなどについて、かなりの深い研究を行っています。それが完了したら、1つのコードブロックで作成するように依頼し、これがそのコードブロックです。
再び投稿してみましょう。これが出力です。動いていますね。スペースキーでジャンプします。これはかなり良いですね。これ以上のことはあまりありませんが、うまく機能しています。
Flappy Birdでも同じことを試してみました。これがその出力です。これはかなり良さそうです。クールなのは、すべてのグラフィックスを生成できることです。既存のものをインポートするのではなく、すべての独自のグラフィックスを作成しています。
GTAゲームに戻りましょう。問題は、キャラクターが建物の中にスポーンしたことでした。それが修正されたことを願っています。やってみろということですね。
こちらがそのコードです。どこかにキャラクターのスポーン位置があります。入力して探してみましょう。はい、ありました。これらの座標でプレイヤーを初期化しています。250、250に設定して、何か変化があるか見てみましょう。
ご覧の通り、プレイヤーは動き回れるようになり、Eキーを使って様々な車両にハイジャックできます。それがどうなるか見てみましょう。Eを押しましたが、車に乗れません。車も建物の中にいるからです。
Eキーはプレイヤーが車の近くにいるかどうかをチェックします。そこに入れるはずなのですが…まあ、できないようですね。
ちなみに、これがChatGPTで行った深い研究の実装計画です。このようなものがうまく機能するか見てみましょう。o3 miniハイを使って、以下のゲームを1つのコードブロックで作成するように依頼し、それをそのまま貼り付けて、どうなるか見てみましょう。
その間に、Grokは車が動かない問題を解決しました。再び、それらの車を文字通り歩道に追い出す必要があります。建物の中にいるからです。
こちらが静止している車です。それらの座標を変更してみましょう。はい、これでいいですね。車は道路上にあり、近づいて車に乗り込んで運転を始められます。これはかなりネオですね。建物に衝突するはずです…はい、その通りです。衝突判定があります。
これで、実際の運転メカニズムなどを備えたゲームを作成しています。もちろん、GTAはGTAらしく歩行者やその他の要素がなければなりません。ゲームにそれらを追加できるか見てみましょう。轢き殺せる歩行者を追加してみましょう。なぜならそうだからです。
その間に、o3 miniハイが彼らのバージョンを出力しました。53秒間考えて、これらすべてを出力しました。それがどれだけうまく機能するか見てみましょう。
こちらが彼らのバージョンのゲームです。何が起こっているのか分かりませんが、運転メカニズムはかなり良いです。赤い点が車で、白い点が歩行者なのだと思います。100%確信は持てませんが、動きは良いです。物が跳ね返るのもかなり良いです。ただ、これは本当にGTAとは言えません。
あ、分かりました。スペースバーで物を撃つと、青いもの、つまり警察が現れ、あなたを追いかけようとします。目標は彼らから逃げることです。これはGTAとアステロイドを組み合わせたようなものですね。通りなどはありませんが、ご覧の通り、これは独立したゲームとして面白いかもしれません。
基本的にはアステロイドです。GTAのテーマを持つアステロイドゲームのようなものですね。こちらがGrokスタイルのGTAゲームです。同じ状態に戻りましたが、今は轢き殺せる歩行者がいます。視覚的な確認がもっとあればよかったのですが、はい、彼らは単に消えてしまいます。
ご覧の通り、基本的なことは何とかできています。何が起こっているのかは理解していますね。GTAスタイルのゲームについては、Grokの方がはるかに良いと言わざるを得ません。この遅延映像を見れば、どのゲームを目指しているのかは分かります。かなり近づいています。o3 miniハイでは、GTAゲームには見えません。
しかし、こちらは面白いですね。XのDanからのものです。彼は「Grok 3で最初の3Dシングルプレイヤーおよびマルチプレイヤーゲームの1つを作りました。3D移動、リキャストされた世界を考えてください。これがその道のりです」と言っています。
はい、かなり良さそうに見えます。あれは別のプレイヤーだと思います。マルチプレイヤーゲームなので、それは別の人がコントロールしているものですね。
o3 miniで始めましたが、数時間で壁にぶつかったそうです。複雑さに対応できず、出力トークンとコンテキストに制限がありすぎたそうです。そこでGrok 3が登場しました。ゲームは3,000行のコードがあり、ライブラリや設定などは除外されています。Grokはそれをすべて理解します。他のモデルは1,000行を超えると詰まってしまいます。これが3Dのゲームチェンジャーでした。
ゲームの内容は、AIボットを避けながらスピードブースターと弾薬コアを収集するというものです。Grokはパトロールパス、衝突判定、ヘルスシステムをスクリプト化しました。また、都市を自動的に生成するアルゴリズムも作成しました。深い研究の後、ソロプレイは生き生きとした感じがするようになったそうです。
この人は深い研究を取り入れたようです。これはますます一般的になっていくと思います。ChatGPTの深い研究能力には本当に感動しています。素晴らしいです。今では1日1回は使用しています。まだ上限(月100回)には達していませんが、かなり近づいているはずです。個人的な研究、つまり私が知りたいことと、このチャンネルのための研究の両方に使用しているからです。本当に優れています。
彼はマルチプレイヤーを追加できました。数時間の調整後、Grokはプレイヤーの位置と射撃をクライアント間で同期させ、2人のデスマッチがライブになりました。ログインシステムとキャラクターセレクターを含みました。すごいですね。キャラクター選択といくつかの他のUI要素。
これはExpressサーバーでWebSocketsを使用してデータをストリーミングしています。こちらが高レベルのアーキテクチャです。
ドラはジャンプ台を作成し、実際にかなりクールなグラフィックスを使用しています。実際のゲームのように見えます。良いですね。
ポイントは、最初からこのようになっていたわけではないということです。これが初期バージョンで、アセット、キャラクター、そのすべてが後から追加されました。
さまざまなビジュアル、キャラクター、プラットフォームなどを作成するために使用されたプロンプトがこちらです。視覚的にどのように見せたいかというアイデアを持ち、その後Grokに求めるスタイルでそれらのものを作成するように依頼します。基本的なコードがあり、画像があり、ステップ3ではそれらをゲームに組み合わせます。
こちらは別のプロジェクトで、都市を飛行する紙飛行機シミュレーターです。とてもクールですね。
VictorMという人物は、これが彼が今まで使用した中で最高のコードモデルだと言っています。ランダムなアイデアを次々と投げかけ、プロジェクトをほぼエラーフリーで400行まで成長させました。
こちらはサイドスクローリングシューターです。飛び回って射撃するというものです。とてもクールですね。
こちらはTesla hodlerです。また別のスクローリングシューターがあります。ここにはかなりの複雑さがあります。緑の円などの一部は見た目だけのようですが、いや、その中を飛んでいるのかもしれません。何が何だか判別するのは難しいですが、かなり良さそうに見えます。
あ、ボスが出てきましたね。とてもクールです。
最後に、これを見て驚きました。ご覧の通り、壁をクリックすることで、青とオレンジの物を設置できます。これが何のゲームだと思いますか?ヒントを出しましょう。一方の色を通り抜けると、もう一方から出てきます。オレンジを通り抜けると青から出てきます。そうです、これはPortalです。GrokはPortalの3Dバージョンを再現することに成功しました。
これは3Dなのでしょうか?疑似3Dのような感じですが、それでも試してみましょう。Portal 2にインスパイアされた3Dゲームをp5jsで作成するように依頼しましょう。右クリックでオレンジのポータル、左クリックで青のポータルを作るポータルガンを追加します。
テストしてみましょう。Grokがポータル2のゲームの準備ができました。o3 miniハイはクラッシュしましたが、ここで何が起こるか見てみましょう。
はい、できました。青とオレンジを撃てます。青をここに、オレンジをそこに置きましょう。ここを通り抜けると、そこに出るはずです。それがどう機能するか見てみましょう。
それがうまく機能したのかどうか、100%確信が持てません。うまく機能しなかったようですね。青を通り抜けると…そこではうまく機能したようです。オレンジを通り抜けると青側に出ます。そして青を通り抜けるとオレンジ側に出るはずです。はい、はい、少し不安定ですが、一応想定通りに機能しています。
こちらがo3 miniハイ、というよりむしろo3 miniハイのものです。できました、とてもクールですね。青とオレンジがあります。これの方が良いですね。はるかに見た目が良く、よりクリーンです。
オレンジをここに、これが青です。ここから出てくるはずです。はい、その通りです。ここを通り抜けるとそこに出て、青を通り抜けるとそこに出ます。壁の中に入り込めるでしょうか…あ、困ったことになりました。ポータルを削除すると、永遠に壁の中に閉じ込められてしまいます。
ただし、ポータルの上にポータルを置けば大丈夫です。オレンジがここにあり、青が…おっと、青が…クリックの操作が少し不安定ですが、それほど悪くありません。そして、はい、想定通りに機能しています。とても良いですね。
このケースではo3 miniハイの方が少し優れていると言わざるを得ません。皆さんはどう思いますか?私はこれをかなり強力なコンテストだと思います。確かにo3 miniハイと同等のレベルにあり、いくつかの面では優れています。特にUIの要素に関しては、時にo3 miniハイの方が少し優れているように見えますが、全体的にGrok 3はかなりの実力を持っています。
コメント欄で皆さんの意見を聞かせてください。ここまで見ていただき、ありがとうございます。私の名前はWes rothです。次の動画でお会いしましょう。

コメント

タイトルとURLをコピーしました