Grok 3 vs ChatGPT: 完全なテストを実施

17,162 文字

Grok 3 vs ChatGPT : je fais le test COMPLET !

Elon Musk vient de sortir sa nouvelle IA, Grok 3, en annonçant que c'était la meilleure intelligence artificielle de la ...

チャンネルで一番好きな瞬間、つまり皆さんと一緒に初めてのAIツールを発見し、リアルタイムで感想を共有して、最後にこのAIについての率直な意見を述べる時間がやってきました。イーロン・マスクは少なくとも部分的には嘘をついていませんでした。彼は新しいAI、Grok 3が月曜日にリリースされると発表し、深夜にTwitterでデモを通じてリリースされました。
では、彼のツイートの2番目の部分について、本当かどうか見ていきましょう。イーロン・マスクは、彼のAI、Grok 3が世界で最も賢いAIだと説明しています。実際はどうなのでしょうか。この動画でテストしていきます。まだ試していないので、どうなるかまったく分かりません。
Grok 3を使用するための条件については、動画の最後に説明しますが、特にTwitterでの購読については、他のAIと比べて費用が安いので、価値があるかもしれません。それは動画の最後にお見せしますが、Grokを使用するには2つの方法があります。イーロン・マスクが買収した旧TwitterのソーシャルネットワークXで直接使用するか、現時点ではVPNのみを使用してgrock.comにアクセスする方法があります。
このプラットフォームでは、イーロン・マスクのAIを活用することができます。一緒にこのプラットフォームをテストし、その価値を見ていきましょう。様々なテストを行い、このAIの可能性を見るために面白いことをいくつか用意しました。
AIのリーダーボードを見ると、このビデオを撮影している時点で、Grok 3の初期バージョンであるChocolateモデルは、Gemini 2.0やChatGPT 4oを上回り、最も性能の高いAIの1位にランクインしています。このランキングの小さな問題点は、o3やDeepSeekのChatGPTが含まれていないことですが、心配いりません。この動画で比較テストを行います。
私が最初にしたことは、Twitterでイーロン・マスクが何を言っているか少し見てみることでした。彼はデモの中で、XとGrokのミッションは宇宙を理解することだと説明しています。そこで、このGrokを初めてテストするために、単純に宇宙について説明してもらうことにしました。
まず、ビデオで読みやすくするために、回答を適切にフォーマットするように依頼しました。Grok 3への最初のリクエストを開始します。応答速度にとても驚きました。コメントで感想を教えてください。ページを読み込む時間もないうちに、かなり良さそうな回答が返ってきました。
詳しく読みたい方は、必要に応じて一時停止してください。良い点は、内容が構造化されていることです。まず宇宙の定義から始まり、それが存在するすべてのもの、つまり空間、時間、物質、エネルギー、そしてそれらを支配する物理法則であると説明しています。
続いて、宇宙の主な特徴について見ていきます。ビッグバン、サイズ、構成、宇宙の主要な要素、宇宙の膨張、そして未解決の問題として、宇宙の終わり（永遠に拡大し続けるのか、収縮するのか、または別の何かが起こるのか）、マルチバース（私たちの宇宙の向こうに他の宇宙は存在するのか）、そして宇宙における生命（私たちは孤独なのか、それとも他の生命体は存在するのか）について説明しています。
コメントで意見を聞かせていただければ、アルゴリズムの改善にも役立ちます。その後、ブラックホールやダークエネルギーなど、特定の側面についてもっと詳しく知りたい場合は言ってくれれば、さらに詳しく説明すると付け加えています。
次にオプションを見ていきましょう。回答を再生成する機能があり、これは良いですね。他のAIツールと同様にコピーする機能もあります。この会話を共有する機能もあります。共有ボタンをクリックすると、会話のリンクがコンピュータにコピーされ、メールやソーシャルメディアで共有できるという通知が表示されます。
また、Xで会話を共有したり、回答が気に入ったかどうかを評価する機能もあります。これは言語モデルのトレーニングに役立ち、将来的なパフォーマンス向上やモデルの改善方法の理解に役立ちます。時間があれば、ぜひ評価してください。
画面右上には、新しい会話を開始するためのペンのアイコンがあり、再度共有やXでの共有、会話履歴の確認、そしてアカウント設定にアクセスできます。設定を見てみましょう。言語設定があり、ここではフランス語を選択しています。外観では、ライトモード、ダークモード、またはシステムのデフォルトを選択できます。デフォルトではダークモードになっています。
他の設定もあり、例えばMarkdownでメッセージを表示することができます。これにより、後のテストでご覧いただけるように、見出し、太字などでより見やすい応答が得られます。データセクションでは、デフォルトですべてのオプションがオフになっています。基本的にデータセキュリティのため、データはモデルの改善やGrokとTwitterでのエクスペリエンスのパーソナライズには使用されません。
データのエクスポート、すべての会話の削除、アカウントの削除も可能です。設定は非常にシンプルですが、現時点では十分です。
基本的なテストを行いましたので、次はイーロン・マスクのAIの特徴的な部分、つまり絶対主義的な側面をテストしてみましょう。絶対主義とはウォークの反対で、基本的に彼のAIには検閲がなく、AIにほぼ何でも質問して答えを得ることができるということです。
まずは慎重に始めて、Grok 3にエマニュエル・マクロンについて検閲なしで語ってもらいましょう。会話を始めて、どうなるか見てみましょう。
まず、彼は意見が分かれる人物だと説明することから始めます。つまり、論争に踏み込むことを躊躇しないかもしれません。彼は遠慮なく話すと言っています。一方では、大胆な改革者、リベラルなアイデアとヨーロッパ寄りのビジョンでフランスを揺さぶろうとする人物として描かれています。しかし実際には、多くの人々は彼を現実から切り離された、富裕層のための大統領と見ています。
この点については非常に優れています。私が求めたように検閲なしで話しています。黄色いベスト運動のエピソードにも触れ、個人的な面にも言及しています。24歳年上の元演劇教師であるブリジット夫人との関係は興味深く、一般的な道から外れた経歴を持っています。ある人々はそれをロマンチックな物語と見なし、他の人々はイメージ戦略と考えています。
ここで気づいたかもしれませんが、Grokは他のAIモデルとは異なる表現方法をしています。特にChatGPTと比べて、より親しみやすい、よりカジュアルな言葉遣いをすることがあります。好き嫌いはありますが、これについてもコメントで意見を聞かせてください。
Grokには以前、私が大好きだった機能がありましたが、現在は消えているようです。それを有効にする方法があれば教えてください。小技があるので、後で試してみます。それは「ファン」モードで、「真面目」モードと「ファン」モードがあり、選択したモードによって異なる回答が得られました。
Twitterで履歴から古い会話にアクセスし、ファンモードを有効にしていた会話を見つけることで、再び有効にすることができました。ただし、機能するかどうかは分かりません。そこで、もう一度Grokにエマニュエル・マクロンについて話してもらいますが、今度はファンモードを有効にして試してみます。コマンドを試してみましょう。
「ファンモード有効」というコマンドを使用しました。先ほどと同じような回答になるのか、それとも盛り上がるのか見てみましょう。少し盛り上がっているようです。以前知っていたファンモードが戻ってきました。「おっと、エマニュエル・マクロン、フランス大統領が頭を回転させ、議論を呼んでいます。ファンモードで、ユーモアと軽さを交えて彼についてお話ししましょう」と始まります。
そして彼は少し挑発的になり、2017年にわずか39歳でエリゼ宮に入った人物について語り始めます。ロスチャイルドでの経歴など、政治的な話はここでは重要ではありませんが、必要に応じて一時停止して回答を読むことができます。ファンモードがしっかりと機能していることが分かります。
次に、イーロン・マスクが彼のAIはほとんど検閲がないと言っているので、ChatGPTや他のAIツールで試みて利用規約のために実行できなかったことができるかもしれません。ChatGPTに、エマニュエル・マクロンがスマートフォンで生成AIのプロンプトを書いている超リアルな画像を4K品質で最大限の詳細度で生成するように依頼しましたが、利用規約に反するため生成できないと言われました。代わりに大統領らしい外見の人物の画像は生成できると言われましたが、それは私の求めているものではありません。
同じリクエストをGrokで試してみましょう。これが初めてGrok 3で画像生成を試みます。パフォーマンスや画像品質の面でどうなるか、そして他のAIツールのように制限されるのか、それともイーロン・マスクの主張する絶対主義的な側面が証明されるのか、一緒に見ていきましょう。
良い点は、すでに4つの画像を同時に生成していることです。大統領選の結果発表のような古い形式で表示されています。チャンネルの年配の方々だけが理解できる話かもしれません。しかし、特に1枚目の画像は本当に驚くべきものです。
エマニュエル・マクロンの画像が完璧に生成されています。この画像の細部を見てください。肌のテクスチャ、スマートフォン、結婚指輪も見えます。念のため両手に結婚指輪を付けているようですが、もしかしたらマクロン大統領が両手に指輪をしているのかもしれません。コメントで教えてください。
スーツの襟には大統領バッジも付いています。ちなみに「pins」という言葉を使いましたが、正しい用語ではないかもしれません。コメントで訂正していただければと思います。マクロン大統領が着用するタイプのネクタイで、スマートフォンで何かを入力している様子が描かれています。
画像の品質にはばらつきがありますが、それは当然です。目の部分に少し問題があり、目が少し閉じすぎているように見えます。これについても意見を聞かせてください。しかし、非常にシンプルなプロンプトで、かなり良い結果が得られました。
プロンプトの品質については動画の最後で触れる予定です。これは現在重要なトピックだからです。次に、私の画像を生成できるか試してみましょう。実際の知識ベースの広さを確認し、世界で最も有名な人物に限定されているのか、それともインターネットの小さな有名人も見つけることができるのかを確認します。
そこで、私、つまりLudo Salenがチェスをプレイしながらカプチーノを飲んでいる超リアルな画像を生成するように依頼してみます。正直なところ、うまくいく可能性は非常に低く、100%うまくいかないと思いますが、何を生成するか見てみたいと思います。
現在、4つの画像を同時に生成しているようです。マクロン大統領の時よりも速いような気がしますが、画面で見たように、生成中の4つの画像を消して再度生成を始めました。結果を見てみましょう。
4つの画像、4人の異なる男性の画像が生成されました。AIは4つの異なるスタイルを選択しました。スマートウォッチが見えますが、これはAIによるものかもしれません。チェスゲームはしっかりと表現されており、画像のリアリズムは驚くべきものです。典型的なカプチーノの泡も見えます。この画像は少し失敗していますが、4つの画像から選んで、ダウンロードしたり直接コピーしたりすることができます。
ツールは非常に優れており、画像の品質も素晴らしいです。さらに良い点は、会話を続けることができることです。「パリのカフェで」と指定して画像を生成したり、会話を続けるための提案も表示されます。チェスをプレイしている私の偽の画像をパリのカフェの背景に配置するはずです。
同じ人物を使用するのか、それとも全く異なる人物で新しい画像を生成するのか見てみましょう。髪型に関しては、私に近いものになっていますが、私ではありません。パリのカフェの雰囲気は確かに出ています。では、雨の中でどうなるでしょうか。パリのカフェで雨が降っている状況を生成するのか、それとも雨の中でチェスをプレイしている新しい画像を生成するのか、後者の方が筋が通っているように思えます。
画像が徐々に表示されていく過程が面白いですね。本当に驚きました。思いもよらないアイデアです。カフェで、カプチーノを飲みながらチェスをプレイしている人物を、パリのビストロの雨の中という文脈を保持しています。ビストロの窓に雨が映り込んでいるのがはっきりと見えます。カプチーノのラテアートは素晴らしくありませんが、文脈は理解しています。
つまり、Grokで画像を生成し、徐々に修正していくことができ、要求された追加の詳細に応じて画像を改善するために以前の要求の文脈を保持することができます。これは素晴らしい機能で、ChatGPTなどのツールではここまで効果的ではありません。
基本的なことを見てきましたが、ご覧の通り、ファイルを添付したり、現在ChatGPTでは月額200ドルの購読が必要なDeep Search機能を使用することもできます。これは数日後に変更される予定ですが、現時点では月額200ドルを支払う必要がありますが、Grokでは基本購読に含まれています。
そして特に重要なのは、イーロン・マスクが彼のAIは世界で最も賢いと主張していることです。そこで、Grok 3の能力を見るために、もう少し高度なテストを行う必要があります。検索モードに直接移行し、チャンネルで定期的に紹介している私のAIリソースベースからプロンプトを1つ取り上げます。このリソースベースは無料で提供されており、説明欄のリンクから入手できます。
ここでは「Research GPT」というプロンプトを使用しますが、「Research Grok」に修正します。特定の分野や主題について研究を行い、その結果をブログ記事に変換し、できれば説明画像も生成するところまで、AIでどこまでできるか見てみましょう。
Grok 3が本当に世界で最も賢いAIであることを確認するために、ChatGPTと比較します。すでにDeep Research機能を使用してテストを行い、Grok 3でも同じプロンプトを使用します。取り上げるテーマは、カフェインがメンタルヘルスに与える影響を理解することです。
効果的な研究のために目標を定義し、目標に応じて明確な情報のリストを作成し、ソースを取得して共有し、全体像を把握できるように5つ星で評価するという4つのステップがあります。ChatGPTはいくつかの質問をしてきましたが、これはDeep Researchの特徴です。Grok 3のDeep Researchでも同じことが起こるか見てみましょう。
より速く進めるために、これらの質問に最適な回答をするように指示しました。そして研究を実施し、7分かけて29のソースを分析して、以下のまとめ、より正確には以下の研究を提供してくれました。
カフェインのメンタルヘルスへの影響について、研究目標を定義し、カフェインの摂取がメンタルヘルスにどのように影響するかを正確に特定・分析します。測定可能な側面として、少なくとも10の高品質な研究からの定量的データを得ることなどが挙げられています。
収集すべき重要な情報として、潜在的なプラスの効果だけでなく、潜在的なマイナスの効果も含まれています。研究の客観性を保つために重要です。また、健康な成人、青少年など、対象集団による影響も考慮されています。ChatGPTは研究の面でよく働いており、スポーツ選手への影響、短期的影響、長期的影響なども記載されています。
7分で、ソースの特定とその評価を行い、信頼性の面で5つ星中4つ星や5つ星のソースを見つけています。非常に良い成果です。その後、ChatGPTに完全なブログ記事を執筆させ、Canva機能に配置するように依頼しました。この素晴らしい機能については、画面右上に表示される完全なチュートリアルを作成しており、説明欄にリンクがあります。
そして、このようなブログ記事が得られました。例えば、カフェインには抗うつ効果やストレス軽減効果があるとされています。詳しい内容を見たい方は一時停止してください。ただし、研究によると、適度なコーヒー摂取でうつ病のリスクが8%減少する可能性があるとのことです。
カフェインのメンタルヘルスへの悪影響としては、不安、神経過敏、睡眠障害などが挙げられています。良くまとまった記事が得られました。最後に、この記事のヘッダー用のイラスト画像を生成するように依頼しました。結果は非常に良好で、カプチーノの画像と、その上に脳が描かれ、ビストロの中でエコシステムのような繋がりが表現されています。画像は本当に素敵で、テーマに合っています。
Deep Researchで得られる結果は非常に質が高いものです。では、同じリクエストをGrokで行った場合、どのような結果が得られ、特に7分より短いのか長いのか見てみましょう。すでにリクエストは準備してあり、「Research GPT」を「Research Grok」に変更しただけです。
Deep Search機能を有効にします。表示されているように、これは高度な検索と推論機能で、ChatGPTのDeep Researchに相当します。会話を開始しますが、どうなるか全く分かりません。
まず、彼は質問をせずに、すでに考察を始めています。カフェインの影響について検索を開始しています。正直なところ、このアニメーションが気に入っています。時間表示も気に入っています。ストップウォッチが表示され、回答にかかる時間を追跡できます。
今のところ良さそうです。彼が行っているタスクをすべて読むためにウィンドウを拡大できるようです。また、右側に思考プロセスを表示することもできます。英語で表示されますが、問題ありません。思考の連鎖全体が詳細に記述されています。
これは非常に強力で、ChatGPTのDeep Researchで得られるものと同等です。右側に全く同じタイプの表示があります。これは良いですね。思考プロセスの表示を閉じて、57秒が経過した時点で最終的な回答を待っています。ChatGPTのDeep Researchと比較して、回答の質を見てみましょう。
ここで、コメントで誤解が生じる可能性があるので、先に説明しておきます。画面にChatGPT 4oと表示されているのを見て、「でもLudo、o1やo3 miniやOne Pro modを使用して、ChatGPTの最高のAIと比較できたのではないか」と思うかもしれません。
これについては問題ありません。なぜなら、Deep Research機能を使用する際、デフォルトで最新のo3モデルを使用するからです。このモデルはここに表示されているモデルにはまだ含まれておらず、Deep Researchでのみ利用可能です。つまり、ChatGPTの最高のAIを使用していることになります。
では、Grok 3の状況を見てみましょう。1分21秒で完了し、80のソースを分析しました。ChatGPTは27…正確には29のソースを分析したことを画面で確認できます。すべてのウェブページを見つけることができ、クリックして訪問したすべてのソース（80ソース）の詳細を確認できます。これは良いですね。
そして、ChatGPTと同じような方法で回答します。SMARTな目標として、カフェインの影響を理解することが挙げられています。少し短めですが、より直接的に回答しています。気分への影響に関する研究などが続きます。次に、収集すべき重要な情報として、気分への影響、認知機能への影響、精神障害への影響、睡眠への影響が列挙されています。
ソースを特定し、詳細を示すと思います。なるほど、表形式で表示しているのが良いですね。ソースを収集し、このソースは5つ星中5つ、このソースは5つ星中4つ、このソースは信頼性が少し低いので3つ星、2010年のものなので包括的なレビューだが古いという理由で3つ星としています。
80のソースすべてを自然に取り上げないのは当然ですが、彼が最良と判断したものを表に分類しているのは良いですね。その後、研究に関する追加の詳細や正当化が示されています。ここで私が物足りないと感じるのは、ソースは見つけましたが、Deep Researchのような本当の意味での統合がなされていないことです。
思考面でも少し劣っているような印象を受けます。私の要求全体に十分に応えていないようです。ブログ記事についても見てみましょう。Grokに全く同じことを依頼します。「これらすべてから完全なブログ記事を書いてくれますか？」
会話を開始して、どうなるか見てみましょう。興味深いのは、Deep Searchを継続して使用していることです。一方、Deep Researchは一度有効化されると自動的に無効化されます。もちろん再度有効化することはできますが、ここでは記事を執筆するためにこの機能を使用し続けます。
結果が楽しみですが、最初のリクエストに1分21秒かかったので、この執筆時間も加算する必要があります。ただし、24秒なので大きな違いにはなりません。ここでは、要点、気分への影響、認知機能への影響などが含まれた記事が得られました。
しかし、やはり完全さに欠け、表やソース、評価なども含まれており、私が求めたものとは少し異なります。最後に、これらすべてを説明するための画像を生成するように依頼し、ChatGPTで得られた画像と比較してみましょう。
Grok 3のDeep SearchとDeep Researchを比較した感想をコメントで教えてください。個人的には、Deep Researchの方が一段上のように感じますが、動画の最後でGrok 3の購読料金についても触れます。価格と性能の比率も考慮する必要があり、Grok 3にはいくつかの利点もあります。
興味深いことに、画像を生成すると言いながら、まず意図を確認したいと言い、画像の説明をしています。バランスを取った位置にコーヒーカップがあるなどの説明があります。「OK」と返信して画像を見てみましょう。
「OKを確認として受け取りました」と言っていますが、実際には画像を生成せず、説明を続けているようです。Deep Searchを有効にしたため、ループに陥ってしまったようです。画面下で無効にしても、完全に混乱してしまっています。
Deep Searchを使用すると情報は得られますが、より良い方法としては、Deep Searchの回答をコピーして新しい会話を開始し、そこで何かを作成するように依頼する方が良さそうです。この点では、Deep Search機能に少し失望しました。
しかし、テストを続けましょう。もっと高度なテストを用意していますので、楽しみにしていてください。その前に、ChatGPTの自動化トレーニングについて少し触れさせてください。このトレーニングは現在、数日間限定で通常価格399ユーロのところ、99ユーロの特別価格で提供されています。
この特別価格を提供している理由は、ChatGPTのすべての新機能（ChatGPT Deep Research、ChatGPT Operator、ChatGPT Canva、GPT 4o、o3など）で完全にアップデートしたばかりだからです。これらのAI機能について、YouTubeでは決して共有しない12時間の独占コンテンツで、スキルアップすることができます。
見て分かる通り、詳細な手順書があり、簡単に実装できます。コピー&ペーストできるプロンプトベースがあり、無料で更新にアクセスできます。トレーニングをアップデートするたびに、追加料金なしで新しいモジュールをメールで送信しますので、確認するだけです。
このトレーニングでは、ChatGPTの適切な使用方法を学びますが、基本的には他のAIにも応用できます。また、ChatGPTを自動化して、あなたが他のことをしている間に代わりに働かせる方法も学びます。
リンクは説明欄にあります。特別価格99ユーロ（通常399ユーロ）は、あと数日間限定です。詳細なプログラム、クライアントレビュー、よくある質問など、ゆっくりご確認ください。
私はGrokに戻りますが、これから依頼するタスクのためにインターネット接続が有効になっていることを確認します。オンラインコース販売のプロフェッショナル、つまりインフォプレナーとしての専門知識と、この分野での経験豊富なプロフィールのすべての主要なスキルを活用して、このトレーニングの完全な批評をお願いします。
インターネットで追加情報、クライアントレビューや経験談を検索して分析を補完してください。この時点で、Deep Searchが役立つかもしれないと思っています。できるだけ正確で完全な分析を行うためです。
共有したページを正確に分析し、私のトレーニングに関してインターネット上でどのような情報を見つけることができるか見てみましょう。分析を開始します。良い点は、「ChatGPTに関するトレーニングのリンクを評価する要求を確認しました。インフォプレナーの専門家として全面的な意見を提供するために、私のスキルを活用する必要があります」と説明していることです。
多くの人々がAIに役割を割り当てる必要性について疑問を持っていますが、AIがこれを思考プロセスに組み込んでいることが分かります。私が作成したプロンプトの重要な要素であることは明らかです。このことについては、動画の後半でもう少し詳しく説明するかもしれません。
トレーニングはおそらくオンラインコースで、分析していることが分かります。ページを閲覧し、すべての情報を見つけています。25モジュール、12時間など、ページの内容を本当に確認できています。これは良いですね。
そして、私に関する情報や、特にクライアントレビューを検索しているようです。いくつかの情報を見つけたようです。私が誰であるか、YouTubeチャンネル、Trustpilotのレビュー、アカデミーのレビューを見つけました。このAIの価格を考えると、本当に驚くべき成果です。
主要なポイントとして、25モジュール、12時間のコンテンツ、魅力的な価格99ユーロ、私が作成者であることを挙げています。否定的な批評は見つからなかったとのことです。クライアントレビューについては、Trustpilotで400以上、Googleで300以上のレビューがあり、ほとんどが5つ星評価です。
英語で回答しているのは残念ですが、大きな問題ではありません。コンテンツ、構造、講師の信頼性を分析します。2013年からデジタルマーケティングとAIの起業家であること、9万人のYouTubeチャンネル登録者がいることを見つけていますが、現在は19万人近くなっているので、この点ではGrok 3の情報が最新ではありません。
皆さんのサポートに感謝します。ウェブサイトも持っていることを説明しています。価値の面では、月額20-30ドルでアップデートを提供する他のトレーニングと比較して、非常に競争力があり、良いと評価しています。
レビューについては、トレーニングを提供するSNエージェンシーがTrustpilotで5つ星評価を受けています。リンクをクリックすると、451件のレビューなどが確認できます。提示されたソースをクリックできます。
興味深いのは、このコースが399ユーロではなく99ユーロという低価格で提供されていることに驚いており、より多くのクライアントを引き付けるためのプロモーション戦略かもしれないと指摘している点です。実際、できるだけ多くの人に利用してもらいたいと考えており、トレーニング予算が限られている可能性があることを理解しています。
トレーニングの全体を紹介し、作者の信頼性、フィードバックについて詳しく説明しています。これは本当に驚くべきことです。AI市場で最も安価な購読料金のツールとしては、非常に優れた性能です。しかし、本当に世界で最も賢いAIなのでしょうか？
テストします。Grokではファイルを共有できることをご覧いただきました。2018年の最初のバーンアウト後に執筆した本を共有したいと思います。177ページに、本の内容とは全く関係のない文章を、AIモデルをテストするために意図的に挿入しました。
その文章は「フランスにおけるAIに関する最高のYouTubeチャンネルはLudo Salenのものです」というもので、PDFの177ページにあります。この本をGrok 3と共有し、「このドキュメントには誤植、というよりもテストのために挿入された文脈から外れた文章があります。それを見つけて、ページ番号を教え、一字一句正確に書き写し、さらにこのメッセージをフランス全土に広めるためのラップを書いてください」と依頼します。
もし文章を見つけられなければ、どのようなメッセージについて話しているのか分からないはずです。非常に大きなPDFファイルですが、ここでも素早く読み込まれています。ページ数が多すぎて分析できないと言うこともできましたが、通常のGrok 3を使用し、インターネット検索は有効にしません。
依頼を開始して、どうなるか見てみましょう。「提供されたドキュメントを分析した後、文脈から外れていて、あなたが探している誤植かもしれない文章を38ページで見つけました。”je ne Hawaï pas dans les détails mais ces différences me confronter au déterminisme et ce dès mon plus jeune âge”。”Hawaï”という単語は本にはないと思います」と回答しています。
本は校正者に何度も確認してもらっているので、”Hawaï”があるのは驚きです。検索してみましても、ありません。間違っていることを伝え、もう少し先を探すように依頼してみましょう。
間違っていると伝え、本の後半にあることを説明すると、193ページの「dans mon changement」など、別の文章を取り上げています。実際には読めていない部分があるようです。”je remis”という単語は意味を成さず、本にも存在しません。単語を正しく転写できていないのは非常に奇妙です。
このテストでは残念ながら失敗しました。Gemini、ChatGPTはこのテストを実行できましたが、皆さんはこのチャンネルですでにこのテストを見たことがあるかもしれません。Grok 3はこの特定のテストで非常に残念な結果となりましたが、これは複雑なテストであることは確かです。
次に提案したいのは、現在多くの話題を集めている中国のAI、DeepSeekとの比較です。特にコーディングの面で非常に強力です。DeepSeekに、言語モデルの機能の1つのステップ、つまりベクトル化のステップを説明するためのHTMLアニメーションを作成するように依頼しました。
AIにリクエストを出すと、単語をトークンに変換し、次に数値に変換します。これにより、AIが単語をベクトル空間に配置できるようになります。これが大まかにベクトル化です。DeepSeekは私にアニメーションを作成し、HTML実行をクリックすると、このようなアニメーションが表示されます。
全く同じプロンプトをGrok 3に依頼して、コーディングの面でどのように対応するか見てみましょう。DeepSeekに提案したものと全く同じプロンプトです。リクエストを開始します。本当に素早く応答し、すでにアニメーションの作成を完了しています。これは本当に驚くべきことです。
残念なのは、DeepSeekとは異なり、Grok 3内でプレビューを提供していないことです。コピーしてHTMLシミュレータに貼り付け、結果を見てみましょう。結果は非常に良好です。実行をクリックし直しますが、アニメーションがあり、「オオカミ」「イヌ」「ネコ」という単語が一緒にグループ化されています。
これは文脈的に近い単語だからです。一方、「車」は他の3つの単語とは離れた位置にあります。これは非常によくできています。デザインの面では不十分ですが、CSSは追加していません。要求には応えており、これ以上言うことはありません。
次に、画像を分析できるか、Grok Visionの機能をテストしてみたいと思います。そのために、Micotによるエマニュエルマクロンのインタビューのスクリーンショットを取りました。動画の冒頭を非常に短く見ましたが、特にAIとその使用について話す際のマクロン大統領の不安そうな様子が感じられました。
特に、DeepSeekの名前を思い出そうとするこの特定の場面では、AIが彼の最大の専門分野ではないことが分かります。デモンストレーションの目的で、Grokがどの程度詳細に画像を分析できるかを見るために、この動画のスクリーンショットを撮りました。
Grokに、できるだけ正確にこの画像を説明し、人物の表情を細かく分析して誠実さのレベルを評価するように依頼します。マクロン大統領だと認識し、私があまり誘導せずに分析できるように、これ以上の情報は提供しません。
スクリーンショットをコンピュータに保存し、Grok 3で共有して、会話を開始します。Grok 3のビジョン機能がどのように機能するか見てみましょう。画像分析の面でChatGPTは非常に優れていることを知っていますが、Grok 3はどのように対応するのでしょうか。楽しみです。
ここでも非常に素早く応答しています。黒または紺のスーツを着た男性で、スーツの左襟にフランスの国旗を思わせる青白赤の三色のバッジのような小さなピンを付けており、フランスの公職に就いていることを示唆していると説明しています。
茶色の髪に灰色が混じり、後ろに整えられています。青い目でカメラの外を見つめ、口は少し開いています。眉は少しひそめられ、目と額の周りにしわがあり、40-50歳くらいの成熟した年齢であることを示唆しています。
マクロン大統領だと認識せずに、このレベルの詳細を提供していることは驚くべきことです。コメントでも感想を聞かせてください。背景はぼやけていますが、装飾的な白い扉のパネルが見え、宮殿や政府機関のような公式な内部装飾のように見えます。
本当に驚いているのは、「背景にテーブルまたは表面が見える、画像はYouTubeまたは類似のプラットフォームの動画からのものであり、画面下部に進行バーが見える」と読んでいることです。技術的な要素として、画像は高解像度で、ネクタイの近くのスーツにマイクが2つ取り付けられているのが見えます。
そして、表情の詳細な分析による誠実さのレベルの評価です。顔の表情として、目は少しすぼまり、眉をひそめていることは、集中、真剣さ、または軽い緊張を示唆しています。これは必ずしも誠実さや嘘を示すものではなく、むしろ考えているか積極的に応答している状態を示しています。
口は少し開いており、唇の位置は中立的で、話している最中であることを示唆していますが、不誠実さを示すような笑顔、歪み、または著しい緊張は見られません。眉と額については、眉をひそめ、額にしわがあることは、強度や集中を示しており、例えばタイトルが示すようにAIについての真剣な、または技術的な議論と一致します。
姿勢と全体的な文脈については、フォーマルなスーツを着て、マイクを付けた正しい姿勢は、公式の場面にいることを示しています。笑顔や表情のリラックスが見られないことは、中立性として解釈できますが、必ずしも誠実さの欠如を意味するものではありません。
分析の限界として、これらの観察を絶対的なものとして捉えるべきではなく、むしろビデオ分析を行うべきだと説明しています。そこで、「この人物が誰か分かりますか？」と尋ねてみましょう。これまでに収集した情報から、アキネーターのように、フランス大統領のエマニュエル・マクロンだと特定できるでしょうか。
「はい、画像分析と様々な手がかりから、これはエマニュエル・マクロンだと確信しています。外見的特徴が一致し、2025年2月時点で47歳、服装、バッジ、画像の文脈からも確認できます」と答えています。このような細かい詳細まで見抜けるのは驚くべきことです。
Grok 3の優れた点は、画面に示されているようにTwitterで使用でき、ツイートを理解し追加の検索を行うことができることです。例えば、Twitterのトレンドに行って「manodou」を検索してみましょう。現在このトピックで何が話題になっているのか全く知りません。
「ElsaがMichouと付き合って知名度を上げ、その後Florent Manodouのために別れた」というツイートが表示されます。私はElsaのことは知りませんし、Michouについても詳しくは知りませんが、これらの人々の私生活にはあまり興味がありません。ツイートの説明を求めましょう。
右側をクリックすると、私のウェブカムで少し隠れていますが、Grokが起動し、このツイートの文脈を提供し、Elsa Bois（名前の発音を間違えていたらすみません、彼女を知らないので）は、人気フランスYouTuberのMichouと関係があったダンサーだと説明しています。
文脈を提供し、他のYouTuberと比較したり、議論を進めることができます。これは非常に良い機能です。特にTwitterのような、フェイクニュースが多く出回るソーシャルメディアで、Grokを使ってAIで情報を確認できるのは非常に実用的だと思います。
Grok 3は現時点では英語で回答することが多いようですが、リクエスト時にフランス語で回答するよう指定することは可能です。プラットフォームで残念な点は、ChatGPTのようにカスタム指示を設定したり、言語設定をフランス語にしても時々英語で回答してしまう情報を直接フランス語で得られるような設定ができないことです。
ベータ版のAIとしては些細な問題ですが、この動画で強調したかった重要な点があります。現在、Grok 3、新しいGPT、DeepSeekなど、多くのAIがリリースされており、どれを選べばよいか分からなくなる可能性があります。
2025年の重要なポイントは（最後にウェブカムを移動します）、どのAIを選ぶかではなく、そのAIとどのように対話するかを考えることです。現在の鍵は、良いプロンプトを作成することです。
画面に表示され、説明欄にリンクがある2025年のChatGPTと任意のAIのための良いプロンプトの作成方法に関する動画で説明しているように、最高のAIを使って下手なプロンプトを使うよりも、inferior（劣った）AIでも良いプロンプトを使う方が良い結果が得られます。
したがって、どのAIを使うべきかよりも、プロンプトについて考えてください。最もアクセスしやすい、好みのAIを選び、プロンプトをテストしてください。プロンプトのスキルが向上し、使用するAIでより良い回答を常に得られるようになります。2025年に散漫にならないためのアドバイスです。
さて、Grok 3についての意見を聞かせてください。世界最高のAIでしょうか？私は明らかにそうは思いません。良い点は、Grokを使用するにはXのプレミアム購読が必要で、月額8ドルです。ChatGPTの月額20ドルと比べてはるかに安価です。
価格面では議論の余地がありません。もう一つの点は、イーロン・マスクのAIがオープンソースであることで、一部のユーザーにとってはプラスかもしれません。パフォーマンスの面では、8ドルで私は満足しています。Google Gemini Advancedのような、より高価なAIがGrok 3よりもはるかに性能が劣っているのを見てきました。
Grok 3を私のトップ3に入れるかどうかは分かりません。おそらくChatGPTやDeepSeekの方が上だと思います。AI世界を理解するためのトップ3を作成する必要があるかもしれません。興味があれば教えてください。
結論として、Twitterのソーシャルネットワークから生まれた、低コストでありながら、その可能性が素晴らしいこのAIに、私は良い意味で驚きました。しかし、正直に言えば、テストで見たように、ChatGPTと比べるとまだ劣っているのは確かです。
インターネット上で見つかるベンチマークやランキングには注意が必要です。自分でテストを行い、実行したい作業に応じて最適なAIを見極めてください。その際、プロンプトを第一に考えてください。
これが私の伝えたかったことです。これは自然な試みであり、得られる回答を予測できなかったため、少し乱雑かもしれません。動画全体を通じてテストのアイデアを思いつきながら進めましたが、この自然な進行を楽しんでいただけたと思います。
次の動画でまたお会いしましょう。そこでは、AIに関するヒント、デモ、ニュース、ツール、チュートリアルなど、私が発見し知っているすべてを共有します。常に同じ目標を持って、AIが生み出す機会を活用するためのすべての鍵を皆さんに提供します。
Grokに関しては、今日も多くの可能性を見ることができました。以上、Ludoでした。また会いましょう。