
3,853 文字

xAIが最新モデルのGROK 3を公開しました。マスクとxAIのエンジニア3名によると、GROK 3はGROK 2と比べて桁違いに優れており、これは約10倍の性能向上を意味します。xAIによれば、テネシー州メンフィスにある巨大データセンターで、約20万基のGPUを使用してトレーニングを行ったとのことです。GPUが整然と並ぶ巨大な施設で、24時間365日データを処理し続けています。一部では、このスーパーコンピューターを「コロッサス」と呼んでおり、マスクはこれがGROK 3の巨大な可能性を支えていると主張しています。
GROK 3は、OpenAIのGPT 4o、GoogleのGemini、DeepSeekのモデルといった大手と比べてどうなのでしょうか。xAIの社内ベンチマークによると、GROK 3は数学、科学、コーディング、問題解決などの分野でこれらの競合を上回っています。具体的には、数学コンペのベンチマークであるAIMや、物理学、生物学、化学のPh.D.レベルの問題を扱うGP QAでの結果を挙げています。AIの性能に詳しい方々向けに補足すると、GROK 3ファミリーの小規模バージョンでさえ、異なるAIモデルを対戦させ、実際の人間の投票で優劣を決めるオンライン環境であるChatbot Arenaで好成績を収めているとxAIは主張しています。
GROK 3の興味深い点は、単一のモデルではなく、ファミリー全体を指すという点です。GROK 3 Reasoning、GROK 3 Mini Reasoning、標準のGROK 3、そしてミニバージョンがあります。Reasoningモデルは、より複雑な思考プロセス、つまりAIが回答を提供する前に思考プロセスを説明したり、内部的に構造化したりすることを可能にする思考連鎖プロンプティング用に設計されています。
ただし、xAIによると、他の開発者が確立されたモデルから知識を抽出する手法である蒸留を防ぐため、GROKの推論の一部は隠されているとのことです。そのため、GROKの思考連鎖を詳しく調べたい場合は、難しいかもしれません。
さて、GROK 3は実際にどのように使えるのでしょうか。ソーシャルメディアプラットフォームのXに統合されており、専用ウェブサイトのgro.comとiOSアプリからも利用可能です。XのPremium Plus会員であれば、すぐにGROK 3にアクセスできます。また、GROKモバイルアプリとgro.comサイトの両方で、新しい「Super GROK」というプランも提供されています。噂では、Super GROKは月額30ドルまたは年額300ドルほどになるとのことですが、これらの価格はまだ正式には確認されていません。
利用を開始すると、多くの新機能が利用可能です。例えば、「Deep Search」と呼ばれる機能があり、これはGROKの高度な研究ツールで、インターネットやX上のデータをスキャンして詳細なサマリーを提供します。必要に応じて、特定のソースやウェブサイトに検索を絞り込むこともできます。
もう一つの優れた機能は「Big Brain」モードで、これはGROK 3により多くの思考時間を与えることで、より包括的な回答を得られるようにするものです。これは特に、複雑な科学やコーディングの質問に取り組む際に役立ちます。
さらに、マスクによれば、おそらく1週間以内に音声モードが導入される予定です。これにより、ChatGPTやGoogleのシステムのように、音声コマンドでGROK 3と対話し、合成音声で応答を得ることが可能になります。
デモでは、「やあGROK、聞こえる?」「こんにちは、ついにお会いできて嬉しいです。お互いについてもっと知り、チャットできるのを楽しみにしています。また話しましょう」といったやり取りが行われました。
xAIチームのデモでは、マスクのもう一つの大きな事業であるSpaceXに関連して、地球から火星への仮想的な宇宙ミッションをGROK 3が計画したり、テトリスとBeedを組み合わせたようなゲームをコーディングしたりする様子が紹介されました。ゲーム開発、コーディング、あるいはミニアプリ全体を生成できるAIで遊ぶことに興味がある方にとって、GROK 3は楽しい選択肢となるでしょう。
別のデモでは、リアルタイムでの高度な数学・科学問題の解決を行い、また一部の映像では、画像生成や画像に関する質問への対応も可能で、GPT-4やGoogle Geminiと同様のマルチモーダル機能を備えていることが示されました。
当然ながら、これらの新機能により、xAIはOpenAIとの直接的な競争をさらに強めています。最近の騒動を思い出してみましょう。マスクはOpenAIを相手に2件の訴訟を起こし、創業理念から逸脱したと非難し、さらには非営利部門を974億ドルで買収することを提案しましたが、サム・アルトマンはこれを明確に拒否しました。
そこには確かに緊張関係があり、さらに両社は巨額の資金調達を行っています。業界の噂では、マスクはxAIのために100億ドルを求めており、これにより同社の評価額は約750億ドルに上昇する見込みです。一方、OpenAIは最大40億ドルを調達する可能性があり、評価額は3,000億ドルに達する可能性があります。
しかし、xAIが競争しているのはOpenAIだけではありません。Geminiを持つGoogleや、最近R1モデルをオープンソース化した中国のAI大手DeepSeekにも目を向けています。R1のオープンソース化はAI開発競争における大きな一歩です。なぜなら、高度なモデルをオープンソース化することで、新規参入者がより容易に参入できるようになるからです。
一方、イーロン・マスクは、GROK 3が成熟し安定するまでGROK 2をオープンソース化しないと述べており、これには数ヶ月かかると考えています。これは、新バージョンが確立された後に古いバージョンを公開するというxAIのアプローチと一致しているかもしれません。
これら全てが良いことのように聞こえるかもしれませんが、これほど大規模なAIモデルの構築には多大なコストがかかります。メンフィスの巨大なGPUデータセンターに加えて、xAIはDellテクノロジーズと50億ドル以上のAI最適化サーバーの契約を締結する最終段階にあるとされています。
一方で、SoftBank、Oracle、アブダビのMGXやOpenAIなどの企業が、米国でより多くのAIデータセンターを建設するために、約1,000億ドル、潜在的には最大5,000億ドルを集めようとする広範な動きもあります。これは、より大規模で高速なコンピューティングインフラに数十億ドルを投じる企業들によるAI開発競争と言えるでしょう。
GROK 3の興味深い点の一つは、その大胆なアプローチです。マスクが最初にGROKファミリーを発表した際、他のAIが慎重さや内容規制のために避けるトピックにも踏み込める、フィルターのかかっていないAIになると約束しました。しかし、しばらくするとテスターたちは、GROKとGROK 2が依然として特定の政治的あるいは論争的な質問を拒否することに気付きました。
マスクによれば、これはトレーニングに使用したデータセット、つまり独自のバイアスを持つウェブコンテンツの影響であり、xAIはモデルをできる限り政治的に中立にしようと努めているとのことです。GROK 3でこれが実際に達成されているかどうかは、まだ未知数です。人々は確実にテストを行い、左派か右派に偏っているのか、あるいは本当に中立なのかを確認するでしょう。
Androidユーザーの方々は、専用のGROKアプリが現時点でiOSのみの提供であることに少し落胆するかもしれません。ただし、AndroidでもメインのXアプリ内でGROKを使用することは可能です。単独のAndroid版GROKアプリの提供時期については公式な発表はまだありませんが、おそらくAndroidユーザーを長く待たせることはないでしょう。
彼らは更新が毎日行われており、改善が継続的に進められていることを繰り返し強調しています。実際、マスクは、更新されたデータを与えたりパラメータを調整したりすると、これらの大規模言語モデルがいかに素早く適応できるかを考えると驚くべきことですが、24時間以内にGROKのパフォーマンスに変化が見られる可能性があると述べています。
また、ビジネスアプリケーションが重要な要素であることも忘れてはいけません。マスクによれば、数週間以内にxAIのエンタープライズAPIを通じてGROK 3が利用可能になるとのことです。これにより、大企業は自社のプラットフォームにGROKの機能を直接統合することができます。
金融、コーディング、あるいは研究が重要な分野で働いている方々にとって、これはゲームチェンジャーとなる可能性があります。想定される使用例には、コード生成、デバッグ、不正検出、高度なデータ分析、さらには適切な規制手順を踏めば医療診断なども含まれます。
以上、楽しんでいただけた方は、ぜひいいね、チャンネル登録、通知ベルの設定をお願いします。次回の配信もお見逃しなく。ご視聴ありがとうございました。また次回お会いしましょう。
コメント