これがo3だ: ChatGPTのスーパーAI (OpenAIが勝利)

5,480 文字

Voici o3 : la super IA de ChatGPT (OpenAI a gagné)

OpenAI vient d'annoncer la sortie de ses nouvelles IA o3 et o3-mini qui surpassent toutes les intelligences artificielle...

夢ではありません。画面上部でOpenAIが、o1の後にo2ではなく、新しい人工知能を発表しました。ChatGPTは少なくともマーケティングとコミュニケーションの観点からは論理的ではありませんが、この新しい人工知能はo3と呼ばれ、o3 miniもあることがわかります。
この新しいAIについて、OpenAIが公開した数値や性能を見ると、人類全体を合わせた知能を超える超人工知能、いわゆるAGIに近づいていることがわかります。2、3のことをテストできますが、この新しい人工知能について全て知りたいでしょうか？それでは非常に手短にご紹介しましょう。
この動画を録画している時点でほんの数分前に、AI企業の12日間の発表の締めくくりとなる特別なキーノートで発表されました。このツイートにあるように、OpenAIはo3をリリースし、数値を超えたということです。o2と呼ばれる可能性もありましたが、o3と呼ばれることになりました。おそらくOpenAIの年末の小さなジョークだったのでしょう。
このキーノートでは、12月初めにリリースされたモデルo1と比較したo3の性能を示すベンチマークなど、いくつかのことが発表されました。ソフトウェア開発能力やコーディング能力において、チェスのようにEloレーティングという原理があり、開発者はEloレーティングを持つことができます。画面でご覧の通り、o3は2727のEloレーティングを持ち、o1は1891です。チェスと同じように比例するなら、2つのモデルの差は歴然としています。
このビデオの興味深い部分は、Sam Altmanがo3モデルを担当するエンジニアに、コーディングの観点から彼のEloレーティングを尋ねた時、彼は2500だと説明し、o3人工知能よりも低いEloレーティングだったことです。私はそれを面白いと思いました。
その後、他のベンチマークが発表されました。数学、物理学、科学に関するものでした。このような種類の人工知能モデルは、特定のエリート層、少なくとも特定の層をターゲットにしているような印象を受けます。AIの進化に伴い、一般大衆は取り残され、OpenAIから無視されることになるのでしょうか。これについては動画の最後で話し合い、コメントで皆さんの意見を聞かせていただければと思います。
その後、非常に興味深いことがありました。ある人が招かれてスピーチを行い、いくつかの事を実演しました。この人はArc AGIという団体の代表で、ウェブサイトのリンクは説明欄に載せておきます。Arc AGIの目的は、人工知能の性能を測定し、人間の思考をシミュレートする能力を最終的に測定することです。できるだけ分かりやすく説明しようと思います。
つまり具体的には何を意味するのでしょうか。人工知能の人間レベルの知能を0から100%で測定し、100%に近づくほどAGIに近づくということです。このOpenAIのプレゼンテーション動画で示されているように、計算能力が低い場合でも人間レベルの知能の75.7%に達し、o3モデルに最大の計算能力を投入すると87.5%に達します。
つまり、ざっくり言えばAGIの87.5%に達したということです。画面で見られるように、以前のOpenAIの人工知能o1モデルと比較すると、o3は3倍の性能があります。これが名前の理由かもしれません。
Arc AGIの定義についても説明しておきました。これは人工知能の抽象的で一般的な推論能力をテストするために設計されたベンチマークです。先ほど説明しようとしたように、人間の創造性と論理性を評価するようなものです。人工知能が人間の脳のように自ら考えることができるようにすることが目的です。
つまり、事前に訓練を受けていない問題を解決できるレベルの性能に達することです。言い換えれば、人工知能が主導権を握るということです。これが重要な理由は、人工知能がどれだけ人間のように考えることができるかを測定するからです。
0から100%のスケールがあり、o3モデルは87.5%に達しています。数ヶ月後、もしくは最大でも数年後には100%の壁を超え、人工知能が私たちよりも知的になる可能性が高いでしょう。
o3 AIとo3 miniの新しいAIの発売日についても触れましょう。o3 miniはo3人工知能のミニバージョンで、このOpenAIのキーノートでも発表されました。ここでベンチマークを見てみると – ウェブカメラを動かしますが – 先ほど見た競技コード、つまりAIのEloレベルを見ると、o3は2727という驚くべき数字に達していましたが、o3 miniは計算能力に応じて、最小で1697、最大で2073に達し、これは現在の1891のo1モデルを上回ります。
つまり、o3 miniは12月初めにリリースされた現在のo1よりも優れているということです。その後、このOpenAIのキーノートで唯一のデモンストレーションが行われ、私も興味深いテストを準備しました。
基本的に、OpenAIのエンジニアが要求したのは、人工知能が自身の性能レベルを測定できるPythonスクリプトを書くことでした。このプロンプトの詳細には深入りしませんが、基本的にo3 miniを使用してコードを取得し、私も同じことをo1 Proで行いました。
o3 miniで得られたコードはここにあります。タブを行き来していたため、コードのほぼ全体を回収することができました。私が行ったのは、彼のChatGPTにあったものと、その後VSスタジオ（開発コンソール）にコピー＆ペーストしたもののスクリーンショットを撮ることでした。
そして、ChatGPT o1 Proに、自身が生成したコードと比較するよう依頼しました。ここで見られるように、1秒で一貫性のある効率的なコードを生成しました。少なくとも、人工知能にそれを検証するよう依頼しました。
o1 Proで生成されたコードを取り、スクリーンショットを回収し、o1 Proに2つのコードを分析して、どちらが優れているか判断するよう依頼しました。最初は少し驚きました。両方のコードの機能は同じだと説明されたからです。これは驚くべきことではなく、むしろ論理的です。
しかし、コードに点数をつけた時に驚きました。コピー＆ペーストしたコードには85/100点を与え、スクリーンショットから得られたコードには70%しか与えませんでした。分析を読んでみると、スクリーンショットにはコードの一部が欠けていることが分かりました。
そこで、欠けている部分を無視し、それが完璧に書かれていたと仮定した場合、どちらのコードが優れているか尋ねました。大まかに言えば、コードは本質的に同じで、主にOpenAI APIの性能に依存すると述べています。
最後に点数をつけ、o1 Proで生成されたコードが85/100点なら、o3モデルはおよそ90/100点になると説明しました。つまり、ここでテストされたo3 miniはo1よりも優れていますが、どの程度優れているのか、特に私たちの日常的なタスクにおいて、大多数のユーザーにとって実際に認識できる違いがあるのかは確実ではありません。コメントで皆さんの意見を聞かせてください。
動画の最後で、o3とo3 miniモデルの発売日について触れ始め、セキュリティを強調しました。これは驚きではありませんでした。o3は非常に高度なセキュリティテストの後にのみリリースされるという情報が既に噂されていました。
今日のキーノートでOpenAIが明らかにしたのは、ユーザーの要求に適切に応答する人工知能の能力を測定する新しい方法を開発したということです。これは論理的ですが、要求が安全か、有効か、拒否すべきか処理すべきかを判断することも含まれています。
これが、市場の主要な人工知能を比較した、目の前にある複雑なグラフを生み出しています。ここで注目すべきは、特にGemini 1.5 FlashとPro1.5のモデルが、ユーザーの要求に応答する能力において92-94%と非常に優れているということです。グラフを見ると、ターコイズ色で示されているGPT-4oよりもはるかに優れているように見えます。
OpenAIがこのように事態を提示しているのは良いことですが、Googleはセキュリティや機密性などの理由で処理すべきではない要求を判断することに本当に苦労しています。これは偶然ではありません。おそらくGoogleの画像生成AI、動画生成AI、さらにはテキスト生成AIにおいて、本当にボーダーライン、あるいは完全に容認できない、政治的に不適切な問題があったことを耳にしたことがあるでしょう。
この分野では多くの失態があり、それがグラフに反映されています。ここで分かるのは、o3登場前のo1とo1プレビューが、セキュリティと性能の観点から最高のAIモデルだということです。
OpenAI、特にSam Altmanが述べたことについて、画面に表示されているグラフの説明があります。必要であれば一時停止して見ることができますが、既に要約をお伝えしました。
先ほど説明したように、Sam Altmanは、o3とo3 miniモデルはテストとセキュリティフェーズが完了するまでリリースされないと明確に述べました。彼らによると、o3 miniは1月末にリリースされる予定です。
その後、Sam Altmanは、o3モデルについては数日から数週間後、おそらく2月中旬になると付け加えました。これは、o3モデルをテストする人々にも依存すると説明しました。人工知能とAIセキュリティの専門家がo3のセキュリティレベルを測定できるよう、募集を行っています。
つまり、テストに参加する人数にもある程度依存し、より多くの人が参加すればテストは早く完了します。したがって、o3 miniは1月末、o3は2月中旬になる見込みです。もちろん、これらについてはチャンネルで取り上げていきます。
これが驚きではないと言った理由は、ソーシャルメディアやYouTubeでほとんど注目されなかったSam Altmanのインタビューがあるからです。ここに1800回視聴された動画があり、これはSam Altmanのインタビューです。
私はChatGPTでGPTsを使用し、チャンネルで既に紹介した画面右上に表示される動画（説明欄にリンクがあります）でお見せしたCanva機能を使用して要約を作成しました。
このインタビューで彼は、o1モデルの革命、つまり人間の知能の働きをますますシミュレートしていく人工知能の考え方について振り返っています。すでにこのインタビューで数日前に、o2とo3モデルについて言及していました。結局o2モデルは見送られ、直接o3モデルに進むことになりました。
このインタビューで彼は、これらのo2、o3モデルは徹底的にテストし、特にセキュリティを段階的なアプローチで確認するまでリリースできないと明確に説明しています。これはOpenAIが設立以来繰り返していることで、機能を段階的に導入し、実際の状況での影響を確認しています。
だからこそ、おそらくまずo3 mini、次にo3が登場し、その後に私が考える2025年のトレンドとなる革命が続くでしょう。このトレンドはここにあります。それは自律エージェントの革命です。画面右上に表示される動画（説明欄にリンクがあります）でこの革命について触れています。
ChatGPTには自律エージェントの始まりとなる新機能があり、これは人類と同じくらい賢い87.5%のo3モデルの下で2025年に登場します。つまり、2025年には多くの職業を自動化できるようになるということです。
そのため、このインタビューでAIが仕事に与える影響についても話しています。これが、新しいo3とo3 mini人工知能について私が皆さんにお伝えできることです。コメントで皆さんの意見を聞かせてください。情報は数分前に公開されたばかりなので、説明が少し混乱していたかもしれません。できるだけ早く情報を消化し、年末年始の休みの前に皆さんにお伝えできるよう、できるだけ早く分かりやすく説明しようと努めました。年末年始の間にいくつかの動画を予定していますが、私自身は数日間休暇を取るつもりだったので、休暇に入る前に情報を扱いたかったのです。
2024年は本当に信じられないような年でした。チャンネルで80,000人以上の登録者を獲得し、150,000人の登録者を超え、間違いなければ1,000万回以上の視聴回数を達成しました。本当に素晴らしい年でした。多くのことを成し遂げ、途中でバーンアウトもありましたが、2024年よりもさらに良い2025年にするため、少しずつ立て直しています。
皆さんのサポートに感謝します。数日後に新しい予定された動画でお会いし、2025年からはチュートリアル、ヒント、デモ、ニュース、ツールなど、人工知能について発見できること、そして私が知っていることすべてをお届けします。来年も目標は変わりません。AIが生み出す機会を活用できるようにするために必要なすべての鍵を皆さんに提供することです。
年末年始をお楽しみください。ご自身とご家族を大切にしてください。来年もよろしくお願いします。
Ludoでした。さようなら。