速報: OpenAI O3 Mini を5分で！

2,377 文字

OpenAI O3 Mini が登場しました。これから、私がこのモデルについて知っている全てのことを、今から数分間にわたってお伝えします。これは、O シリーズのファミリーに属するモデルで、思考モデル o1 mini が既に存在している中で、O3 Mini はその後継機として、速さを保ちながらも思考能力を発揮するモデルとされています。

OpenAI がO3 Miniで行った興味深い点は、一つのモデルだけをリリースするのではなく、O3 Mini を3種類のフレーバーで提供していることです。それは、O3 Mini Low、O3 Mini Medium、そして O3 Mini High です。基本的には、速度と正確さのトレードオフ、また費用対効果を考慮してモデルを運用するという考えに基づいています。実際、彼らはこのモデルを「費用対効果の高い推論」と呼んでおり、このモデルは高速でありながらコストも抑えられるため、プラスユーザーやプロユーザーでなくても、無料ユーザーにも提供できるのです。

さらに、O3 Mini は、開発者にとって重要な機能が備わった初の推論モデルです。具体的には、関数呼び出し、構造化出力、そして開発者向けメッセージが利用可能となっています。これらは o1 mini には存在しなかった機能です。つまり、o1 mini と異なり、O3 Mini にはこれらの機能がすべて搭載されているため、開発者は関数呼び出しを活用して製品開発が可能となります。また、これにより、近い将来、さまざまなエージェントにこのモデルが組み込まれる可能性も高まります。

開発者は、推論の労力を低、中、高のいずれかに選択することができます。つまり、思考にかける時間が長ければ推論の精度は高まり、逆に短ければ精度は低くなるということです。この柔軟性により、O3 Mini は、複雑な問題などの難問に対して、より深く考えることが可能となります。ただし、現時点ではこのモデルはビジョン機能には対応していませんが、将来的にはその機能が追加される可能性があります。

現在、このモデルは ChatGPT 上で、無料ユーザー、プラスユーザー、そしてプロユーザーのすべてに提供される予定であり、API経由でも利用可能となります。ベンチマークテストにおいて、O3 Mini は間違いなく o1 mini よりも優れており、実際、O3 Mini High は o1 mini よりも高性能であるとされています。これは、推論モデルにおいて、より長い思考時間がモデルの精度向上につながるという研究界隈での考え方を裏付ける結果でもあります。

また、重要な点として、今回のモデルは完全に新規というわけではなく、2024年12月に行われた「12 Days of OpenAI」でプレビューが公開されたモデルの正式版であるということが挙げられます。今回、正式にプレビュー段階からリリースされたことで、他のベンチマークにおいても、明らかに性能が向上していることが確認されています。

私が特に注目しているのは、このモデルがベンチマークだけでなく、人間による評価においてどのような結果を示すかという点です。例えば、科学、工学、数学に関連するステム系の問題においては、O3 Mini は o1 mini よりもはるかに好まれていることが確認されています。また、ユーザーに時間制限がある場合でも、たとえば、o1 mini が50％の確率で選ばれていたのに対し、このモデルはそれ以上に圧倒的な支持を得ています。理想的には、OpenAI は o1 mini を O3 Mini に置き換える方針であることが分かります。というのも、このモデルは全体的に優れたパフォーマンスを示しているからです。

レイテンシについても、o1 mini の Medium モデルと比べ、O3 Mini の Medium および Low フレーバーははるかに高速で動作し、O3 Mini High はやや遅くなるという違いがあります。私としては、O3 Mini Medium が最もバランスの良いモデルであり、o1 mini よりも高速かつ性能が向上していると感じています。また、開発者向けに3種類のフレーバーが提供されることで、例えば、顧客向けに「推論タスクには高速が必要か、そこそこ速いもので十分か、あるいは非常に高速なものが必要か」を選択して、異なる価格設定を提示することが可能となるため、多くの開発者製品においてこの柔軟性が活かされることでしょう。OpenAI がこのモデルを提供する方法は、多くのユーザーにとって非常に有益であるといえます。

簡単なデモとして、ChatGPT にアクセスしてこのモデルを試すことができます。たとえば、「スタートアップへの新たな投資先を見つける最適な方法は何か」という検索を行うと、モデルが推論を開始し、その過程が表示されます。表示される推論過程は、厳密な chain of thought（思考の連鎖）ではなく、あくまで要約された形となり、最終的な出力のみが示される仕様です。

また、例えば「サリーには3人の兄弟がいて、全員に1人の姉妹がいる。ところで、サリーの姉妹は何人いるか？」という問題に対しても、モデルは推論を行い、答えを返してくれます。非常に注目すべき点は、このモデルの処理速度が極めて速いことであり、これについては詳細なテスト結果をまとめた別の動画で紹介する予定です。

現状、O3 Mini は開発者、プロユーザー、プラスユーザー、そして無料ユーザーの皆さんに向けて、数時間以内に利用可能となる予定です。

ご視聴いただき、ありがとうございました。次の動画でお会いしましょう。ハッピー・プロンプティング