ChatGPT o3-miniモデルがついにリリース… (完全レビュー)

6,707 文字

OpenAIが新しいo3シリーズをChatGPT向けにリリースしました。今日から利用可能な新しいモデルの実用テストを行っていきます。いくつかの更新内容を確認し、いくつかのプロンプトでテストを実施します。ところで、AIについて深く理解したい方や、このビデオの後もo3ミニシリーズやDeep Seekなどのツールについて議論を続けたい方は、説明欄やトップのピン留めコメントに記載している無料のAIコミュニティへの参加を強くお勧めします。
それでは、このOpenAI o3ミニモデルシリーズについて見ていきましょう。まずOpenAIは、o3ミニが推論シリーズの中で最新かつ最もコスト効率の高いモデルであり、今日からChatGPTとAPIの両方で利用可能だと述べています。科学、数学、コーディングなどの分野で強みを発揮し、o1ミニと比べてコストが低く、処理時間も短縮されています。
o3は、関数呼び出し、構造化された出力、開発者メッセージなど、開発者から強く要望されていた機能をサポートする初めての小規模推論モデルであり、開発者にとって直ちに本番環境で使用できる準備が整っています。これは大きな進歩です。
興味深いのは、開発者が低、中、高の3つの推論努力オプションから選択できることです。これにより、特定のユースケースに合わせて最適化が可能となり、複雑な課題に取り組む際には深く考え、レイテンシーが重要な場合には速度を優先することができます。
専門家によるテストでは、テスターの56%がo1ミニよりもo3ミニのレスポンスを好み、難しい実世界の質問における重大なエラーが39%減少したことが観察されました。
競技数学のベンチマークでの性能を見ると、o3ミニ高は87.3%のスコアを達成し、彼らの一般的な広範な推論モデルであるo1モデルの83.3%を上回っています。o3シリーズのミニモデルが、o1のメインシリーズを上回る性能を示しているのです。
PhD レベルの科学的質問では、o3ミニ高はo1やo1プレビューをわずかではありますが上回っています。これがミニモデルであることを忘れないでください。通常のo3はまだリリースされていません。
競技プログラミングにおいては、これらのo3モデルのほぼすべてがo1シリーズを上回るスコアを記録しています。ミニシリーズだけでなく、o3ミニ低は通常のo1モデルより劣りますが、o3ミニの中高モデルはいずれも、通常のo1モデルよりもコーディングベンチマークで良いスコアを記録しています。
ABテストでは、o3ミニはo1ミニと比較して24%速い応答時間を実現し、平均応答時間は10.16秒から7.7秒に短縮されました。ベンチマークでより高いスコアを記録しながら、24%速いレイテンシーを実現しているのは素晴らしいことです。つまり、より速くてより賢いということです。
OpenAIはo3ミニでコスト効率の高い知能の境界を押し広げており、Deep Seekの台頭とそのコスト効率を考えると、彼らは確かにこれを必要としています。このモデルは、GPT-4のローンチ以来、トップクラスの推論能力を維持しながら、トークンあたりの価格を95%削減するという実績を継続しています。
モデルセレクターには新しいオプションとしてo3ミニとo3ミニ高があります。o3ミニは高度な推論が速く、o3ミニ高はコーディングとロジックに優れています。両方ともウェブ検索が可能なことに注目してください。これはo1では不可能な機能です。また、o3ミニ高はベンチマークでより良いスコアを記録しています。ファイルの添付はまだできませんが、o3ミニ高と通常のo3ミニでウェブ検索とライブ検索ができるのは素晴らしいことです。
o3ミニに切り替えて、スクレイピングを試してみましょう。たとえば「n8nのドキュメントをスクレイプして、HTTPリクエストノードについて知っておくべきことを全て教えて」と指示してみます。n8nやその他のアプリケーションでエージェントを構築する場合、ドキュメントと高度な推論モデルを同時に利用できることは非常に有用です。アプリケーションの構築時に、それが何についてのものなのかをリアルタイムで検索できる能力を持つことができます。
ChatGPTインターフェース内で検索機能を持つ高度な推論モデルを利用できることは画期的です。通常、n8nで自動化を構築する際に質問がある場合は、ライブデータを持つPerplexityを使用していました。なぜならo1には検索機能がなかったからです。しかし今や、o3ミニで検索が可能になりました。
ドキュメントのスクレイピングを試して、特定のノードについての情報を取得してみましょう。送信してみると、少し考えて… かなり早かったですね。ここをクリックして、バックグラウンドで何が起こっているかリアルタイムで見ることができます。
現在、n8nのドキュメントに記載されているHTTPリクエストノードに関する包括的な要約を取得しています。この推論モデルがこのような問題解決にどれほど役立つか覚えておいてください。n8nのドキュメントについて、基本的にすべての情報を提供してくれています。
ライブウェブサイトのn8nドキュメントを高度な推論モデルと組み合わせられることは素晴らしいと思います。GPT-4oを使用する必要がなく、実際にはo1を一部の場合で上回るこれらのトップティアモデルを使用できます。なぜなら、プロンプト内でコンテキストが重要だからです。このように高いレベルで推論でき、インターネット上のどこからでもコンテキストを取得できるモデルを持つことは非常に重要です。
次に、コーディングとロジックに優れ、検索機能も備えたo3ミニ高モデルを使用してみましょう。私のOura Ringからアクティビティデータを引き出すn8nでの自動化を作成したいと思います。このリングは一日中私のアクティビティを追跡していますが、n8nに取り込んだときのデータは望む形式で構造化されていません。必要な形式でJSONとして構造化するコードを書いてもらい、この問題をどれくらいの時間で解決できるか見てみましょう。
このn8nというソフトウェアで、私のすべてのアクティビティを追跡できる自動化を構築しています。このアクティビティをすべてGoogleドライブのJSONファイルに保存し、後で図表化したいと考えています。現在、データはこのような形式で入ってきていますが、これをすべて抽出してJSONファイルに入れたいのです。ただし、特定の方法で構造化したいと考えています。現在は、データがあちこちに散らばっていて、1500行近くのJSONがあります。このデータをGoogleドライブとJSONファイルで持っている場合に何ができるのか、またこれを実現するためのコードを作成できるのかを見てみたいと思います。
このモデルの限界に挑戦してみましょう。現在GPT o3ミニ高を使用しており、大規模なプロンプトを入力して多くのアクションを完了するよう指示しました。実世界の自動化コーディング問題で、このモデルが私たちをどのように助けてくれるか見てみましょう。私はコーディングができませんが、検索機能を備えた大規模言語モデルを使用するのが大好きで、これがどのように役立つのかとても楽しみです。
私たちのためにコーディングができ、一貫して素早く正確な結果を提供できるものがあれば、特にローコード・ノーコードの人々にとって非常に強力なツールとなります。プログラマーの場合は、この時点では単に速度のためになるでしょう。適切な質問をし、正しいコンテキストを与えることができれば、明らかにより有用になります。
私のプロンプトを見てみましょう。「n8nで自動化を作成しており、Oura Ringのデータを変換しています。」と説明しています。Oura Ringは私の活動と睡眠を追跡するデバイスで、そのアクティビティを日次のJSONファイルに変換し、後でRAGシステムで照会できるようにしたいと述べています。
最終的には、すべてのアクティビティデータをRAGデータベースにアップロードする予定です。すでに睡眠データではそれを実行中で、特定の時間の心拍数や、昨夜の2:34の心拍数などについてチャットボットと会話できるようにしたいと考えています。また、これらの統計を図表化するために、GoogleドライブにJSONファイルも作成していると説明しています。
かなり多くのことがすでに進行中ですが、このモデルの推論能力を本当にテストするために、いくつかのことを依頼しています。まず、Oura Ring Cloudのドキュメントをレビューするよう指示しました。ウェブ検索が可能なことの素晴らしい点は、必要なコンテキストとしてある特定のドキュメントをレビューするよう指示できることです。そして、アクティビティデータがどのように構造化されているか、入ってくる各データが何を意味するのかを確認するためのリンクを提供しました。
ステップ2では、n8nのコードノードのドキュメントをレビューするよう指示し、そのリンクも提供しました。n8nという自動化ソフトウェアでは、異なるパーツを組み合わせることができ、ドキュメントではそれらのパーツがどのようにリンクするかが説明されています。このドキュメントをレビューするよう指示したのは、私の問題についてより多くのコンテキストを与えるだけでなく、問題解決に関する最新の情報も提供するからです。
ステップ3では、私のワークフローで現在取り込まれているデータの構造をレビューするよう指示しています。ステップ4では、アクティビティから作成できるフラットなJSONファイルの提案を求めています。METミニッツ（活動量を表す単位で、5分ごとにOura Ringが活動レベルを追跡します）でクールなグラフを作成できるようなものや、JSONファイルから後で洞察に富んだグラフを作成できるその他の提案を求めています。
最後のステップでは、setノードから完全な生のJSONデータをきれいに整理してキャプチャするために必要なコードを求めています。n8nでのノードのラベルについてのコンテキストも提供しています。このsetノードは基本的にデータを取り込んで名前を付けることができます。私の場合、すべてのOura Ringのアクティビティを取り込んで「Ouraデータ」とラベル付けし、コードノードでより使いやすい配列にしています。
使用しているノードの種類についてのコンテキストを提供し、各ボックスがノードと呼ばれることを説明しています。そして、データがコードノードにどのように入ってくるかを説明しました。右側に見えるように、このようなデータが出力されます。1,500行以上の長さがあります。
このデータをコードノードに取り込み、より構造化されたJSONデータに変換して、ダウンロードしてバイナリに変換できるようにしたいと考えています。この構造全体を提供しました。プロンプトは非常に長く、サイドバーのスクロールバーを見ればわかるように、大量のコンテキストと情報を提供しています。
最後に、これらすべてのステップを完了して私を助けるよう依頼しました。アップロードしたJSONには多くの小さな数字が含まれているだけですが、1,500行の生のJSONデータがあります。これがどのように機能するか見てみましょう。
送信して下に移動すると、推論プロセスが進行中です。ここをクリックすると、そのすべての思考プロセスを見ることができます。JSON構造を強化し、すでにコードを作成しています。これが何をできるのか非常に興味深いです。うまく機能することを願っています。コード以上に興味があるのは、このモデルがどのようなアイデアを提供してくれるかです。プロンプトの上部で、アクティビティからどのようなフラットなJSONファイルを作成できるか提案を求めたことを思い出してください。ご覧の通り、画面右側で多くのことを考えているのが分かります。どのようなデータを解釈するのか興味深いところです。
回答が得られました。13秒しか考えませんでしたが、右側では多くのことを考えていたことがわかります。その部分を閉じて、Oura Ringのアクティビティデータの概要から見ていきましょう。Oura APIのドキュメントによると、取り込み可能な各フィールドについて説明しています。これは良いことです。なぜなら、このように説明できるということは、モデル自身がそれを理解しているということだからです。これをコンテキストとして使用しているので、アクティビティデータを構成するすべてのパラメータを把握しています。
n8nコードノードの機能についてもカバーしており、私が使用しようとしているノードを理解し、ここでドキュメントを参照しています。そして、現在のデータ構造の分析を行い、アクティビティの生ノードがこのようなデータを出力すると説明しています。
最も興味深かったのは、フラットなJSONファイルの提案です。洞察に富んだ可視化のために、データをフラット化した日次サマリーJSONを作成することを提案しています。例えば、フラット化されたJSONには、スコア、ステップ数、アクティビティカロリー、総カロリー、目標カロリー、目標メートル、日付とタイムスタンプ、アクティビティの内訳、そして貢献要因などのメトリクスを含めることができると提案しています。
そして、私のデータで作成できる異なる種類のグラフを提案してくれました。私がデータのコンテキストを提供し、モデルは検索するよう指示されたドキュメントを理解して、どのようなメトリクスを取り込めるかを理解し、必要なファイルを取得するために使用できるコードをここに提供してくれました。
これで完全な生のアクティビティデータが得られるので、このコードをコピーしてn8nに戻り、コードノードをアップロードしてみましょう。コードと入力して、すでに接続されているのは良いことです。このコードをペーストして、うまく機能するか見てみましょう。
それほど複雑ではありませんが、すべてを自分で理解しようとするのではなく、データがどのように見えるかを示し、何をしたいかを伝えると、何ができるかの提案と、より構造化されたJSONを出力するためのコードを提供してくれました。テストステップを押して、機能するか確認してみましょう。
素晴らしい、一発で機能しました。通常はこのようにはいかず、複数のエラーを修正して繰り返し試行する必要があり、望む形式でデータが出力されないことが多いのですが、今回は日付ごとに整理された完全な生データを提供してくれました。これは素晴らしいです。
ここに入って、このファイルを実際のJSONに変換することもできます。データがすべてここにマッピングされているので、コードノードにマッピングするだけで簡単です。このステップをテストすると、Googleドライブに簡単にアップロードできるJSONファイルに変換されます。
これがo3ミニモデルを実際の問題に使用した例です。私はちょうどo1モデルを使用しようとしていましたが、o3ミニが利用可能になったという通知を受け取りました。このアップデートを紹介するビデオを楽しんでいただければと思います。
o3について質問したり、一緒に議論したい場合は、無料のAIコミュニティ「AI Pioneers」への参加をお勧めします。AI Pioneersは他の人々とAIについてチャットできる場所で、現在36人がオンラインで、グループには3,400人以上のメンバーがいます。AIについて楽しく過ごせる場所です。人々が採用活動を行ったり、価値のあるコンテンツをアップロードしたりしています。
ネットワークを広げ、アドバイスを提供したり、質問したりする素晴らしい機会です。教室セクションには、10モジュールのAIコースと共に、YouTubeの動画がすべて掲載されています。AIが好きで、同じように好きな人々と一緒にいたい場合は、AI Pioneersが最適な場所です。以上で、o3についてのビデオを終わります。お楽しみいただけましたら、いいねと購読をお願いします。次回の動画でお会いしましょう。