GPT-5がリリースされ、アルトマンはo3が2025年に世界最高のプログラマーになることを期待、その他多くのこと

6,322 文字

GPT-5 Será Lançado e Altman Espera que o3 Seja O Melhor Programador do Mundo em 2025 e Muito Mais

GPT-5 e GPT4.5 Serão Lançados Em Breve, Novidades da Maritaca Ai com Sabiazinho 3, Novo Modelo da Perplexity de Notícias...

皆さん、OpenAIがGPT-5をリリースします。はい、何年も待ち望まれていたこのモデルが、ついに棚に並ぶようです。マリタカAIのサビアジーニョの新機能や、パープレキシティの新モデル、そしてアドビのFirefly AIのビデオジェネレーターについてもお話ししましょう。
まず、チャンネル登録していただいた皆様、いいねを押していただいた皆様、そして特に人工知能チャンネルのスポンサーメンバーの皆様に感謝申し上げます。
アドビのFirefly AIビデオジェネレーターがパブリックベータ版となり、テキストと画像を短いクリップに変換できるようになりました。アドビのツールを使い慣れている方には新機能が加わりました。最新のAdobe Creative Cloudでは、テキストと画像を短いビデオに変換でき、AIによるビデオ生成を使い慣れたクリエイティブツールで直接行えるようになりました。
これで選択肢が増えましたね。ビデオ生成にはすでにLuma AI、Sora、そしておそらくそのうちリリースされるであろうv2oなどがありますが、アドビは昨年の限定テストを経て、Fireflyビデオジェネレーターをパブリックベータ版として公開しました。このツールは、テキストプロンプト、画像、またはその両方から、1080p、24FPSの最大5秒のビデオクリップを作成できます。
ユーザーはウェブインターフェースを通じて、スタイル、カメラアングル、動き、フレーミングをコントロールできます。これは興味深い機能です。というのも、プロンプトでズームインやズームアウトなどを選択するのではなく、あらかじめ設定しておけるからです。アドビは、より低解像度の高速なイデエーションモデルと4K高解像度バージョンの両方を開発中で、近日中にリリース予定とのことです。
ここには素晴らしい画像があります。雪に覆われた壮大な山々が穏やかな湖に映り込む空撮シーンです。これはプロンプトで生成されたものです。緑の背景に霧がかかっているシーンもあり、カメラは固定され、霧以外の物体はありません。これは緑の背景用の映像を生成したい場合に便利ですね。様々なコンテキストで使用できます。緑の背景用の映像を作るという発想はなかったですね。
そして黒い背景に揺らめく炎があります。これは「chama Bruxel」（ポルトガル語で「揺らめく炎」）というもので、初めて見ました。ポルトガル語辞書で「bruxuleante」の意味を調べてみましょう。語源は「bruxulear」で、「揺らめく、ちらつく」という意味です。辞書って面白いですよね。
クリエイティブワークフローの一部として、アドビはビデオジェネレーターをCreative Cloudに直接組み込み、AIで生成したクリップを既存のプロジェクトに簡単に追加できるようにしました。AIで生成されたコンテンツに関する法的懸念に対応するため、アドビはビデオモデルをライセンス済みの素材だけで訓練し、顧客データは訓練に使用していないと述べています。
Fireflyビデオモデルでは、アスペクト比、FPS、カメラタイプ、ズームイン/アウト、左右移動、上下チルト、固定、手持ちなどの設定ができます。アドビの生成ツールを使用している方は、どう思われますか？コメントでお聞かせください。
次のニュースです。パープレキシティが超高速AI検索モデル「Sonar」を発表しました。パープレキシティAIの最新検索モデルSonarは、MetaのLlama 3 70Bと専用ハードウェアを搭載してリリースされました。パープレキシティは巨大なAI企業で、多くの人が利用しており、Llama 3 70Bのファインチューニングで収益を上げています。
ファインチューニングは禁止されている、製品化できないという人もいますが、そんなことはありません。Metaが説明するモデルの使用ガイドラインに従ってファインチューニングを行い、製品をリリースすればいいのです。
社内テストでは、ユーザー満足度においてGPT-4、Cloud 3.5 Haikuなどのモデルを上回る性能を示したとのことです。特に検索関連のタスクでは、GPT-4oやCloud 3.5 Sonnetと同等かそれ以上の能力を発揮することもあります。これはパープレキシティの強みですね。
チームはMetaのLlama 3 70Bモデルをベースに、検索能力を向上させるための追加トレーニングとチューニングを行いました。このトレーニングは、回答の精度と読みやすさの向上に焦点を当てたとパープレキシティは述べています。以前は同じSonarという名前でLlama 3.1の改良版を使用していました。パープレキシティの検索機能で私もテストしましたが、ニュースの要約などの読み取りが非常に優れています。
専用チップにより応答速度は新たな段階に達しました。Sonarの高速化のため、パープレキシティはCerebras Systemsと提携しました。Cerebrasはチップデザインに独特のアプローチを取っており、多数の小型プロセッサーを作る代わりに、シリコンウェハー全体を1つの巨大なチップ（Wafer-Scale Engine、WSE）に変換します。このハードウェアでSonarは1秒あたり10,000トークンを処理でき、ほぼ瞬時に応答を生成できます。
これはハードウェアアーキテクチャがいかに重要かを示す興味深い例です。可能な限り一度に多くを処理しようとします。フランスのAIスタートアップMistralが最近、Flash Answersで同様の速度を達成しましたが、これは検索アプリケーション特有のものではありませんでした。数年前には考えられなかったことですが、AIを使ってほぼ瞬時に素晴らしい回答が得られるようになってきています。
現在、Sonarへのアクセスはプロユーザーに限定されていますが、パープレキシティは将来的により広く提供する計画です。Cerebrasとの提携の財務的詳細は明らかにされていません。いずれにせよ、このモデルを使用するにはプロアカウントが必要です。パープレキシティを使用している方、プロサブスクリプションに満足していますか？多くの人がパープレキシティを非常に気に入っているようですね。
次のニュースです。新しいSabiazinhoが飛び立ちます。これはMaritaca AIの投稿です。この更新により、ブラジルの試験ベンチマーク（BRVAL）、ブラジルのコンテンツに関連する対話、指示に従う能力（IFV）の結果が示すように、性能が向上しました。これにより、Sabiazinhoはシンプルなタスクでより効果的になり、必要な速度と経済性を維持しています。新しいSabiazinhoは、以前のバージョンと同じ価格で提供されます。詳細はMaritaca AIのドキュメントをご覧ください。
彼らのベンチマークでは、ENEM、ENAD、OAB、Revalida、CPN、CFCEなど93の試験で性能を測定しました。Sabiazinho TRが70.3%だったのに対し、新しいSabiazinho 3は73%の正解率を達成し、GPT-4 miniの68.4%を上回りました。
会話では、指示に従う能力、対話能力、ブラジルに関する知識を評価しました。モデル判定では、Sabiazinho 3が55%だった正解率が、新しいSabiazinhoでは71%に向上し、GPT-4o miniの69.6%を上回りました。これは興味深いポイントです。ブラジルの文化的特徴をよく研究し、強調すれば、71%をはるかに超える成績を達成できるのではないでしょうか。ブラジルらしさをもっと引き出せると思います。チャットを使用する際、ブラジル特有の質問にうまく答えられていますか？
指示に従う能力では、明確なルールに従って長文を書くなどの能力をプログラムで検証しました。Sabiazinho 3が70%だった性能が、新しいSabiazinhoでは81.5%に向上し、GPT-4oの83%に近づきました。以前は13%の差がありましたが、今では数パーセントの差まで縮まっています。
また、ご存じない方もいるかもしれませんが、Sabiarには検索機能も追加されました。ウェブ検索ができるようになり、OpenAIのGPT-5に関する話題を検索できます。アンタゴニスタ、オリャール・デジタル、エグザメなどの情報源から、GPT-5のローンチプランやOpenAIのCEOに関する情報が得られます。YouTubeなども含め、多くの情報源があります。
この話題に関連して、サム・アルトマンが投稿しています。GPT-4.5とGPT-5のアップデートロードマップについてです。「私たちは、予定しているロードマップをより良く共有し、製品提供を大幅に簡素化したいと考えています」と彼は述べています。なぜなら、AIを皆さんにとって使いやすいものにしたいからです。モデルと製品提供が複雑になりすぎていることを認識しています。
これは確かにそうですね。モデルの数や選択肢を見てください。検索機能があるかどうか、これやあれとの接続があるかどうか。多くの人にとってはシンプルに見えるかもしれませんが、一般のユーザーにとってはそうではありません。一般ユーザーはこの画面に来て質問をするだけです。SoraやOperator、Deep Researchなども含めると、とても多くの機能があり、人々は確実に混乱しています。
アルトマンも「モデルセレクターを私たちも皆さんと同じくらい嫌っており、統合された魔法のような知能に戻りたい」とコメントしています。つまり、質問を見て、どのモデルを使うかを尋ねるのではなく、適切なモデルに自動的に振り分けるということです。
次に、社内でOrionと呼んでいるGPT-4.5を、思考連鎖を持たない最後のモデルとしてリリースします。これらのGPT-4からGPT-5へのアップデートについて、基本モデルの知能が高いことが重要だと常に念頭に置く必要があります。なぜなら、この基本モデルから反射モデルが生まれるからです。GPT-4がGPT-4.5に改良され、その後GPT-5になるとき、基本の知能が向上すれば、次の反射モデルはさらに知的になります。
その後、主要な目標の一つは、OシリーズモデルとGPTシリーズモデルを統合し、すべてのツールを使用でき、長時間考えるべきかどうかを判断し、幅広いタスクに有用なシステムを作ることです。つまり、推論するかどうか、どの程度推論するかを自動化しようとしています。GPTシリーズとOシリーズを別々に扱うということですね。GPT-4oは一つのもので、o1、o3は別のものです。
ChatGPTとAPIの両方で、o3を含む多くの技術を統合したシステムとしてGPT-5をリリースします。o3は単独のモデルとしてはもう提供しません。これは、o3がなくなるという意味ではなく、GPT-5に統合されるということのようです。
ChatGPTの無料版では、標準の知能設定でGPT-5に無制限にアクセスできます（乱用制限の対象）。乱用制限というのは、実際に乱用しているという意味ではなく、単に使用量が多すぎるという意味です。これは現在でも起こっていることで、無限に使用し続けることはできません。一定以上使用すると停止します。
Plusサブスクライバーはより高い知能レベルでGPT-5を実行でき、Proサブスクライバーはさらに高い知能レベルでGPT-5を実行できます。これらのモデルには音声、Canvas、検索、Deep Research等が組み込まれます。つまり、無料プランは一つのレベル、Plusプランは別のレベル、そしてProプランはさらに高いレベルということです。基本的に、支払う金額が多いほど、モデルの知能が高くなります。
Proモデルを使用している方、サブスクリプションが価値あるものだと感じていますか？Deep Research、Sora、Operatorをよく使用していますか？月額200ドル（アプリ内で直接購入すると999.90レアル、約1,000レアル）の価値があると感じていますか？為替レートで換算すると少し高く見えるかもしれませんが、実際には月額1,000レアルです。
o3をGPT-5に統合する決定は、アルトマンが最近強調している大規模推論モデル（Large Reasoning Models）を反映しています。これらは、プログラミングと数学の能力において、強化学習を通じて大きな進歩をもたらしました。OpenAIのo3モデルは現在、世界のトッププログラマーランキングで175位にランクされており、内部の最新バージョンは4位に達しています。年末までに1位に到達する可能性があるとのことです。
これは誰も予想していなかったことですね。年末までにo3が地球上で最高のプログラミング能力を持つようになるのでしょうか？これはとても驚くべきことです。
推論モデルは数学の問題など、正解・不正解が明確なタスクでは優れた性能を発揮しますが、創造的な作業などの他のタスクでは依然として能力が限られています。これは、明確でないものに対する報酬システムの難しさによるものです。
アルトマンは、これらの専門的なモデルをGPT-5の大規模言語モデルの幅広い能力と組み合わせることで、AIの成長に新しい道筋をつけ、日常的なタスクでモデルをより有用で汎用的なものにすることを期待しています。
皆さんはどう思いますか？GPT-5が本当に地球上で最高のプログラマーになると思いますか？もしそうなれば、期待値が非常に高くなり、実際に人間よりも優れたプログラミングを行う必要があります。そうなれば、2025年から早くも不安が始まるかもしれません。
プログラマーたちは「プログラマーは置き換えられない」と主張していますが、一方で、テストに基づいて「最高のプログラマー」と言うのは十分ではありません。科学的なレベルで特定の問題を理解し、ベンチマークに焦点を当てた優れたプログラマーかもしれませんが、実践的な問題を解決する実際のプログラマーとは異なります。
しかし、起きていることは専門性のレベルが上がっているということです。たとえば、プログラマーが安全な状態にいて、波が遠くにあった時代から、ChatGPTが登場して波がくるぶしまで来て、今やその水位が上がり続けている状況です。私たちは正確にどこまで来ているのか分かりません。
コメントや一般的な認識を見る限り、誰もAIモデルがプログラマーを置き換えると予想してはいません。特に日常的なタスクや人生のタスク、そして私たちの理解力と文脈化能力は遥かに高いからです。しかし、これらのベンチマークが徐々に驚くべき結果を示し始めていることも否定できません。
そして、まだ2025年に過ぎないことを覚えておいてください。これは2022年末にリリースされたものです。つまり、一般の人々が使用している人工知能の歴史はわずか2年程度です。これは非常に短い時間であり、本当に私たちの頭を混乱させます。
このようなビデオを続けて見たい方は、チャンネルのメンバーになってください。メンバーはWhatsAppグループへのアクセスと先行公開ビデオを楽しめます。以上です。いいねをお願いします。ありがとうございました。