
8,666 文字

今週のエピソードでは、OpenAIのGPT-4.5とGPT-5に関する情報が遂に公開されました。多くの要望があったChatGPTの新機能や、様々な業界におけるAIの活用事例をマッピングした資料、そして今すぐ活用できる新しいリリースや着想について紹介します。
まずはGPT-4.5とGPT-5のロードマップについて見ていきましょう。サム・アルトマンがXで発表したものです。これはGPT-4のリリースからほぼ2年が経過した今、最も要望の多かった情報でした。時が経つのは本当に早いものですね。
最初の重要なポイントは、次のリリースが社内で「Orion」と呼ばれていたGPT-4.5になるということです。このモデルについては多くの噂がありましたが、今回ようやく具体的な内容が明らかになりました。これは彼らが提供する最後の非思考モデルとなります。
その後は、現在のような複数のモデルから選択する形式ではなく、一つの統合された体験へと移行していきます。今のAIシステムでは、GPT-4.0やGPT-4、スケジュールタスク用のo1、無料版のo3ミニ、o1プロなど、様々なモデルがあり、それぞれの用途を理解する必要があります。
サム・アルトマンによると、これは終わりを迎えようとしています。GPT-5と呼ばれる新システムは、最先端のo3思考モデルを含むすべての技術を統合し、思考モデルが必要かどうか、どのアプリケーションが適切かをChatGPTが自動的に判断する一つの集中的な体験となります。
これは単なるモデルルーターではなく、GPT-4.0やo1、o1プロを選択するのではありません。一つの大きなモデルがすべての機能を担う統合された体験となります。
リリース時期について尋ねたところ、「数週間から数ヶ月」との回答がありました。私の予想では夏までには、おそらく4月までにはリリースされるかもしれません。
価格プランについても触れられました。無料ユーザーは標準の知能設定でGPT-5に無制限にアクセスでき、Plusユーザーはより高い知能レベル、Proユーザーはさらに高い知能レベルで利用できるようになります。基本的に現在のシステムと同様で、無料ユーザーはGPT-4.0、有料ユーザーはo1、Proユーザーはo1プロを使用できる形です。現在はo3ミニも加わって少し複雑になっていますが、考え方は同じです。
DeepResearchについては、具体的な数字が発表され、ChatGPT Plusユーザーにも提供されることが決まりました。これは非常に素晴らしいニュースです。最近リリースされたAIツールの中で最も強力なものの一つだと思います。まだOperatorも試していますが、DeepResearchの方が多くのユーザーにとって便利です。無料枠は月2ユーザーになる予定で、おそらくGPT-5と同時にリリースされるでしょう。そのため、ほとんどのPlusユーザーは1-3ヶ月ほど待つ必要があります。
次に、今週ChatGPTに実装された具体的なアップデートを見ていきましょう。私のお気に入りは、OpenAIのo1、o3ミニ、o3ミニハイがファイルと画像のアップロードに対応したことです。これにより、文書について推論することができるようになりました。様々なターゲットオーディエンスや会社のロードマップに関するマークダウンファイルを持っている私にとって、これは非常に便利な機能です。もはやコピー&ペーストは必要ありません。
研究論文や企業のPDF、複雑な図表やインフォグラフィックを思考モデルに追加したい場合も可能です。思考モデルはこれらの処理が得意です。
もう一つの小さな機能の改善点として、モバイルからプロジェクトを作成できるようになりました。これらの機能は通常、まずウェブ版でリリースされ、その後数週間かけてモバイルアプリやデスクトップアプリに展開されていきます。もし使いたい機能がモバイルアプリやデスクトップアプリにない場合は、少し待てば追加されるでしょう。
OpenAIのアップデートセクションの最後に、思考モデルのベストプラクティスについて触れたいと思います。どのように使用し、プロンプトを作成し、何に使用するべきかについて公開されました。
例えば、この建築図面のような複雑な画像の分析が得意だということです。リンク先では最適なモデルの選び方についてのヒントが提供されています。思考モデルをいつ使用するべきかという点が特に興味深いと思います。
建築図面の視覚的な推論の例を見てみましょう。多くの詳細が含まれているこのような問題をGPT-4.0で取り組むと、重要な詳細を見落とすことがよくありました。なぜその詳細を見落とすのか、略語が明確に示されているのになぜ使用できないのか、と疑問に思うことが多かったです。10回実行すると、時々うまくいき、時々失敗することがありました。
思考モデルはこれらを一貫して処理することが得意です。自己ループして、他に何ができるか、すべてを考慮したか、すべての略語を考慮したかを確認するからです。
また、思考モデルを効果的にプロンプトする方法についてのヒントも含まれています。画期的なものはありませんが、このチャンネルの動画やライブストリームで既に多くを取り上げています。思考モデルに焦点を当てたライブストリームもありました。
さて、次のAIニュースに移りましょう。VO2の最初の一般公開についてです。これはGoogleがティーザーを出していた中で最も能力の高い動画生成モデルとされていますが、これまで正式にリリースされていませんでした。今回初めて、YouTubeの機能を通じて公開されます。
残念ながら私はまだアクセスできていませんし、スマートフォンでも動作させることができていませんが、アメリカにいる方はYouTubeアプリを開くだけでDream Screen機能を通じてVO2にアクセスできます。この機能を使うと、ショート動画用のAI生成背景を作成することができます。
チャンネルの友人であるbowalが実際にテストを行い、タイムズスクエアを走る巨大なチワワの映像を借用させてもらいました。これは現在世界で最も能力の高い動画生成モデルと言えるでしょう。多くの人がこの意見に同意すると思います。
ショート動画クリエイターの方や、より多くのショート形式のコンテンツを作成したいと考えている方にとって使いやすい形でリリースされています。複数のクリップをプロンプトで生成し、つなぎ合わせることもできます。現在は米国、カナダ、オーストラリア、ニュージーランドでのみ利用可能で、将来的に他の国々にも展開される予定です。
つまり、InstagramショートやTikTok、YouTubeショートのフィードでより多くのAIを目にすることになるでしょう。人々がこれを使用して他のプラットフォームに再アップロードすることになるからです。それが良いことかどうかはわかりませんが、様子を見ていきましょう。
13年前に最初のYouTubeチャンネルを始めた頃から、100万回再生の動画を作ること、10万人の登録者を獲得すること、そして最も重要なこととしてRaid Shadow Legendsからスポンサーシップを得ることという夢がありました。そして皆さん、私たちはついにそれを達成しました。
Raid Shadow Legendsについてお話しさせてください。ご存じない方のために説明すると、Raidは何年もの間ゲーム界で現象となっており、毎年ゲームをより良くするための要素を追加し続けています。
このゲームはAAAグラフィックスと無限のコンテンツを備えており、PCでもモバイルデバイスでもどこでもプレイできます。私が特に気に入っているのはPVEモードで、キャンペーンやダンジョンなどのストーリーを通じてプレイできます。
チャレンジングなゲームプレイと純粋な楽しさのバランスが絶妙です。また、複数人でプレイすることもできるので、友人や家族とチームを組みたい場合は、クランシステムを通じて他のプレイヤーとつながることができます。私も「AI Advantage Clan」というゲーム内クランを立ち上げました。
現在、Raidでは「Alice’s Adventures」という特別イベントを開催しています。不思議の国のアリスの童話にインスパイアされたイベントです。子供の頃にアリスが好きだった方にとっては、Raidのゲームプレイと組み合わさった楽しい展開となっています。
アリス・ザ・ワンダラー、マッドハッター、おなじみのチェシャ猫、ハートのネイブを含む5人の新しいレジェンダリーチャンピオンが登場します。3月5日までイベントダンジョンでハートの女王に挑戦すると、ピンポイントギアセットなどの報酬が得られます。また、3月26日までに7日間ログインすると、アリス本人を無料で入手できます。
初心者にとってアリスを最初から持っているのは本当に助かります。私も始めた時にそうだったらよかったと思います。
説明欄のリンクまたは画面上のQRコードを使用してRaid Shadow Legendsをダウンロードしてください。新規プレイヤーには多くのボーナスが用意されています。まず、2人の限定エピックチャンピオンとして、リザードマン派閥のドレイクンがすぐに、そしてレベル15に達するとバナーロード派閥のナイト・エランドが獲得できます。
さらに、今サインアップすると、プロモーションコード「Monkey King」を使用して、レジェンダリーチャンピオンの孫悟空2.0をアンロックできます。PVPアリーナに参加する予定の方には特にお勧めです。
イベントのアリスを含めると、ゲーム開始時から2人のエピックと2人のレジェンダリーチャンピオンが手に入ります。つまり、ゲームを始めるのに今が最高のタイミングです。QRコードまたは説明欄のリンクを使用して、今すぐRaid Shadow Legendsをダウンロードしてください。
さて、YouTuberとしての目標を達成したところで、使えるAIニュースに戻りましょう。
これはShare bopicによるもので、非常に気に入っています。アプリケーションではありませんが、世界でAIが使用されているさまざまな方法をマッピングしたものです。実際の業務タスクについて話しています。
このようなデータを見るのが好きです。なぜなら、このチャンネルで扱っている多くのことを文脈化してくれるからです。この記事には興味深い内容が多くあります。例えば、AIの影響を受けている様々な職種の平均賃金などです。
Claudeは、特定の職種における会話の割合を具体的にマッピングしています。例えば、すべての会話の約2%がコピーライターによるコピーライティング関連のタスクでした。そして見てわかる通り、Claudeで実行されるタスクの平均賃金は約66万ドルです。非常に興味深いデータですね。
しかし、上部のこのグラフが私にとって最も啓発的でした。AIアシスタントを最も使用している異なるセクター、特に人々が最も使用しているタスクを示しているからです。
コンピューターと数学が37%でトップを占めています。AIの使用事例の37%がコンピューターと数学に関連しています。次いで芸術とメディア、教育、管理業務、社会科学、生命科学、そして最後にビジネスと財務の使用事例があります。
このチャンネルでは、これらのうち5つか6つに焦点を当てていると言えるでしょう。基本的なコンピュータープログラミングのチュートリアルを時々取り上げていますが、主にコードを扱ったことのない人々を対象としています。これは開発者向けのチャンネルではありません。
例えば、このチャンネルの視聴者の大部分を占めるビジネスパーソンの方は、これを見て、Anthropicが分析した最大手の一つとしてのAIの主要タスクを確認することができます。
1位は、財務データの分析と投資・予算戦略の開発です。コードインタープリターは非常に強力で、思考モデルを使えば数分では気付かないような洞察を得るためにシートをアップロードして分析を依頼することができます。
個人財務のアドバイスと教育の提供も含まれています。私も以前、生活やビジネスにおける変数の変化を考慮して予算を立てたり支出を追跡したりする方法について質問したことがあります。
教育・図書館分野では、包括的な教育カリキュラムや教材の設計・開発が100%可能です。私たちはガイドやコースのアウトラインの構成、コミュニティで実施しているビデオ講義からクイズを作成するのに利用しています。教育分野での活用事例は非常に広範です。
このショーは主に新しいものの最初の紹介で、リリースをテストして比較することもありますが、AIが実際にどのように使用されているのか疑問に思ったことがある方にとって、このAnthropicの記事は最も優れたものの一つだと思います。将来の講演や教材で参照するためにブックマークしておくつもりです。とても良い内容だと思ったので、皆さんにもお勧めしたいと思います。
次に、Zosという新しいオープンソースのテキスト読み上げモデルについて説明します。これは、これまで有料でしか利用できなかった機能の一部を無料で提供するものです。
基本的にZyraはテキストを音声に変換するアプリケーションで、テキストに人間らしい声を適用できますが、無料で音声クローン機能も利用できます。初めてテストしてみましょう。ヘッドフォンが必要ですね。
Apache 2.0ライセンスで公開されていることも注目に値します。つまりオープンソースで、月100分まで無料で生成できます。ここでは適当なGoogleアカウントでログインしただけです。
それでは音声クローン機能を試してみましょう。ここでは適当なメッセージを話して、編集でスキップできるようにしますが、約1分間話して、声のクローンを作成できるようにします。見える適当なテキストを読んでみましょう。「Zosへようこそ」
これが私の録音のようです。「Egor one」と名付けて、このボイスを選択したら、テキストを変更します。小さなメッセージを入力して生成ボタンを押します。「AI newsへようこそ。これは無料の音声クローンアプで…」。appのスペルを間違えましたが、かなり良い出来でした。
最先端とは言えないかもしれませんが、無料でこの品質が得られ、30秒の録音だけで実現できました。私が持っているElevenLabsの音声は90分の音声録音を提供しましたが、1分未満の録音でも同様の品質レベルが得られます。しかもこちらは無料でオープンソースです。かなり素晴らしいですね。
次に進みましょう。これは先週取り上げたlat(競合するChatGPT)のフォローアップです。エンターキーを1、2、3、4回押してみましょう。なんと素晴らしい速さです。
簡単にまとめると、彼らは競争力のある思考モデルを持っていませんが、際立った特徴は信じられないほどの速さで、無料枠でも利用できます。現時点で最速のAIアシスタントが必要な場合は、おそらくこれが最適な選択肢です。
そして今はモバイルアプリケーションとしても利用できます。速度を比較した小さな動画を用意していますが、先週デモを行い、これらのアプリケーションの動作を正確に表していることを確認できました。
見ての通り、まったく比較になりません。この動画は1分間続きますが、latのチャット完了は最初の2秒でほぼ終わっています。AppleやAndroidデバイスで無料アプリを入手できます。もしそういったことに興味がある友人がいれば、自分のAIが彼らのものより速いことを見せびらかすことができますね。
次は簡単な内容ですが、OpenAIのスーパーボウル広告をご覧になった方もいるでしょう。技術の歴史とAIを使用する現代の技術時代をカバーした素晴らしい広告でした。
ここで最も興味深いのは、XのMike bespalovが、その広告で見られたような視覚効果を作成できるアプリを作ったことです。OpenAIのツール、特にo3ミニを使用して完全に構築されています。
正直なところ、なぜコード内でSoraについて言及されていないのにVideo Soraと書いているのか少し混乱しました。誰か説明できる方がいればお願いします。
いずれにせよ、o3ミニを使用してスーパーボウルで放送されたような広告を作成するツールを構築し、このリンクで自分で試すことができます。o3ミニが書いたコードはすべてここにあり、下で使用できます。
グリッドサイズを変更したり、自分の画像をアップロードしたりできます。デスクトップに何故か常にある信頼できるキアヌ・リーブスの写真を使ってみましょう。なぜこの写真を持っているのかわかりませんが、もはやそういうものですね。
ご覧の通り、動画ではありませんが、ドット効果のキアヌですね。値を変更してコントラストを上げてみましょう。キアヌが少し見えにくくなっていますが、なかなか良い感じです。
動画も用意してあります。これはコミュニティで行ったもので、ChatGPTとテキスト読み上げを3Dアバターとゲームエンジンに接続したものです。しかしこれは長すぎるので、もっとシンプルなものにしましょう。
これはいいかもしれません。そうそう、これはLuma Labsの開始フレームと終了フレーム機能を使ってこのグラフィックをレンズに変換したテストの一つでした。やってみましょう。
素晴らしい見た目ですね。カメラレンズですね。グリッドサイズを少し大きくしてみましょう。どう見えるでしょうか。まだカメラレンズに見えます。
要点はお分かりいただけたと思います。数百万ドルのCMの効果を再現する別の方法としてこれらのツールを使用できることをお見せしたかったのです。素晴らしいですね。ツールを生成したプロンプトも下に共有されています。興味のある方は説明欄のリンクをご確認ください。
次に、この話題に光を当てたいと思います。Googleが様々な生成AIの活用事例を紹介する30秒の動画シリーズを公開しました。これはこのチャンネルとこの番組全体のテーマに合致するものです。
中にはとても刺激的なものもあれば、とても優しくて温かみのあるものもあり、AIの様々な活用事例について非常によく制作された30秒の動画があります。新しい活用事例を探りたい方は、これらを見てみると良いでしょう。
例えば、リアルタイムで会話を翻訳する小さな物語を聞きたい場合は、これをクリックするだけです。「私は他の言語をあまり話せませんが、GeminiとGoogle Meetですべてをリアルタイムで翻訳します」
これは自分で新しい活用事例を探るのに良い方法だと思います。もちろん、その過程で彼ら自身のAIツールを宣伝していますが、紹介する価値があると思いました。
新しい論文について手短に触れておきましょう。通常はGoogleのDeepMindのような研究所が次々と新しい研究を発表しているので取り上げませんが、これは数学におけるAIに焦点を当てているため、特に重要だと考えました。
現時点ですぐに使用できるものではありませんが、AIが数学を得意としないという先入観を打ち破りたいと思います。それは思考モデルから始まり、今ではGoogleのDeepMindによるAlpha geometry 2のような、数学的タスクで金メダリストレベルの性能を達成するものにまで進化しています。
数学に関連する分野にいる方は、少なくともこの要約を読み、達成された結果とAIツールがすでにどれほど強力になっているかを見ることをお勧めします。まだリリースされていませんが、一般の人々がそうする前に自分の世界観に取り入れることができます。
これまでの比較的短い30年の人生で、これは私にとって勝利の戦略であり、お勧めできる方法です。もちろん、すぐには実現せず、将来的に実現するかもしれないことに時間とエネルギーを投資する余裕のある生活環境が必要ですが、これを指摘しておきたいと思いました。
今後のエピソードでもこのような小さな情報を織り交ぜていくつもりです。このチャンネルとこの番組の焦点は科学的研究やAIを取り巻くドラマチックなニュースではありませんが、これらの中には非常に重要なものがあるため、ここでも取り上げていきたいと思います。
内容の約80%を実践的で活用事例に焦点を当てたものにするという方針で進めていきたいと思います。これが私が考え出した公式で、皆さんにも楽しんでいただけることを願っています。
今日はこれで以上です。現在最も能力の高いAIツールと私が考えるDeepResearch機能についてもっと知りたい方は、様々な活用事例とこの200ドルのツールを実際に活用する方法を紹介する単独の動画をチャンネルで作成しました。最近作成した中で最高の動画の一つだと思います。まだご覧になっていない方はぜひチェックしてください。
それでは、来週の「使えるAIニュース」でお会いしましょう。
コメント