
8,871 文字
https://www.youtube.com/watch?v=td7Lfs_Er1k
皆さん、いつもの導入部分はもうお馴染みだと思いますが、今日のニュースがあまりにも驚くべき内容なので、最初に触れておく必要があると感じました。まず、オーストラリアのチャールズ・ダーウィン大学による画期的な研究で、AIが特定のがんを驚異的な99%の精度で検出できるようになったことが明らかになりました。次に、テキサス州のある私立学校がAI搭載のチューターを使用したところ、生徒たちのテストスコアが全国でトップ2%にまで急上昇したというニュースがあります。そして最後に、DeepSeek V3モデルの大型アップデートと、この数日間に発表された他の多くの興味深いAIニュースがあります。さあ、詳しく見ていきましょう。
今週の最も驚くべき話の一つは、オーストラリアのCDUが発表した「AIが主要ながんをほぼ完璧な精度で診断」という記事でした。世界中の他のいくつかの大学との共同研究で、彼らは子宮内膜癌を99.26%の精度で検出できるAIモデルを開発しました。子宮内膜癌はオーストラリアで最も一般的な婦人科がんであり、オーストラリアの女性において最も診断されるがんの一つです。
子宮内膜癌は子宮の内膜に発生するがんの一種で、特に閉経後の女性に影響を与えることが多いです。良いニュースは、特に早期に発見された場合には一般的に治療可能だということです。それがこのブレークスルーをとても重要なものにしています。
彼らによると、ECGMPLと呼ばれるこのモデルは、疾患分析に使用される組織の顕微鏡画像である組織病理学的画像を検査します。このモデルは画像の質を向上させ、最も重要な領域を特定し、組織を分析します。自動診断による現在の子宮内膜癌の精度は約78.91%から80.93%と報告されています。つまり、このAIモデルが登場する前は、約20%の症例が基本的に診断されていなかったか、検出されていなかったということです。これによって救われる命がどれほど多いか想像してみてください。
このモデルについてさらに驚くべきことは、他のがんにも効果があるということです。CDUの客員准教授であるヌーシャ・シャフィアバティ(発音が間違っていたらすみません)は、オーストラリアンカトリック大学の准教授でもあり、このモデルは子宮内膜癌の診断以外にも利点があると述べています。同じ方法論は、他の疾患の迅速かつ正確な早期発見と診断にも適用でき、最終的には患者のより良い治療結果につながります。私たちはいくつかの組織病理学的画像データセットでこのモデルを評価しました。結腸直腸がんを98.57%の精度で、乳がんを98.2%の精度で、口腔がんを97.34%の精度で診断しました。
これはAIがすでに医療を変革している実例です。近い将来、これと同様の多くのブレークスルーが見られるでしょう。さらに将来を見据えると、AIの統合があらゆる医療の側面で標準になる世界が見えてきます。というのも、ある時点でAIが一貫してより正確でより効果的であることが証明されれば、患者ケアにそれを使用しないことは文字通り非倫理的になるかもしれないからです。皆さんはどう思いますか?コメントで教えてください。
医療業界を変革するAIの話題に触れている間に、ヒューマノイドロボットについても話さなければなりません。これはUnitatyのG1ヒューマノイドロボットで、遠隔操作を通じて直接的な臨床タスクを実行しています。遠隔操作とは、人間がリモートでロボットを制御することを意味し、おそらくVRヘッドセットや特殊なコントローラーのようなものを使用しています。しかし、それはこれがどれほど印象的であるかを軽減するものではありません。
ご覧のように、このロボットは基本的な身体検査から緊急処置、さらには精密な針を使用するタスクまで、幅広い医療処置を行うことができます。重要なのは、遠隔操作によってこれらのタスクを実行することで、自律的にこれらを学習するために使用できる高品質なトレーニングデータも生成していることです。
この意味するところは明らかです。これは患者ケアを革命的に変え、特に遠隔地や危険な環境でも専門的な医療介入を世界中どこにでも届けることができます。先ほど述べたように、これはUnitのG1モデルで、先週ヒューマノイドロボットによる世界初の立った状態からのサイドフリップを成功させ、さらに数日前にはヒューマノイドロボットによる世界初のキップアップを実行しました。人間の医師にそれができるか見てみたいものです。冗談はさておき、これは本当に驚くべきことです。
前から言っていますが、人々はヒューマノイドロボットの可能性を過小評価しています。私たちは文字通り、より賢く、より器用で、集合知を持つヒューマノイド種を創造しています。間もなく、これらのロボットは想像できるあらゆることにおいて、どんな単一の人間よりも能力が高くなる可能性があります。
他のAIニュースでは、NvidiaとXAIがMicrosoft、BlackRock、アブダビのMGXに加わり、AI基盤を開発します。この記事によると、Nvidiaとイーロン・マスクのXAIは、MicrosoftのMGX投資ファンドとBlackRockが支援するコンソーシアムに加わり、米国のAI基盤を拡大すると水曜日に発表しました。これは次世代技術を支配するグローバルな競争が激化するなかでの動きです。
彼らは具体的にいくらの投資を計画しているかは明らかにしていませんが、借入資金を含め最大1000億ドルを動員するという広範な目標に言及しています。このイニシアチブは、OracleとSoftBankが関わるOpenAIの巨大な5000億ドルのAIインフラプロジェクト「Project Stargate」への直接的な対応と思われます。明らかに、現在大きな資金はここに向かっており、これから生まれる画期的なイノベーションが楽しみです。
XAIといえば、Grokが「Deeper Research」という機能を持つようになったことを簡単に言及しておきたいと思います。以前は「Deep Research」があり、今は「Deeper Research」があります。これは単に元のバージョンをさらに高度で詳細にしたもので、Grokがトピックをさらに深く探究できるようにします。これ以上言うことはあまりありません。
検索といえば、AnthropicがついにClaudeにインターネットへのアクセスを与えました。彼らが述べているように、「現在Claudeを使用してインターネットを検索し、より最新で関連性の高い回答を提供できるようになりました。ウェブ検索により、Claudeは最新のイベントと情報にアクセスでき、最新データから恩恵を受けるタスクの精度が向上します。」
先ほど見たように、XAIのような企業はすでに高度な「Deeper Research」機能をリリースしている一方、Anthropicはようやく初のウェブ検索を展開しています。これが重要な理由は、Anthropicが安全上の懸念からチャットボットにインターネットアクセスを与えることに有名な慎重さを持っていたからです。これは興味深い疑問を提起します。これはチャットボットをインターネットに接続することが現在本当に安全になったということを意味するのか、それともAnthropicが競争の圧力を感じ始めただけなのでしょうか?個人的には、おそらく両方だと思いますが、皆さんはどう思いますか?コメントでお知らせください。
AnthropicはまたClaudeに「think tool」を導入し、複雑なツール使用状況で立ち止まって考える能力を付与しました。このthink toolとは何かというと、「think toolによって、Claudeに最終的な回答に到達する過程の一部として、専用のスペースを持つ追加の思考ステップを含める能力を与えています。拡張思考と似ているように聞こえますが、それは異なる概念です。拡張思考はClaudeが応答の生成を開始する前に行うことすべてについてです。拡張思考では、Claudeは行動を起こす前に計画を深く考え、反復します。think toolはClaudeが応答の生成を開始した後、立ち止まって先に進むために必要な情報をすべて持っているかどうかを考えるステップを追加するためのものです。これは特に長いツールコールのチェーンを実行する場合や、ユーザーとの長い複数ステップの会話で役立ちます。」
Tool Bench(モデルが現実的な顧客サービスシナリオでツールを使用する能力をテストするように設計された包括的なベンチマーク)では、かなり良いパフォーマンスを示しています。このグラフでは、Tool Benchの航空会社ドメインでのパフォーマンスが示されており、フライトの予約、予約の変更、そして現実的な顧客とのやり取りにおける航空会社のポリシー処理などのタスクを管理するモデルの能力が評価されています。興味深いことに、拡張思考だけではこの新しいthink toolを上回りますが、think toolが航空会社ドメインからの実生活の例を含むプロンプトと組み合わされると、そのパフォーマンスは大幅に向上します。
また、Tool Benchの小売ドメインでは、プロンプトなしのthink toolが実際に拡張思考を上回っています。各アプローチには明らかに適したタイミングと場所がありますが、全体的に見て、これはAIエージェントのツールキットに追加された素晴らしいツールです。
さて、AIが医療をどのように変革しているかについてはすでに見てきましたが、教育をどのように変革しているかについてはまだ触れていませんでした。記事には「テキサス州オースティンのAlpha Schoolでは、生徒たちは1日2時間、AIアシスタントと一緒に教室に配置され、残りの時間は公開スピーキング、金融リテラシー、チームワークなどのスキルに焦点を当てています。私たちはAIチューターと適応型アプリを使用して、すべての生徒に完全にパーソナライズされた学習体験を提供しています。その結果、生徒たちはより速く、はるかに良く学んでいます。実際、私たちのクラスは全国でトップ2%です。」と書かれています。
これはAIが本当に最も大きな影響を与える可能性がある分野の一つだと思います。教育がいかに重要であるか、そして一対一の個別指導がいかに強力であるかは皆知っています。統計を調べることもできますが、個人的な経験から言うと、高校時代は数学が本当に苦手でした。そして、ある年数学の家庭教師をつけることにしました。正直に言うと、それはおそらく私の両親のアイデアだったと思いますが、とにかくその家庭教師をつけた後、私はほとんど落第しそうだったクラスの最下位から、クラスメイトによく助けを求められるトップの生徒の一人になりました。
これは長く続きませんでした。なぜか個別指導をやめてしまい、成績が明らかに下がってしまったからです。しかし、ポイントは、すべての生徒がそのような素晴らしい家庭教師にアクセスできたら想像してみてください。数学だけでなく、どんな科目でも、いつでも利用でき、彼らのニーズに特化したものが。それはまさにAIだけが現実的に提供できる種類の未来です。
ここでの潜在的な影響は文字通り測り知れません。特に質の高い教育や、あるいはどんな教育にもアクセスできない地域では、現在世界にどれだけの無駄になっている可能性が存在するのでしょうか。教育と医療はおそらくAIが現在革命を起こしている最も刺激的な2つの業界であり、私たちはまだ可能性の表面をかすかに引っ掻いただけです。他のニュースとして、OpenAIはAPIで3つの新しい最先端の音声モデルをリリースしました。2つの音声からテキストへのモデル「GPT-4o transcribe」と「GPT-4o mini transcribe」、そして「GPT-4o mini text-to-speech」という新しいモデルで、話し方を指示できます。トーン、話し方、ムードなどの特定の指示を与えることができます。このリリースには、開発者がテキストベースのエージェントを音声エージェントに変換しやすくするエージェントSDKのアップデートも含まれており、インタラクティブなAIアプリケーションを作成する開発者のハードルを大幅に下げています。
彼らはこのリリースのためにライブストリームを行ったので、もっと詳しく知りたい方は、下の説明欄にリンクがあります。これは今週のOpenAIニュースだけではありません。つい最近、OpenAIがリーダーシップの役割を再編成したと報じられました。この記事によれば、「月曜日に発表された重要な幹部の再編成で、OpenAIはCOOのブラッド・ライトキャップの責任を拡大し、CEOのサム・アルトマンは会社の技術的方向性により注力するようシフトしています。ブルームバーグによると、ライトキャップは現在、日々の業務、国際展開、マイクロソフトやアップルなどの技術大手との重要なパートナーシップを監督します。」
OpenAIはまた、最近まで研究のSVPだったマーク・チェンを最高研究責任者に、以前は人事VPだったジュリア・ヴァーグラを最高人事責任者に昇進させました。この再編成は、OpenAIがポストトレーニングの研究VP、リアム・フェデューセが会社を去り、新しい材料科学AI起業を立ち上げると発表してからわずか数日後に行われました。
OpenAIはこれまでにもこのような大きな動きをしてきましたが、アルトマンがより実務的な役割に就くことで、彼らがますます圧力を感じ始めていることは明らかです。より多くの企業が急速に追いついてきており、特に外国企業が、そしてOpenAIは明らかにそのリードを維持するための準備をしています。
外国との競争といえば、OpenAIはMetaとともに、インドへの進出を拡大しようとしています。この記事によれば、「OpenAIとMeta Platformsは、同国におけるAIサービスを拡大するための潜在的なパートナーシップについて、インドのReliance Industriesと別々に協議を行っています。」さらに、「レポートによると、OpenAIは従業員とも、チャットボットの購読価格を月額20ドルではなく、数ドルという低価格にすることについて議論しました。」
OpenAIとMetaの両方がインドで急速に規模を拡大する方法を模索しているようです。インフラのパートナーシップだけでなく、より多くの人がアクセスできるように価格を調整することでも。最後に、記事はまた「Relianceは、メタとOpenAIのモデルを、同社が建設を計画している3ギガワットのデータセンターで実行することについて議論しており、これは世界最大のデータセンターであると言われ、グジャラート州のジャナガル市に位置しています」と述べています。
これはすでにグローバルテック業界で新興勢力となっているインドにとって大きな動きとなるでしょう。これは、OpenAIが現在直面しているより大きな問題を示しています。中国は彼らのモデルの価格を大幅に下回っており、より多くの企業が低コストのオープンソースオプションを採用しています。ここでは「元Google中国の責任者であるKFファイはAI新興企業の01.aiを完全にDeepSeekのオープンソースモデルに対応させ、これらをOpenAIのビジネスモデルに対する実存的課題と表現しています。リーによれば、DeepSeekのリリースは中国で「チャットGPTモーメント」と呼ぶものを引き起こし、AIアプリケーションに対する広範な熱意を生み出しました。この変化により、多くの中国のハードウェアおよびソフトウェアプロバイダーがDeepSeekモデルと連携するようになりました。」
さらに「リーはDeepSeekの無料オープンソースアプローチがOpenAIに根本的な課題を提示していると考えています。『サム・アルトマンにとって最大の悪夢は、彼の競争相手が無料であることです』とリーは言います。『私はすでにDeepSeekが無料であるため、ChatGPTの購読をキャンセルした多くの人に会いました。』」
これは、他の米国企業からだけでなく、彼らのビジネスモデル全体を脅かすグローバルなオープンソースの波からも、OpenAIにかかる圧力の高まりを浮き彫りにしています。今週だけでも、テンセント、アリババ、DeepSeekという中国企業から3つの大きなAIモデルリリースがありました。
テンセントはHunyan T1を紹介しました。これは初めてのハイブリッドMamba-Transformer構造の推論モデルです。このモデルは、ほぼすべてのLLMの構造であるトランスフォーマー構造と、長いシーケンスでの速度と効率性に焦点を当てた新しいデザインであるMamba構造の一部です。Mambaモデルは状態空間モデルと呼ばれるものを使用し、トランスフォーマーが使用する注意メカニズムに依存するのではなく、データをより連続的なストリームとして処理できます。これらのベンチマークでどれほどうまく機能しているかを考えると、おそらく私たちはAI空間でこの組み合わせをもっと見ることになるでしょう。
次にアリババの新しいQuenモデルがあります。彼らは「72BはVLM(vision language model)には大きすぎ、7Bは十分に強力ではない、だからこそ私たちの32Bモデル、Quen 2.5 VL 32B instructを使うべきだ」と述べています。これはそのサイズで明らかに最先端の32億パラメータのビジョン言語モデルです。ほとんどのベンチマークで、GPT-4o、GoogleのGemma 3、Mistral Small 3.1、そして古いQuenの72億パラメータモデルをも上回っています。最大のリリースではないとはいえ、それでもかなり印象的です。
おそらく最大のリリースは、DeepSeek V3のアップデートです。これは予想外のリリースでした。Xでは今週DeepSeek R2が出るという憶測や、DeepSeek V4が出るかもしれないという憶測もありましたが、それらは少し楽観的すぎたようです。私たちが得たのはV3への小さなアップグレードであり、DeepSeekからは全く発表がありませんでした。簡単な言及さえもありませんでした。しかし、当初これは小さなリリースだと考えられていましたが、コミュニティのテストによると、このアップデートは実際にはかなり大きかったようです。
Xのあるユーザーはこれについて「社内テストに基づく最高の非推論モデル」と主張しています。他のコミュニティテストも同じことを言っており、このアップデートされたV3モデルは非推論モデルの中で最高か、それに近いと言っています。繰り返しますが、中国はこれらの信じられないほど安価で高性能、広くアクセス可能なモデルでOpenAIにかなりの圧力をかけています。そして、先ほど見たように、中国はちょうど今「ChatGPTモーメント」を迎えたようで、彼らは本当に始まったばかりだということです。
OpenAIがこれらの懸念の高まりによってビジネスモデルを再構築するかどうかは興味深いことです。彼らがしたいことではないかもしれませんが、選択肢がなくなる可能性もあります。
編集中に一言入れておきますが、DeepSeekがHugging Faceにベンチマークを公開したところです。このアップデートされたDeepSeek V3モデルが最高の非推論モデルであることが確認され、ハイブリッド推論モデルであるClaude 3.7 Sonnetさえも上回っています。
最後に、動画を締めくくるために、さらに2つのことについて触れておきたいと思います。まず、MER Researchが発表した新しいグラフで、AIが実行できるタスクの長さが7ヶ月ごとに倍増していることが示されています。これは過去6年間続いており、この傾向を外挿すると、5年以内に現在人間が数日あるいは数週間かかるソフトウェアタスクの大部分を独立して完了できるAIエージェントが登場すると予測しています。これはかなり驚きです。AIタスクの長さに関して、新しいムーアの法則のようなものがあります。これは、AIエージェントが人間が文字通り何年もかかるタスクを実行できるようになるまでどのくらいかかるのか、そしてそれがどのように見えるのかという疑問を抱かせます。
最後の話題は、PerplexityがTikTokを買収し、基本的にアメリカで再構築する計画があるということです。これはアメリカのデータセンターでアメリカの監視のもとで開発・維持され、国内のプライバシー基準や規制と整合性を確保します。PerplexityはAI検索会社として主に知られているので、ソーシャルメディアへの大きな進出を狙っているのは確かに驚きですが、おそらくそれが彼らの戦略なのでしょう。彼らのAIシステムとアルゴリズムをTikTokのようなプラットフォームと組み合わせて、真にAIネイティブなものを構築することです。
それでは、今日のAIニュースは以上です。視聴していただきありがとうございます。動画を楽しんでいただけたなら、ぜひ「いいね」をしてください。そして、いつも通り、このようなAIニュースを今後も入手したい場合は、ぜひ購読ボタンを押してください。
コメントを残す