マイクロソフトがCoreAIを発表し、Phi-4を全ユーザーに無料提供

4,063 文字

Microsoft Introduces CoreAI and Makes Phi-4 Free for Everyone

Microsoft has unveiled a major AI-focused reorganization with the launch of CoreAI, a new division that unites its devel...

マイクロソフトがAI戦略において大きな動きを見せています。社内体制を再編成し、Hugging Faceで印象的な新しいオープンソースモデルをリリースしました。サティア・ナデラCEOとチームによる主要な発表内容を分析し、新しいCoreAIプラットフォームとツール部門について掘り下げ、マイクロソフトのPhi-4モデルが完全オープンソース化されるというニュースについてお伝えします。
まず組織再編について話しましょう。マイクロソフトを長年追ってきた方なら、ここ数年AIへの転換を進めてきたことをご存知でしょう。2025年初頭、マイクロソフトの会長兼CEOであるサティア・ナデラは率直に述べました。私たちはAIプラットフォームのシフトにおける次の段階に入っており、すべてが光速で動き出すと。30年分のテクノロジーの変化がわずか3年に凝縮されるようなものだと。
つまり、2025年にはアプリケーションスタックのあらゆる層がAIの影響を受けることになります。新しいグラフィカルユーザーインターフェース、新しいインターネットサーバー、クラウドネイティブデータベースが一度に登場するようなものです。
このパラダイムシフトに対応するため、マイクロソフトは「CoreAIプラットフォームとツール」という新しいエンジニアリンググループを設立しました。このグループは、Visual StudioやGitHubなどを扱う開発者部門、Azure AIファウンドリーなどのAIプラットフォームチーム、そしてAIスーパーコンピュータプロジェクト、AIエージェントランタイム、エンジニアリングスライブと呼ばれるものに取り組むCTO室の特定のチームを統合します。
これらのチームを一つ屋根の下に集めることで、マイクロソフト自身と外部の顧客の両方が使用できる、エンドツーエンドのCopilotとAIスタックを構築できます。本質的には、記憶、権限、そして「アクションスペース」と呼ばれるものを持つエージェントアプリの創造について話しているのです。これらはすべて大規模なAIモデルによって動作します。
以前Metaでエンジニアリングのチーフを務めていたジェイ・パリクは、このCoreAIプラットフォームとツール部門の新しい副社長に就任しました。マイクロソフトが10月に彼を採用したことをご記憶かもしれませんが、これが入社後初の大きな仕事となります。
AIプラットフォームのトップであるエリック・ボイド、AIインフラストラクチャの副CTOであるジェイソン・テイラー、マイクロソフトの開発者部門のリーダーであるジュリア・リウソン、開発者インフラストラクチャを率いるティム・ボザースなどが、彼の下で報告を行うことになります。
この変更は、従来のコーディングツールを中心に回っていた開発者部門全体が、今やAIへと大きく舵を切ったことを示しています。実際、彼らのミッションの一部は、すでに開発者向けのAIアシスト製品として大きな成功を収めているGitHub Copilotを強化することです。
GitHub CopilotチームをメインのAIプラットフォームチームと統合することで、マイクロソフトはより緊密なフィードバックループを望んでいます。つまり、Copilotで機能している何かがあれば、そのインサイトを他のアプリケーション用のAIスタックにフィードバックできるということです。
サティア・ナデラはまた、Azureが今後AIのインフラストラクチャとなり、Azure AIファウンドリー、GitHub、VS Codeなど、その他すべてがその上に構築されることを強調しました。マイクロソフトの広範なビジョンは、すべてのSaaSアプリケーションの開発方法を変えるAIファーストのアプリスタックです。
エージェントのオーケストレーション用の新しいランタイム、再設計された管理レイヤー、AIとチャットのインタラクションを中心とした次世代のユーザーインターフェースが登場しています。開発者の生産性は全く異なるものになるでしょう。そのため、彼らはこれらすべての部門を一つの大きなAIの傘の下に統合することを選んだのです。
話題を変えて、マイクロソフトはPhi-4という強力な言語モデルをオープンソース化することでも話題を呼びました。先月初めて登場したときは、マイクロソフトのAzure AIファウンドリープラットフォームでのみ利用可能でしたが、今では完全なモデルの重みをすべてMITライセンスでHugging Faceに公開しました。
オープンソースAIを追っている人にとって、これは大きな出来事です。なぜなら、現存する大規模モデルの多くは完全にオープンではないか、制限的なライセンスが付いているからです。一方、Phi-4は完全に公開されており、多くのベンチマークで好成績を収めています。高度な数学やコーディングの分野では、より有名なモデルをも上回る性能を示しているとのことです。
Phi-4の特徴は何でしょうか？まず、140億のパラメータを持つモデルで、700億や1000億という巨大なモデルよりもはるかに小さいものです。9.8兆のトークンの精選された、そして合成データで訓練されました。マイクロソフトは、数学、MGSM、HumanEval、その他の高度な推論チャレンジなどのテストで最高レベルの結果を報告しています。
彼らは、Phi-4が大学院レベルのSTEM課題においてGPT-4oの変種であるGPT-4oを時として上回ると述べています。その要因の一つは、おそらくステップバイステップの問題をより確実に処理するための特別な数学トレーニングでしょう。また、コンテキストウィンドウを16,000トークンに拡張し、より長いテキスト入力や広範なコードファイル、研究論文などを扱えるようになりました。
Phi-4は密なデコーダーオンリートランスフォーマーですが、マイクロソフトはトレーニングデータのクリーニングと生成に多大な努力を払いました。合成データ生成と精選された有機データを使用し、教師あり微調整（SFT）、直接選好最適化（DPO）、ピボタルトークン検索と呼ばれる高度なポストトレーニング手法で仕上げています。
本質的には、解決策を成功させるか失敗させる特定のトークンを特定し、それらの重要な瞬間に適切なものを選ぶようモデルに教えています。
もう一つの大きな懸念は、モデルが事実を捏造する幻覚です。これに対処するため、マイクロソフトは拒否メカニズムを組み込みました。モデルが回答に確信が持てない場合、推測するのではなく控えめになります。Simple QAと呼ばれるデータセット（難解なトリビアのようなもの）でテストした結果、この新しいアプローチにより、ランダムな誤情報ではなく「わかりません」という応答が増えました。
Google、Meta、Anthropicなどの有名なモデルとの比較は避けられません。140億パラメータは確かに小さいですが、マイクロソフトによれば、Phi-4はコーディングや高度な数学などの特定の分野では、より大きなモデルと互角に戦えるか、時にはそれらを上回る性能を発揮できるとのことです。
サイズが小さいことは、大規模なGPUファームを持っていない場合には大きな利点となります。また、Phi-4はMITライセンスの下で完全にオープンソース化されているため、ライセンスの心配なく適応や微調整が可能です。
技術報告書の中で、マイクロソフトは2024年11月のAMCなどの新しい数学コンペティションでの優れた成績を挙げており、これは単に古いデータを暗記しているだけではないことを確認しています。また、HumanEval+などのコーディングタスクもテストしました。
開発者にとって、比較的コンパクトながら難しい問題を解決できる高速なモデルは非常に魅力的です。とはいえ、完璧ではありません。Phi-4は非常に詳細な指示や一般的でない事実については苦戦する可能性があります。
マイクロソフトは、繰り返されたレッドチーミングテストの後でも、バイアスや有害な出力のリスクが残存することを認めています。結局のところ、生成AIシステムに完全な保証はありません。
このリリースは、ジェイ・パリク率いる新しいCoreAIプラットフォームとツールグループの下でのマイクロソフトの広範なAIプッシュに関連しています。マイクロソフトは開発者ツールとAIインフラストラクチャを統合し、エンドツーエンドのCopilotとAIスタックを目指しています。Phi-4はその戦略の一部であり、完全にオープンな小規模だが強力なモデルです。
サティア・ナデラは、ユーザーから見てマイクロソフト内部の境界が消えることを望んでおり、すべてが「One Microsoft」の旗印の下で統合されることを目指しています。その考えは、エージェントAIアプリを、かつてVisual Studioを開くのと同じくらい日常的なものにすることです。
これが今回のストーリーです。マイクロソフトでのAIに焦点を当てた大規模な組織再編と、140億パラメータモデルであるPhi-4の主要なオープンソースリリースについて説明しました。Phi-4は現在、Hugging Faceで自由に探索することができます。試してみる場合は、特にリスクの高い用途については、その限界に注意を払う必要があります。もっとも、この注意は現代のあらゆるAIツールに当てはまりますが。
マイクロソフトでの開発チームとAIチームの統合がイノベーションを加速させると思いますか？トップレベルのモデルをオープンソース化することは、AIにとって最良の道筋なのでしょうか？あなたの考えを聞かせてください。このまとめが気に入った方は、AIが好きな人と共有してください。ご視聴ありがとうございました。また次回お会いしましょう。