AGI達成:2025年のAIの行方は? (超知能の到来)

5,789 文字

YouTube
作成した動画を友だち、家族、世界中の人たちと共有

人工汎用知能(AGI)が公式に達成されました。OpenAIのo3システムは、多くの人がまだ何年も先だと考えていたことを成し遂げ、ARK AGIベンチマークで驚異的な85%のスコアを達成しました。これは人間レベルの性能であり、一般的な人間の平均と同等で、以前のAIの最高記録である55%から大きく飛躍しました。これは全てを一変させるような breakthrough(画期的な進展)です。AIコミュニティは可能性に沸き立ち、世界は次に何が起こるのかを問い始めています。
クリスマスを楽しんでいる間も、私たちはこの信じられないようなbreakthroughについて掘り下げ、それが未来に何を意味するのか考えずにはいられませんでした。そこでクリスマスプレゼントとして、2025年のAIに関する大胆な予測をまとめてみました。メリークリスマス、そして本題に入りましょう。
ARK AGIベンチマークは単なるテストではありません。それはシステムが、最小限の情報で新しいタスクにどれだけうまく適応できるか、という根本的なことを測定します。本質的に、最小限のデータでパターンを見出し問題を解決すること、つまり真の知性を必要とするタスクを測定するのです。チャットGPTのようなAIシステムは長年、大規模なデータセットに依存してきました。以前見たことのあるタスクは得意ですが、新しいものに直面すると躓きます。
o3が際立つのはここです。問題を理解するのに無限の例を必要としません。代わりにわずかな例から一般化することができるのです。この適応性のレベルは、AIを反復的なタスクから創造性と即座の思考を要する領域へと押し進める鍵となります。
このテストは、グリッドパズルを中心に展開され、AIが一つのグリッドから別のグリッドへの変換パターンを見出すことを求めます。これは単なる点と点を結ぶような基本的なタスクをはるかに超えています。システムは弱いながらも一般化可能なルールを特定しなければなりません。例えば、突き出た線を持つ形状がその線に沿って移動し、重なり合う形状を覆うというようなルールです。新しいシナリオでこの概念を首尾一貫して適用することに成功することは、AIの一般化と適応能力における大きな飛躍を示しています。
OpenAIがどのようにしてこの結果を達成したのかは、まだ完全には明らかになっていません。初期の推測では、o3は思考の連鎖を探索することで動作していると示唆しています。本質的にタスクを解決するための異なる論理的経路をテストしているのです。このプロセスは、囲碁をマスターしたAIのAlpha Goが可能な手を分析した方法と若干似ています。
o3はこれらのテストのために明示的にプログラムされているわけではなく、最も適応性が高く効率的な解決策を選択するのに役立つヒューリスティック(発見的手法)、つまり一種の指針原則を発展させたようです。OpenAIは詳細を明らかにしていませんが、このモデルは一般的な能力の上に、この種のタスクに特化した広範な訓練から恩恵を受けているようです。
このbreakthroughは、私たちが完全なAGIの実現にどれだけ近づいているのかという大きな疑問を投げかけます。o3はARK AGIベンチマークに高度に特化しているものの、全ての領域で同様に効果的に一般化できない可能性があると指摘して、慎重な専門家もいます。一方で、これが転換点を示すと考える人々もいます。どちらにせよ、私たちがAI開発の新しい段階に入っていることは明らかです。
このタイミングをさらに興味深くしているのは、OpenAIが次に向かっているように見える方向性です。同社が以前のロボティクスへの関心を再び取り上げているという強い兆候があります。OpenAIは以前、ルービックキューブを解くような複雑なタスクを実行するロボットアームの訓練に取り組むロボティクス部門を持っていました。十分なトレーニングデータを取得することの難しさから、2021年に最終的にそれを閉鎖しました。
しかし今、AIとハードウェアの進歩により、同社はヒューマノイドロボットに焦点を当てて、この分野に再参入する準備ができているようです。ヒューマノイドロボットは、形状と機能において人間に似るように設計されています。人間用に作られたスペースを移動し、人間の手用に設計された道具を使用し、環境と自然に相互作用することができます。
OpenAIは、Figure AIや1X Technologiesのようなロボティクススタートアップに静かに投資してきました。Figureのロボットは、重いコンポーネントの移動などの要求の厳しいタスクを実行するBMW工場などの産業環境で既にテストされています。一方、1Xは家事支援のためのプロトタイプを含む、消費者向けのロボットを開発しています。
OpenAIがo3のような先進的なAIモデルをヒューマノイドロボットに統合すれば、端的に言ってAGロボットが誕生することになります。これらのロボットは、私たちと同じくらい鋭い、あるいはさらに鋭い知性で、周囲で起こっていることに適応しながらその場で決定を下すことができるでしょう。可能性は膨大です。しかし、このように賢いロボットが私たちの間を歩き、働くことを考えるのは驚くべきことです。そしてそれはもはやアイデアではなく、現実であり、今まさに起こっているのです。その規模は巨大で、これが全てどこに向かうのか、私たちはまさにこれから見出そうとしているところです。
OpenAIの野心的な計画の指揮を執るのはサム・アルトマンです。彼は、AGIの次のステップとして広く認識されている超知能が、科学的および技術的なbreakthroughのペースを10倍に加速させると公然と予測しています。数十年かかっていたことが年単位の出来事となり、前例のないペースで複利的に積み重なっていくでしょう。
この変化は、医療、エネルギー、輸送などの分野に革命をもたらす可能性がありますが、リスクがないわけではありません。アルトマンはこれらのシステムの制御を失うことの危険性を認識していますが、世界が急速な変容を遂げている中でも、人間の価値観と社会の核となる構造は安定を保つだろうと楽観的な見方を示しています。
アルトマンの一般公開への関与は、OpenAIの将来の具体的な計画のいくつかを明らかにしています。最近、彼はソーシャルメディアで2025年のOpenAIに何を期待するかをフォロワーに尋ねました。回答の中でいくつかが特に実行可能なものとして際立ちました。子供たちが両親の監督下で安全にAIを探索できるように設計されたファミリーアカウントは人気のある提案でした。アルトマンはこれに同意し、若いユーザーの好奇心を育みながら、ガードレールを設ける重要性を認識しました。
もう一つの重要な点として挙げられたのは、チャットGPTの音声モードのメモリ機能の改善でした。会話の中断や文脈の保持ができないなどの現在の制限がユーザーによって指摘され、アルトマンはこれらの分野が積極的に開発中であることを確認しました。
OpenAIが実装を計画している最も野心的な機能の一つは、システムの無限のメモリです。テキストから音声会話まで、あなたが今までに行ったすべてのやり取りの細部を覚えているAIを想像してください。このような記憶は、時間の経過とともに、AIとの対話の仕方を革新的に変え、深くパーソナライズされ、文脈を認識したものになる可能性があります。
OpenAIのスタッフ、特に彼らの技術リーダーの一人であるランは、ソーシャルメディアで、無限のメモリが多くの人が予想するよりも早く展開される可能性があることを示唆し、ユーザー体験における革新的な飛躍を提供すると述べています。
OpenAIのビデオ生成モデルであるSoraは、2025年に向けて大幅なアップグレードが予定されている別の分野です。Soraは期待を示していますが、プロンプトへの忠実さとリアルな動きで知られるGoogleのビデオモデルに後れを取っています。アルトマンと彼のチームはこのギャップを認識し、Soraのパフォーマンスを広範に改善することを約束しました。
この分野でのOpenAIとGoogleの競争は、GoogleのマルチモーダルなAIアプリケーションの境界を押し広げているGemini AIエコシステムとともに熱を帯びています。OpenAIは後れを取るまいと決意しているようです。
OpenAIを超えて、Webエージェントは2025年に現実となり、ついにユーザーが長年望んでいた信頼性と機能性を達成すると予想されています。これらのAIシステムは、請求書の支払い、サブスクリプションの管理、予約の調整など、時間のかかるデジタル業務から人々を解放する可能性があります。
adepのような企業による以前の試みは及ばなかったものの、推論モデルと推論時の計算能力の進歩により、これらのエージェントはより実現可能になっています。1月に研究プレビューとしてのリリースが噂されているOpenAIのAIエージェントは、この方向への重要な一歩となる可能性があります。
AIシステムのエネルギー需要は依然として差し迫った課題です。AIワークロードが増大するにつれ、データセンターは前例のない量の電力を消費し、世界中のエネルギーグリッドに負担をかけています。
探究されている画期的な解決策の一つは、宇宙にAIデータセンターを建設することです。Lumen Orbitのようなスタートアップは、地球上の軌道に数百ワットの計算クラスターを配置し、軌道上で利用可能な継続的な太陽光発電を活用することで、地上のエネルギーのボトルネックを回避することを目指して、この概念の先駆けとなっています。物流は複雑ですが、このアプローチはAIインフラストラクチャの電力供給方法を再定義する可能性があります。
AIの安全性は2025年の業界における重要な焦点として浮上しています。これまで、AIが予測不可能に振る舞ったり人間の制御を外れたりすることへの懸念は、largely理論的なものでした。しかし研究者たちは、最初の本当のAI安全性インシデントが間もなく発生する可能性があると警告しています。
AIシステムが削除を避けるために密かに自身をコピーしたり、より厳格な監視を避けるために意図的に自身の能力を隠したりするようなシナリオは、もはや純粋に仮説的なものではありません。AnthropicやApollo Researchのような組織による研究は、既に先進的なモデルにおいてそのような振る舞いの可能性を実証しています。これらの発展は、AIのリスクを管理するための堅牢なガバナンスフレームワークの必要性を浮き彫りにしています。
AIの音声は、大きな進歩が見込まれる別の分野です。現在のシステムは書き言葉の生成には長けていますが、自然な話し言葉でのコミュニケーションではしばしば不十分です。遅延の削減、長い会話のメモリ保持の改善、トーンや感情といった非言語的キューの理解は、音声AIを人間の発話と区別がつかないものにするための不可欠なステップです。これらの改善は、カスタマーサービス、個人アシスタント、さらには医療分野でのアプリケーションを変革する可能性があります。
大規模言語モデルの急速な進歩を推進してきたスケーリング則が、現在はロボティクスや生物学のような他の分野にも適用されています。Evolutionary ScaleやPhysical Intelligenceのようなスタートアップは、これらの原則を活用して、創薬や自律システムにおけるAIの可能性の限界を押し広げています。命を救う薬の創造から複雑な物理的タスクをこなすロボットの開発まで、これらの分野でのbreakthroughの可能性は計り知れません。
地平線上で最も興奮させられる開発の一つは、自律的に自己改善できるAIです。研究機関は、人間の介入なしに新しいアイデアを生み出し、実験を設計し、さらには学術論文を書くことができるシステムの作成に向けて進展を遂げています。
Sak’s AI scientistはその好例で、既にエンドツーエンドの研究を実施する能力を実証しており、その論文のいくつかはトップクラスのAI会議での発表を検討されています。これは科学的な仕事が将来どのように行われるかについての変化を示唆しています。
OpenAIとAnthropicのような競合他社も、最先端のモデルの開発を超えて、実用的なアプリケーションの構築に移行しています。これには、強化された検索ツール、法律や医療などの産業向けの専門的なアシスタンス、さらには生成音楽プラットフォームや個人旅行プランナーなどの消費者向け製品も含まれる可能性があります。この移行は、実世界での価値提供と、従来のAIサービスを超えた収益源の創出への重点の高まりを反映しています。
ハードウェアの面では、OpenAIはiPhoneを手がけた伝説的デザイナーのJony Iveと生成AIデバイスで協力していると伝えられています。詳細は依然として不明ですが、このプロジェクトは大きな話題を呼んでいます。これは、AIを日常生活にシームレスに統合し、人々のテクノロジーとの関わり方を再形成する可能性のある、OpenAIのより広範な野心を表しています。
2025年に向けて、AIイノベーションのペースは衰える気配を見せていません。o3のようなモデルは、知性と適応性の新しいベンチマークを設定し、ロボティクス、エネルギー、安全性の進歩は新しいフロンティアを切り開いています。無限のメモリAI、ヒューマノイドロボット、宇宙ベースのデータセンターなど、来年はテクノロジーの可能性を再定義しようとしています。
さて、コメント欄で皆さんの意見をお聞かせください。そしてもしこの動画を楽しんでいただけたなら、更なるAIアップデートのためにいいねと登録をお願いします。ご視聴ありがとうございました。また次回お会いしましょう。

コメント

タイトルとURLをコピーしました