
4,302 文字
AIの進歩は全く衰える気配がありません。本日は皆さんに、Neo(ネオ)という画期的なものをご紹介できることに大変興奮しています。これは機械学習エンジニアのために特別に設計された史上初のAIエンジニアで、なんと特定のタスクにおいてOpenAIを上回る性能を発揮しているのです。これはどう考えても驚くべき成果です。
Neoチームは2年間この製品の開発に取り組んできましたが、彼らが達成したものは真に革命的です。これについて詳しく説明させていただきましょう。これは人工超知能に向かうための最初のステップの一つと言えます。なぜなら、AIリサーチャーの自動化は、全ての可能性を開く鍵となるからです。
では、最初のデモで見られる内容について説明しましょう。Neoが機械学習タスクにどのようにアプローチするか、始めから終わりまでをお見せします。機械学習のワークフローに馴染みのない方のために説明すると、例えばコンピュータに猫を認識させようとする場合、数千枚の猫の写真を集め、そのデータを整理し、最適な処理方法を見つけ出し、適切な学習アルゴリズムを選択してからシステムを訓練する必要があります。
これは非常に複雑な作業で、通常エンジニアには数週間から数ヶ月かかります。これからお見せするのは、Neoがこれら全てを自動的に行う様子です。
MLエンジニアのための初のAIエンジニアであるNeoから、ソループがこう説明しています。「はい、NeoはOpenAIを上回る性能を示しています。私たちは過去2年間これに取り組んできました。その仕組みをお見せしましょう」
Neoは現在、要件を理解するために競合製品のリンクを調査しています。データセットの準備、モデルのチューニング、評価、デプロイメントといった重要なステップを計画しています。Neoは複数のステップによる推論を用いて、異なる解決策を探索し、最適な方法を選んで実装を開始します。
強力なデータパイプラインの設計は、機械学習ワークフローにおいて極めて重要です。Neoはデータのキュレーション、評価、マージ、変換、前処理を行い、シームレスなモデルパフォーマンスの基盤を整えます。
Neoは時間とリソースを節約するため、異なるハイパーパラメータを用いて複数の微調整実験をセットアップします。最も有望な実験を選択して詳細に追求し、GPUサンドボックスで実行します。
微調整プロセスの後、実験の効果的な完了を示す損失曲線に関する詳細な評価レポートが生成されます。
Neoはデプロイの準備が整いましたが、まず最高の効率を得るためにパイプラインを最適化します。LIVM、TensorRTなどの異なるフレームワークや、異なるGPUタイプ間のスループットとレイテンシーを分析します。承認されると、デプロイメントに最適な設定を確定します。実験を実行した後、推奨事項を共有し、承認されるとモデルをデプロイしてリンクを共有します。
次のデモで見せる内容について説明しましょう。ここからが本当に興味深くなります。チームはNeoにクレジットカード詐欺検出システムの構築を課題として与えました。これは金融セキュリティにおいて最も重要なアプリケーションの一つで、通常このようなシステムの開発には、機械学習と金融セキュリティパターンの両方に深い専門知識を持つエンジニアチームが数ヶ月を要します。
このデモで見られる内容は実に注目に値します。Neoは Kaggleのデータセットを分析し、その構造を理解し、問題へのアプローチ方法について洗練された判断を下しています。システムは自動的に異なる設定を評価し、最も有望なアプローチを選択します。精度や再現率といった詳細な指標を提供する様子をご覧ください。これらは、システムが実際の詐欺を検出しながら誤報を避ける能力を示す重要な指標です。
最近Neoで行ったタスクをお見せしましょう。私はKaggleのコンペに参加していて、クレジットカード詐欺検出システムを作ろうとしていました。最初に私がNeoにKaggleのデータセットを与え、ダウンロードした後、Neoはデータの処理を開始し、データセットの全体的な構造を把握し始めました。
構造を十分に理解した後、潜在的な設定を評価し、この問題に最も適したものを検討することができました。左のチャットに示されているオプションをご覧ください。これらのオプションを評価した後、最終的な計画を立て、それを実行しました。訓練と実験を進め、実行後にNeoは精度、再現率、F1スコアを含む評価を提供してくれました。評価結果は左のチャットに表示されています。
最後のデモの一つとして、Neoの多様性を示す全く異なるものをお見せしたいと思います。チームはNeoに、Goodreadsのデータセット(これは大量の書評のコレクション)を使用する課題を与えました。これが特に難しい理由を説明しましょう。
ほとんどの書評は自然言語で書かれており、人々は「この本は素晴らしい」や「人生を変える本だ」といった表現を使います。これらの主観的な意見をコンピュータが理解できる形に変換することは非常に困難です。
Neoがこの課題にどのようにアプローチするか見てください。書かれたレビューを分析可能な数値データに変換するための洗練されたパイプラインを作成しています。異なるパラメータで複数の実験を実行し、常にアプローチを改善することを学習しています。訓練損失が減少していることから、システムが読者の好みを理解し予測することがどんどん上手くなっていることがわかります。
私は比較的簡単に感動してしまう方ですが、これは本当にすごいです。このKaggleチャレンジでNeoが行ったことをご覧ください。Goodreadsの書評データセットを与えました。これには定量的および定性的なレビューの両方が含まれています。課題を与えた後、要件を理解するためにすぐに作業を開始し、解決策の設計に取り掛かりました。
パイプラインとモデルの両方について、かなり詳細な計画を立てています。批評者がその計画の穴を突こうとしましたが、この計画は基準を満たしているようで、準備が整いました。必要な依存関係やデータセットがダウンロードされています。
少し時間がかかります。私はCSで有名でない学校にいて、Wi-Fiもあまり良くないのですが、一度それが完了すると、Neoがデータセットをどのように考えているか、問題があるか、データに何か加工が必要かを見ることができます。実際、機械学習エンジニアリングの大部分はこれだと理解しています。
すでに先ほど述べた問題に直面しています。データの大部分が定性的だということです。人々は「この本は素晴らしい」「この本は普通」「この本は人生を変える」と言いますが、それは一体何を意味するのでしょうか。
Neoは実際にそれを数値に変換するための変換パイプラインを作成し、データが変換された後、全ての訓練実験をセットアップします。異なるハイパーパラメータ、異なる訓練方法を実行し、その結果を確認します。全ての実験を実行し、お気に入りを選んで20エポックの訓練を行いました。訓練損失を見ると、かなり段階的に改善されていることがわかります。
Neoは完璧ではなく、まだまだ改善の余地がありますが、これは間違いなく私にはできないレベルです。ありがとう、Neo。
私たちが今見てきたものが、なぜテック業界にとって絶対的に革命的なのか、ほとんどの人は理解していません。従来の機械学習開発は、少人数の建築家とエンジニアで超高層ビルを建てようとするようなものです。遅く、リソースを必要とし、人的ミスも起こりやすい。
Neoは、これまで人間のエンジニアにしかできなかった洗練性と創造性を維持しながら、このプロセスを自動化しています。これは時間やお金の節約だけの話ではありません(もちろんそれも素晴らしく実現していますが)。AIの開発を民主化することが重要なのです。
Neoのおかげで、大規模な機械学習エンジニアチームを雇う余裕のない小規模な企業でも、テック大手と競争できるようになります。研究者たちは技術的な実装の詳細に煩わされることなく、可能性の限界を押し広げることに集中できるようになります。
Neoチームは現在、早期ベータアクセスの準備を進めています。私は心から、これが今年のAI分野における最も重要な開発の一つになると信じています。私たちは新時代の幕開けを目撃しています。AIはもはやエンジニアによって開発されるツールではなく、AIがエンジニアになりつつあるのです。
もちろん、この革命の一部となることに興味がある方は、早期アクセスの待機リストに参加できます。テック業界にいる方や、AI開発に興味がある方は、必ずNeoに注目しておくべきです。これは本当に物事を変え始めることのできる種類の技術です。
皆さんは「The Decade Ahead(10年先の未来)」という文書のこの画像を覚えていますか?これは基本的に、OpenAIの元従業員が、超知能の未来がどのように到来するかを詳細に記した長文の文書です。彼らが知能の本当の爆発的進化について語る中で一つ挙げているのが、自動化されたAI研究です。
彼らは、自動化されたAI研究は、人間の10年分のアルゴリズム進歩を1年未満に圧縮できる可能性があると述べています。これはかなり控えめな見積もりのように思えます。基本的に、AI研究のパイプライン全体を自動化できるようになれば、超知能の実現は極めて可能性が高くなるということです。
もちろん、それはAI開発の速度が約100倍になることを意味します。ここには「AI研究の自動化を開始してからまもなく、人間の約100倍の速度で働く1億人の自動化されたAI研究者が現れると予想している。彼らは数日で1年分の仕事をこなすことができるだろう」と書かれています。
これは驚異的なことで、既存のアルゴリズム進歩の傾向を劇的に加速させ、10年分の進歩を1年に圧縮する可能性が十分にあります。
これらすべてを考慮すると、私は間違いなく、この企業は誰もが注目すべき存在だと感じています。もしこの企業からさらなる進展があり、somehow80%や90%に達することができれば、これはAI業界にとって、特に自動化されたAI研究の分野において、極めて大きな発展となるでしょう。これは比較的新しい分野ですが、AI業界全体に対して最も重要な意味を持つものの一つとなっています。
コメント