
2,714 文字
オペレーターとエージェントの紹介|AGIに仕事を奪われたい

みなさん、OpenAIのオペレーター、そう、そのエージェントシステムが今日公開されました。どういった動きをするのか、どう機能するのか、主な特徴は何なのか、一緒に見ていきましょう。
まずは、チャンネル登録してくださった皆さん、いいねを押してくださった皆さん、そして特に、このAIチャンネルをスポンサーとしてサポートしてくださっているメンバーの皆さんに感謝申し上げます。
それでは、OpenAIのエージェントであるオペレーターについて話していきましょう。一体このエージェントとは何なのでしょうか。
基本的な考え方としては、あなたが人工知能に対して「ある日のある時間に、ある場所への航空券を購入して」と単純に伝えると、OpenAIのエージェントがそれを実行します。エージェントは自動的にブラウザにアクセスし、航空会社のウェブサイトに入り、検索して購入を行います。ログインや認証が必要な場合は確認を求め、あなたはただAIが全てを美しく実行するのを見ているだけでいいのです。
もしあなたがAnthropicのClaudeを見たことがあれば、とても似ていることに気づくでしょうが、いくつかの重要な違いがあり、確認する価値があります。
オペレーターにアクセスすると、まるでチャットのような感じで、やりたいことを伝えることができます。すでにOpenTable等のアプリケーションやAPIが接続されており、これらはオペレーター本来の機能として組み込まれています。デリバリーやショッピング、ダイニングなどを選択でき、選んだものに応じて特定の機能がすでに利用可能です。
でも、「APIがない場合は?ネイティブに設定する方法がない場合は?」と疑問に思うかもしれません。その場合は、手動で入力するか、オペレーター自身があなたの代わりにコンピューターを使用しているかのように、あなたが入力を指示したテキストや登録済みのテキストを使って入力フィールドを埋めていきます。
例えば、レストランの予約をする場合を見てみましょう。チャット内に小さなウィンドウが開きます。注目すべきは、これは私たちのコンピューターのブラウザではなく、OpenAI内部に組み込まれたブラウザを使用するということです。左側で各ステップが進行していき、場所の更新やサンフランシスコベイエリアの選択など、様々な操作が自動的に行われていきます。
興味深いのは、カスタム指示に登録された情報を使用していることです。例えば、サンフランシスコの郵便番号94110などの情報が登録されていれば、コンピューターの使用中にその情報を取得して活用できます。
これはAnthropicのClaudeとの重要な違いの一つです。Claudeでは自分のコンピューターとブラウザを使用できましたが、OpenAIはセキュリティの問題を認識し、異なるアプローチを取りました。ブラウザを内蔵し、チャットウィンドウと分離された形で動作させています。つまり、あなたのPCに保存されているパスワードやクレジットカード情報は見えず、この特定の内蔵コンピューター内で新たに設定する必要があります。
予約プロセスでは、チャットが時間を見つけ、予約を提案し、確認を求めます。残念ながら選択した時間が利用できない場合でも、チャットはすぐに代替の時間(例えば7時の代わりに6時か8時)を提案します。
重要なのは、チャットの作業を見守り続ける必要がないということです。別のタブを開いて後で戻り、進行状況を確認できます。質問がある場合は応答し、通常の作業に戻ることができます。
画像を使用した買い物の例も見てみましょう。買い物リストを提供し、設定済みのアプリを選択すると、チャットが同様のプロセスを実行します。ブラウザが開き、各ステップが表示されていきます。
興味深い機能として、「コントロールを取る」(Take Control)ボタンがあります。チャットが間違った操作をした場合、あなたが制御を引き継いで修正できます。ただし、チャットはあなたの操作を追跡せず、手動で変更を加えた後にコメントを送ることができます。通知しない場合でも、画面の変更を検出して自動的に更新します。
また、各ステップで実行された操作のスクリーンショットが保存され、タイムライン上で確認できます。これは誤操作や問題が発生した場合の確認に役立ちます。
セキュリティに関しては、3つのレベルで作業しています:
違法な商品の購入など、リスクのある作業の防止
誤った商品の購入や高額な購入時の確認など、エージェントとの不一致の防止
ウェブ上の詐欺や悪意のある行為からの保護
料金プランについて、現在はProバージョンでのみ利用可能で、さらにアメリカ合衆国限定です。ただし、近々世界中で利用可能になり、Plusアカウントでも使えるようになる予定です。ブラジルでProアカウントを持っていても、現時点では機能しません。
他のモデルとの比較でベンチマークを行った結果、良好なパフォーマンスを示しているようですが、ベンチマークについては常に慎重に判断する必要があります。
全体的な感想として、OpenAIが個人のコンピューターを直接制御させない予防措置を取ったのは注目に値します。これはAnthropicのClaudeとは異なるアプローチです。一部のユーザーにとっては制限的に感じられ、保存されたパスワードや頻繁にアクセスするサイトの使用が容易なClaudeを好むかもしれません。
一方で、プライベートな情報へのアクセスを制限したい場合は、これは利点となります。ただし、OpenAIがホストするサイトを使用する際のセキュリティ懸念も存在します。誰が監視しているのか、情報がどのように扱われているのか不明確です。
個人のコンピューターでの使用の方が制御しやすい面もありますが、一般ユーザーにとってはOpenAIのシステムの方が安全で管理しやすく、非重要なタスクには十分かもしれません。
このオペレーターを使ってみたいと思いましたか?私も試してみたいのですが、正直なところ、より基本的なPlusバージョンが利用可能になるまで待つつもりです。
OpenAIは通常、約束したことは多少遅れても実行します。今回も予告通り実装されました。次に期待されているのは2月のo3 Miniのリリースです。
このビデオについて、オペレーターを使ってみたい気持ちになったかどうかコメントしてください。チャンネルをサポートしたい方は、メンバーになることでWhatsAppグループへのアクセスや事前公開動画を視聴できます。
いいねもお願いします。ありがとうございました。
コメント