オペレーターのデモンストレーション

1,203 文字
オペレーターとエージェントの紹介|AGIに仕事を奪われたい

Demonstrating Operator

私はOpenAIのオペレーター研究チームのリードを務めています。オペレーターとは何か?オペレーターはブラウザを使用してユーザーを支援するエージェントの研究プレビューです。私には2歳の子供がいて、パスタが大好きなんです。そこでアサリのリングイーネを作ろうと思い、食材を買うように依頼しました。インスタカートのアプリを使用します。
オペレーターは実際には、特別な最適化なしであらゆるウェブサイトを使用できます。このアプリを使用している理由は、人間が利用できるチュートリアルのように、このウェブサイトの詳細な使用方法の説明を提供しているからです。
インスタカートのタブを使用して、次のようなタスクを依頼します。「Allrecipesウェブサイトからアサリのリングイーネのレシピを探し、全ての材料を食料品カートまたはインスタカートに追加してください。バター、植物油、黒コショウはすでに持っているので、カートに追加する必要はありません。」
オペレーターはレシピを見つけ、その材料をすべてカートに追加すると言っています。カートに追加する前に材料とお店を私と確認すると言っています。では、レシピ探しから始めましょう。これからは私は何もせず、オペレーターが作業するのを見ているだけです。
オペレーターの興味深い点は、人間向けに作られたブラウザを使用していることです。私が今見ているのと全く同じ画面を見て、キーボード入力やマウスクリックでブラウザを操作しています。
まるで人間のように操作します。これは、プログラマーは理解できるかもしれませんが、プログラマーでないユーザーには理解が難しいAPIやプログラミングベースのインターフェースを使用する他のエージェントとは異なります。オペレーターは、この自然な人間のインターフェースを使用しているため、画面上で何をしているのかを見るだけで非常に分かりやすいのです。
進行状況は分かりますか?はい!進行状況を追跡する一つの方法は、画面を拡大して見ることです。オペレーターはテキストベースの思考連鎖推論によって動作しています。作業を行う際には、どのように物事を進めるかの計画を立てて説明します。
このタスクリストで進行状況を追跡できます。レシピが見つかったと言っています。どの店を使用したいですか?と聞かれたので、Gus’sを使うように伝えました。このように、タスク解決の過程で必要に応じて明確化のための質問をします。
オペレーターがログインや購入など、慎重な操作を行う必要がある場合があります。このような状況でも安全に動作するように設計されています。オペレーターは、ログインや確認が必要な時には、私たちに制御を委ねるように設計されています。
リストが正しいかどうかを私自身で確認できるように、制御権を与えてくれます。素晴らしいですね。デモンストレーションをありがとうございます。ありがとうございました。

コメント

タイトルとURLをコピーしました