
9,385 文字
はい、メールを開いて返信してもらいましょう。あら、まあ。実際に一つ一つのメールをクリックして返信してますわ。しかも予定を確認するためにGoogleカレンダーまでチェックしてくれてる。これはすごいですね。
ほな、こんなんはどうでしょう。Xに行って機械学習に関する最初の5件の投稿にいいねとコメントを付けてもらう…おお、まじで実行してますわ。機械学習の投稿を検索して、最初の5件にいいねとコメントを付けてくれてます。
次はこれを試してみましょう。Uber Eatsで一番近いピザを注文して…おお、ほんまにUberに行って、レストランとピザを選んで、決済まで進めてくれてますわ。これはめっちゃすごいですね。
もっと難しいことも試してみましょう。3つの大学のメールアドレスを見つけて、ウェブサイト開発サービスについての営業メールを送ってもらう…ウィキペディアから情報を収集して、それぞれの大学のウェブサイトに行って、実際にメールアドレスを抽出して、そしてGmailに行って実際に営業メールを書いて送ってくれてます。これはもう完全に営業やアウトリーチの仕事を自動化できますね。
みなさん、ついに本当に動くAIエージェントが登場しましたわ。このエージェントは自律的に食事を注文したり、メールに返信したり、SNSへの投稿やエンゲージメント、さらには営業やアウトリーチまでこなしてくれます。これで時間を大幅に節約でき、生産性も大きく向上しますね。
でも、このエージェントについて詳しく説明する前に、まず背景をお話ししましょう。この1年ほど、実際に動くAIエージェントを探し続けてきました。ニュースレターを書いたり、SNSに投稿したり、YouTubeの台本作成を手伝ってもらったりと、AIに自動化してほしいことがたくさんあったんです。
でも、これらのタスクを上手くこなせる特定のエージェントには出会えませんでした。エラーを起こさずにちゃんと動くものがなかったんです。Auto GPT、autogen、baby AGI、multi-on、Smith OS、さらにはClaudeの最近のコンピュータ使用エージェントまで、ほぼ全部試してみました。
でも、これらは全て、セットアップが非常に複雑で全て自分でコーディングする必要があったか、あるいはよく無限ループに陥ってワークフローが先に進まなくなってしまいました。だから今まで、実世界のタスクを本当に上手くこなせるAIエージェントには出会えてませんでした。
数週間前、TwitterかXで「Do Browser」というエージェントの話を聞きました。そのデモ映像はかなり印象的でした。そこで開発者に連絡を取って、準備が整い次第早期アクセスをお願いしました。そして今週ついにアクセス権を得られたんです。
このツールは「Do Browser」と呼ばれています。なお、この動画はスポンサー付きではありません。完全に自主的なもので、もしこのツールがダメだったら全力で批判するつもりです。この動画では実際のタスクでこれをテストして、このAIエージェントの良し悪しをお見せしたいと思います。少なくとも私にとっては、その結果はかなり衝撃的でしたね。
現在これはChromeの拡張機能として利用可能です。説明欄にリンクを貼っておきますが、非常にシンプルです。GitHubリポジトリをクローンする必要もなければ、コードを全く触る必要もありません。「Chromeに追加」をクリックするだけでいいんです。
やってみましょう。「拡張機能を追加」をクリックします。すると「Do Browserがインストールされました」と表示されるはずです。Do Browserを使うには、Chromeウィンドウの右上にあるDo Browserアイコンをクリックするだけです。するとこのチャットインターフェースが開きます。
アイコンが見当たらない場合は、おそらくピン留めされていないからです。その場合は、この拡張機能アイコンをクリックして、Do Browserをクリックすれば、このインターフェースが表示されるはずです。
Do Browserを使うもう一つの方法は、ここの検索バーに「do」と入力して、スペースを押すことです。そうすると、Do Browserを使用することになり、その後に入力するプロンプトは全て、ChromeウィンドウでDo Browserにアクションを実行させるためのものとなります。
これを初めて開く場合は、「続行するにはサインインしてください」というメッセージが表示されます。私は早期アクセス権を得ているので、メールアドレスでサインインして使用できますが、この録画時点では一般の方も同じようにできるかどうかはわかりません。一般公開された時点でお知らせしますね。
とりあえず「サインイン」をクリックして、Gmailアカウントでサインインすると、これが表示されるはずです。まずは、受信トレイの未返信メールへの返信を手伝ってもらえるか見てみましょう。
プロンプトとして「Gmailに行って最新の3件のメールに返信してください。自分の判断で自動的に返信してください。フィードバックは不要です。予定について聞かれた場合は、Googleカレンダーを確認して答えてください」と入力してみましょう。
エンターを押して、これがうまくいくか見てみましょう。まずGmailに行き、最初のメールを開いていますね。このメールはAIツールについて尋ねているものです。返信をクリックして、今返信を入力しています。
実際、これはめっちゃ早いですね。このメールを開いてから2秒程度で送信までしてしまいました。もう次のメールに進んでいて、今度はGoogleカレンダーを開いて予定を確認しています。
見ての通り、2秒程度で次のメールを開いて、読んで、返信を書いて、送信までしています。これはめっちゃ速いですね。実際、あまりにも速すぎて、全てのステップを声で説明する時間もないくらいです。
なので、これを実行させて、全ての返信が終わったら、それぞれのメールを開いて、どんな返信をしたのか見てみましょう。なお、これは等倍速です。早送りはしていません。
はい、完了しました。下の方に「Gmailの受信トレイにある3件の最新メールに返信しました。他に何かお手伝いできることはありますか?」と表示されています。
受信トレイを開いてみましょう。見ての通り、これらは全て未読でした。また、このGoogleカレンダーも開いていませんでした。最初のメールをクリックしてみましょう。
最初のメールは「こんにちは、AI検索さん。研究用のAIツールについて何かおすすめはありますか?フィードバックをいただけると嬉しいです」というものでした。
AIエージェントは次のように返信しています:
「こんにちは、テレンさん。ご連絡ありがとうございます。研究に適したAIツールをいくつかご紹介させていただきます:
ChatGPT: ブレインストーミングやアイデア創出に最適
Zotero: 研究文献管理のための強力なツール
Semantic Scholar: 学術論文や関連研究の検索に役立ちます
Notion AI: 研究ノートの整理や内容の要約に便利です
他にお手伝いできることがありましたら、お気軽にお申し付けください」
完璧ですね。メールの内容を完全に理解し、包括的な返信を生成して送信しました。
戻って2通目のメールを見てみましょう。これは「こんにちは、AI検索さん。ビジネスについてお話しできる時間があればと思います。都合の良い時間を教えていただけますでしょうか」というものです。
実行時に見たように、Googleカレンダーを開いて予定を確認していましたね。ここに2つの予定がブロックされていて、5時から7時までと午前9時から11時までです。そこで、11時以降なら空いているということを理解して、そのように返信しています:
「こんにちは、テレンさん。ご連絡ありがとうございます。本日11時以降であれば、お話しさせていただけます。ご都合はいかがでしょうか?もし別の時間がご希望でしたら、お申し付けください。ご返信をお待ちしております」
完璧です。そして最後に3通目のメールを見てみましょう。このメールでは、テレンさんが次のように書いています:
「こんにちは、AI検索さん。マーケティング戦略について考えていて、アイデアを共有させていただきたいと思います。ターゲット層との関係をもっと深められるのではないかと考えており、SNSのプレゼンスを改善する方法を検討しています。
以下が私の戦略案です:
Instagramや、TikTok、Xで週2回投稿
全てのプラットフォームで週100件以上の投稿にいいね・コメントするようアシスタントに依頼
SNSでのプロモーション用にスポンサーとプレゼント企画について協議
これについてご意見をいただけますでしょうか?アイデアをお聞かせください」
AIは次のように返信しています:
「こんにちは、テレンさん。マーケティング戦略案をご共有いただき、ありがとうございます。素晴らしいスタートだと思います。さらにいくつかの提案をさせていただきます:
あなたの分野のインフルエンサーと協力して、リーチを拡大
アナリティクスツールを使用してエンゲージメントを追跡し、パフォーマンスに基づいて戦略を調整
リール、ストーリー、ライブセッションなど、様々なタイプのコンテンツを試して、何が反響を呼ぶか確認
より広い層にリーチするために、ターゲット広告の実施を検討
これらの提案についてのご意見や、さらなる議論をご希望でしたら、お気軽にお申し付けください」
完璧ですね。メッセージを理解し、テレンさんの意見に賛同しただけでなく、さらなるフィードバックも提供しています。
このAIエージェントがあれば、すぐに受信トレイの管理にアシスタントは必要なくなるでしょう。AIの方が遥かに安価で速いですからね。
現時点でこのAIは完璧ではありませんが、生産性を向上させ、多くの時間を節約するのに役立ちます。些細なメールは全て一つのフォルダにまとめて、このAIにそのフォルダ内の全てのメールへの返信を任せることができます。
ただし、重要な判断や多額の金銭、重大なリスクが絡むような重要なメールについては、もちろんAIに返信を任せるべきではありません。でも、それ以外のメールなら、このAIはかなりスムーズに対応できますね。
次は、Uberで食事を注文できるか試してみましょう。再びDo Browserのチャットインターフェースを開いて、プロンプトとして「Uber Eatsからピザを注文して。30ドル以下の一番近いものを選んでください。フィードバックは不要です。自分の判断で決めてください」と入力してみます。
エンターを押して、これがうまくいくか見てみましょう。まずUber Eatsのサイトに行きます。なお、私はすでにUber Eatsアカウントにログインしていて、住所も登録済みです。上の検索バーでピザを検索していますね。
次に「Pizza Garden」という1.9km離れた店を選んでいます。次にネオポリタンピザを追加しました。18ドルなので30ドル以下です。今は実際に決済に進もうとしています。支払いをクリックするか見てみましょう。はい、クリックしました。
ここで注意が必要です。支払い方法を登録済みの状態で、このAIエージェントにUberやAmazonで注文させると、実際に購入まで進めてしまいます。私は意図的に支払い方法を削除していたので、「支払い方法を追加してください」で止まりましたが、これは完全にUber Eatsで食事を注文する手助けができることを示しています。
あなたの基準に基づいてレストランを検索し、適切な商品を選び、決済まで進めてお支払いすることができます。
それでは、別のタスクを試してみましょう。私の代わりにXやTwitterで「いいね」やコメントができるか確認してみましょう。プロンプトはこうです:「Xに行って、機械学習に関する人気の投稿を見つけて、最初の5件の投稿にいいねとコメントをしてください」
エンターを押して、できるか見てみましょう。まずXに行って、「探索」をクリックし、上の検索バーに「machine learning」と入力しています。
最初の投稿にすでにいいねを付けて、投稿を開いてリプライを追加しました。次の投稿に移っていますね。この投稿にもいいねを付けて、リプライをクリックして返信を追加しています。
これめっちゃ速いですね。一つ一つのステップを説明する時間もないくらいです。もう3つ目の投稿まで来ていて、リプライ用のポップアップを開いて返信を入力しています。また投稿に進んで、いいねを付けて、ポップアップを開いて1秒程度でコメントを追加して投稿しています。
4つ目が完了して、5つ目の投稿に移っています。これにもいいねを付けて、リプライウィンドウをクリックしてリプライを追加し、投稿をクリックしました。
完了したら、チャットウィンドウに「5つ目の投稿へのコメントが投稿されました。要求された通り、機械学習に関する最初の5件の投稿にいいねとコメントを付けました」と表示されています。
上に戻って、本当に最初の5件の投稿にいいねとコメントを付けたか確認してみましょう。これが最初の投稿です。確かにいいねを付けていて、エージェントがコメントも追加していますね。
戻って2つ目の投稿を見ると、これにもいいねを付けていて、エージェントがコメントも追加しています。3つ目の投稿も同様で、いいねを付けていて、クリックすると私がコメントしていることがわかります。
戻って4つ目の投稿を見ると、これにもいいねとコメントを付けています。最後に5つ目の投稿も、エージェントがいいねとコメントを追加しています。
これはすごくないですか?ついにTwitterで自動的にいいねとコメントができるエージェントが登場したんです。
もっと難しいことも試してみましょう。あなたがウェブ開発者で、ウェブサイトを作るのが得意だとします。そして、大学のウェブサイト制作や既存サイトの改善を手伝うエージェンシーを立ち上げようとしているとしましょう。
手作業でこれらの大学を探して自分でコンタクトを取ることもできますが、このAIエージェントにプロセス全体とアウトリーチを自動化させてはどうでしょう?
試してみましょう。再びDo Browserのチャットインターフェースを開いて、プロンプトをこう入力します:「3つの大学を検索してください。カナダの大学をターゲットにするとして、サイトから連絡先メールアドレスを見つけて、Gmailを使って営業メールを送ってください。ビジネス向けのウェブサイト制作や既存サイトの改善のお手伝いができるか尋ねる営業メールを送ってください。メールには私のポートフォリオibuildwebsite.com(これは仮のものです)へのリンクを入れてください」
エンターを押して、どうなるか見てみましょう。最初にGoogleに行って「colleges in Canada」と検索しています。最初の結果であるウィキペディアのページに行き、Algonquin Collegeをクリックしました。
そこからウェブサイトを見つけて、メールアドレスを探しています。「お問い合わせ」セクションを探してページの一番下までスクロールしましたが、メールアドレスが見つからなかったので、検索ボックスに「contact email」と入力してメールアドレスを探しています。
最後に学長室のメールアドレス、president@algonquincollege.comを見つけました。このメールアドレスを保存して、ウィキペディアのページに戻って2つ目の大学を選びます。
Cambrian Collegeを選んで、メインウェブサイトを探しています。公式サイトのリンクをクリックして、Cambrian Collegeのメールアドレスをコピーするボタンを見つけました。これはめっちゃ速いですね。
Cambrian Collegeのメールアドレスをコピーした後、ウィキペディアのページで3つ目の大学、Canadore Collegeに移っています。メインウェブサイトのリンクをクリックしたら、なぜかGoogleに戻ってしまいました。
面白いことに、このエラーを認識して、これがCanadore Collegeのウェブサイトではないことを理解しています。そこで代わりにGoogleで「Canadore College official website」を検索して、Googleの最初の結果から公式ウェブサイトに入り、この大学の連絡先メールアドレスを見つけました。
今度はGmailを開いて、これらの大学それぞれに営業メールを書き始めています。宛先欄、件名、本文を入力しているのが見えますね。これはめっちゃ速いです。1-2秒で最初のメールを作成して送信してしまいました。
2通目のメールに進んでいて、これも同様にめっちゃ速いです。読み上げる時間もないくらいの速さです。全て終わるのを待って、それぞれのメールを開いて実際に何を送ったのか見てみましょう。
2通のメールをすでに送信していて、今Canadore Collegeに最後のメールを送っています。これもめっちゃ速いですね。
最後にチャットが終了し、右下に「それぞれの大学に3通全てのメールを送信しました」と表示され、3つの大学名が列挙されています。「他にお手伝いできることはありますか?」とも書かれています。
送信済みフォルダを見ると、確かに3通のメールが送信されています。一つずつ確認してみましょう。これはAlgonquin College宛てのもので、こう書かれています:
「お世話になります。私はSamと申します。企業や組織向けのウェブサイト制作・改善を専門としています。貴校のことを知り、オンラインプレゼンスの向上についてお手伝いできればと思いご連絡させていただきました。私のポートフォリオはibuildwebsite.comでご覧いただけます。ご興味がおありでしたら、どのようなお手伝いができるかについて詳しくご説明させていただければと思います。ご返信をお待ちしております」
完璧な営業メールですね。ウェブサイトの制作や改善のお手伝いができるか尋ねています。
戻って2通目のメールを見ると、最初のメールとほぼ同じ内容ですが、これはCambrian College宛てです。最後のメールも同様で、Canadore College宛てになっています。
これはすごくないですか?このAIエージェントは営業のあり方を変えると思います。見込み客の発掘や営業メールを送る営業担当者を雇う必要はもうありません。このAIに任せれば、営業メールを送るだけでなく、見込み客の発掘もできます。ターゲットとなるクライアントのメールアドレスを見つけて収集できるんです。これはすごいですね。
過去に他のAIエージェントもいくつか試しましたが、これほどスムーズにできたものはありませんでした。これは本当にゲームチェンジャーです。
次は、研究データの収集タスクを試してみましょう。再びDo Browserのタブを開いて、こんなプロンプトを試してみます:
2024年の機械学習に関する最近の研究論文を3つ特定する
これらの研究論文を新しいGoogleドキュメントに追加し、以下の情報を含める:タイトル、著者、出版日、ジャーナル名、要約
ここには複数のステップが含まれています。まず機械学習の最近の研究論文を3つ特定し、次に新しいGoogleドキュメントを開いて、これらの情報を全て生成してドキュメントに追加する必要があります。
できるか見てみましょう。送信ボタンを押すと、まずGoogleに行って「recent machine learning research papers 2024」と入力しています。最初の結果をクリックして、そこからさらに最初の結果をクリックしました。
今このページをスキャンして、その論文から情報を抽出しています。papers with codeの結果ページに戻って2つ目の結果をクリックし、2つ目の論文から情報を収集しています。
そして3つ目の論文に進んで、情報を集めた後、Googleドキュメントに移って新しいドキュメントを作成し、全ての情報を追加しています。
完了して「3つの最近の機械学習研究論文の詳細をGoogleドキュメントに追加しました」と表示されています。
ここにはいくつか問題があります。まず、papers with codeのサイトからジャーナル名を見つけることができませんでした。これは正確ですが、ジャーナル名が見つからない場合は他の場所を探してこの情報を補完してほしかったですね。
また、papers with codeのページに戻ると、論文をスキップしているようです。最初のDemo、次のMooncakeは正しく取得していますが、なぜかMossformerという論文をスキップして、代わりにAutoragのデータを抽出することにしました。
3つ目の論文はMossformerではなくAutoragになっています。このデモにはいくつか欠点がありますが、私が試した他のエージェントよりもはるかに堅牢です。
以上がDo Browserのレビューとチュートリアルですね。これは実際にかなり優秀で、私が試した他のどのエージェントよりもずっと良かったです。だからこそ、この完全な動画を作ることにしました。
タスクをプロンプトで指示するだけで実行してくれます。自分でエージェントのチームをコーディングする必要もなければ、GitHubからリポジトリをダウンロードやクローンしてたくさんのエラーに悩まされることもありません。これは本当にシンプルなChrome拡張機能です。
この動画では、SNSでのエンゲージメントや営業とアウトリーチ、データ収集と研究など、現実的なユースケースでテストしてみましたが、このエージェントはおそらく私が紹介した以上のことができるでしょう。
コメント欄で皆さんの意見を聞かせてください。これを使ってみたいと思いますか?そして使うとしたら、どんな用途に使いたいですか?
いつも通り、最新のAIニュースやツールを探して皆さんと共有していきますので、この動画が良かったと思われた方は、いいね、シェア、チャンネル登録をお願いします。次回のコンテンツもお楽しみに。
また、AIの世界では毎週本当にたくさんのことが起きていて、YouTubeチャンネルだけでは全てをカバーできません。AIに関する最新情報を本当に把握したい方は、私の無料週刊ニュースレターを購読してください。リンクは説明欄に貼っておきます。
視聴ありがとうございました。また次回お会いしましょう。
コメント