ディープリサーチのためのGoogle Docs AIエージェントの作り方 – 完全チュートリアル

6,237 文字

How to Build Deep Research Google Docs AI AGENTS - Full Tutorial
How to Build Deep Research Google Docs AI AGENTS - Full Tutorial👊 Become a YouTube Member for GH access:🤖 Great AI...

まず最初に、新年明けましておめでとうございます。皆さんが素晴らしい新年のスタートを切れたことを願っています。背景に見えているのが、今日私たちが作成するものです。左側にはGoogle Docsに接続された検索エージェント、右側にはレポートライターエージェントがあります。このエージェントはBraveの検索結果を受け取り、それに基づいてレポートを作成します。
これは完全に自律的なエージェントで、レポートを完成させるために必要だと判断した検索クエリを自ら作成します。ライターエージェントがこのドキュメントに書き込みを行い、検索エージェントがそのエージェントからクエリを受け取って新しい情報を検索する、という往復が行われます。例えばここでは、ビットコインETFの資金流入についてより多くの情報を見つけたいと考えているので、そのクエリをBrave検索に送って情報を探し、レポートを書くエージェントがその情報を使って続きを書いていきます。
ここではかなり複雑なプロンプト設定を行っています。ETFの資金流入に関する情報が見つかったので、それを使ってレポートを続けていきます。10秒か60秒待つと、その発見に基づいてレポートが展開されるのが見えるはずです。新しいETFの資金流入についての情報が追加され、ETFのパフォーマンスについても見ていきました。
では、コードに入っていきましょう。セットアップの方法と作業の流れを説明し、新機能をライブでcursorに追加していきます。一緒に進めていけますよ。このセットアップに必要なものはそれほど多くありません。BraveのAPIキーが必要で、私は現在Geminiを使用しています。フラッシュ2.0の実験版だと思いますが、それをテストしたかったんです。GoogleのAPIもいくつか必要で、ドライブとドキュメントへのアクセスが必要ですが、セットアップは簡単です。O2.0を使って認証用のJSONを取得するだけです。
もし設定方法が分からない人がいれば、将来メンバー向けの動画を作るかもしれません。ここで設定したGDoエージェントは、レポートを書くエージェントになります。トピックを設定しており、このトピックに基づいてどんなレポートを書くか、どんな検索クエリを使うかが決まります。
これは認証関数で、さらに下を見ると2つの異なるドキュメントIDがあります。コンテンツ用と検索エージェント用です。両方と対話できるようになっています。検索クエリを書く関数があり、コンテンツを追加する関数もあります。レポートのコンテンツを置き換えるのではなく、追加していきたいからです。既存の内容を読み、そこから検索クエリを作成し、検索エージェントから新しい情報を得るたびにコンテンツを追加していきます。
これが初期の検索クエリを書く部分です。上で設定したトピックを割り当てます。私はビットコン2024サマリーと入力しましたが、このトピックについて情報を集め始めるための具体的な検索クエリを1つ生成します。説明は不要で検索クエリだけを返します。ドキュメントを見ると、ここではとても短い検索クエリが必要なことが分かります。
モニターとエンハンスのドキュメントでは、変更を監視し、新しい検索結果が検出されたら内容を強化します。このエージェントはこのドキュメントを監視し、新しい検索結果があればそれを使ってレポートを拡張していきます。割り当てられたトピック、検索エージェントからの検索結果、既に書かれた現在のコンテンツ、これらを組み合わせてレポートを展開していきます。
その後、新しい検索クエリを書く必要があります。関連トピックを探索したり、理解の隙間を埋めたりするのに役立つ検索クエリです。このクエリは優れたGoogle検索クエリの形式でなければならず、例えば「バーンアウトを避ける方法」といった具合です。検索クエリは最大4語までです。
これが基本的な流れです。モニターとエンハンスを実行し、これがライターエージェントとして機能します。フェッチャーエージェントは検索を行うもので、Brave検索APIを使用する単純な関数呼び出しを使用します。ツールを作成してBrave検索APIを使用してウェブを検索できるようにしました。
これも直接的なセットアップで、関数呼び出しを使用して結果を返します。ドキュメントをコンテキストで更新し、検索クエリをフェッチして検索結果を提供します。モニターとエンハンスも同様で、30秒ごとにドキュメントの変更をチェックします。これは検索結果から返された変更と、検索クエリへの変更を意味します。他のエージェントが検索クエリを提供すると、ドキュメントが変更されたことを意味し、新しい検索が必要になります。
このインターバルは調整可能で、モニターとエンハンスをこのループで実行し、インターバルを設定します。私は60秒に設定しましたが、これは調整可能です。これが基本的な完全なセットアップです。それほど難しくありません。
3番目のエージェントまたは機能を追加する前に、もう少しテストしたいと思います。レポートが完了したことを認識する機能が欲しいので、真偽値のようなものを作ります。基本的にはLLMを判定者として使用し、これまでのレポートを見て、十分良いかどうかを判断し、十分であればすべてのスクリプトを停止して完了とします。
これから実装しますが、まずはもう少しテストして、これらのGoogle Docsエージェントを使ってどのような情報が集められるか見てみましょう。トピックを変更してみましょう。AI agents 2025にしてみます。
スクロールダウンすると、次のトピックについてレポートを書き始めているのが分かります。始めるには2つのターミナルが必要です。ドキュメントエージェント用と検索エージェント用です。まずドキュメントエージェントを起動しましょう。検索クエリが必要だからです。
AI agent Market forecast 2025が初期の検索です。ヘルスケアAIエージェントの成長予測、自律型AI、グローバルAIエージェントについての情報が見つかりました。求めていたものとは少し違うかもしれませんが、どうなるか見てみましょう。
次のステップでは、AIエージェントのユースケースが次の検索クエリになります。検索エージェントからの情報を使って最初の段落を書いているのが分かります。これはあまり良くなかったと思います。検索結果を単に再述するのではなく、コンテキストとして使用しているだけです。2025年から2034年の間のハイライトを見て、AIエージェントのユースケースについて調べました。
エージェントはさまざまな分野で増加しており、自動化ルーチンタスク、チャットボット、リアルタイムでの対話分析などが行われています。あまり良くないですね。もう1段落追加して、もっと具体的な何かを試してみましょう。
休暇中にPath of Exile 2をたくさんプレイしました。素晴らしいゲームです。なので、Path of Exile 2のプレイヤーフィードバックについて調べてみましょう。YouTubeでいくつか動画を見ていて、人々がゲームについてどう考えているかある程度分かっているので、リサーチエージェントが何を見つけられるか見てみましょう。
まずドキュメントエージェントを起動し、次にフェッチャーエージェントを起動します。Path of Exile 2の初期印象を検索します。それはかなり良いですね。印象は様々で、ボスの難しさ、チャレンジングなユニークアビリティ、レベルデザイン、レイアウトなどに感銘を受けた人もいます。
印象は様々で、ARPGジャンルを再定義する可能性があるという期待があります。これは私がYouTube動画で見たことと非常に一致しています。Path of Exileへの初期プレイヤーの反応は多様で、基本的に見つけたことを再述しています。
次の検索はレベルデザインについてです。レベリングシステム、レベリングガイド、ボスデザインについての情報が返ってきました。おそらくこれは最良の検索結果ではありませんが、もちろんこれを拡張することはできます。より良い検索結果を得るための方法はたくさんあり、これはもちろんより良いレポートにつながります。
これは良さそうです。ここで言ったことを繰り返していません。要求の性質、レベル100に到達するまでの100時間、今はおそらくもっと時間がかかると思います。Path of Exile 2のスキルを検索しました。しばらく実行させて、いくつかのイテレーションを行い、どうなるか見てみましょう。
しばらく実行した後、かなり満足のいく結果になりました。これは一種のリサーチエージェントになっています。マジックファインド、これは最近のPoE2で非常に議論の的になっているトピックです。タレントバランスについても変更がありました。
読んでみると、この初期レポートは見つけたすべての研究結果をまとめたものに見えます。このドキュメントのすべてを取り、より構造化されたレポートを書く新しいエージェントが必要だと思います。このエージェントでは、レポートを承認するか否かを判断するLLMも使用できます。これは真偽値となり、否認された場合はより多くの情報を取得する必要があります。
タレントバランスについて…ここで止める必要がありますが、かなり満足しています。cursorでさらに改良してみましょう。
少し考えてみました。これが、このシステムを構築するために使用するプロンプトです。完全なプロンプトを読み上げます。飛ばしたい場合は先に進んでください。
セットアップは上手く機能しており、エージェントによる研究ノートの良いレポートが得られています。このコンテンツIDにリンクしていますが、この情報だけでは独立したレポートとしては不十分です。このコンテンツドキュメントの内容をコンテキストとして使用し、最終レポートを書く必要があります。
メインエージェントは、他のエージェントから5つのエントリーがドキュメントに提出された後にコンテンツドキュメントを確認し、GeminiのAPIを使用してコンテンツをチェックします。トピックについて完全なレポートを書くのに十分な研究データがある場合はtrueを設定し、URLのドキュメントにレポートを書きます。
メインエージェントがGemini APIを使用し、コンテンツドキュメントのコンテキストが不十分だと判断した場合はfalseを返し、Google Docsとフェッチャーエージェントがドキュメントにさらに5つのエントリーを集めてから、メインエージェントが再度チェックします。
メインエージェントがtrueに設定したら最終レポートを書き、実行中のすべてのスクリプトは仕事が完了したため停止します。このメインエージェントのコードを書き、この実装を行うようにコードを更新してください。
これが私たちが試そうとしていることです。一発で成功する保証はありませんが、実行してみましょう。すべてのドキュメント、Pythonコードをコンテキストとして追加しました。cursorで実行してみましょう。
これがメインエージェントのコードになります。最終レポートドキュメント、しきい値5、それは良さそうです。認証情報を取得し、エントリーをカウントします。コンテンツを評価します。これはレポートではなく、Claudeが書いたプロンプトです。真偽値のみを返すことが問題になるかもしれませんが、様子を見ましょう。
最終レポートを書き、研究の進捗状況を監視する、これが必要な関数です。認証情報、Geminiキー、他のコードでもいくつか変更が必要です。かなり良さそうです。これをメインエージェントに適用し、GDosで何をする必要があるか見てみましょう。この関数を追加し、チェックを追加する必要があります。それで問題ないでしょう。
試してみましょう。Path of Exile 2のベストビルドに変更しました。まずGエージェントを起動し、次にフェッチャー、そしてこのPythonメインエージェントドキュメントを開きましょう。P2とメタビルドです。5つのエントリーが必要なので、これを早送りします。すぐに戻ってきます。
これが5つ目のエントリーです。1、2、3、4、5と見えます。エントリーを発見し、コンテンツを評価しています。コンテンツが十分であると判断し、最終レポートを生成しています。
興味深いエラーが更新時に発生しました。そのスクリプトは停止しましたが、これも停止するはずです。そうですね、シャットダウンしています。検索クエリも停止する必要があります。
すべてのスクリプトがシャットダウンしました。その部分は完璧で、すべてがスムーズに動作しました。いくつかエラーがありますが、これはドキュメントが空だったためだと思います。簡単に修正できるはずですが、とにかくドキュメントが生成されたか見てみましょう。
これは空ですが、小さな修正で済むと思います。エラーをコピーして、チャットに貼り付けて「main agent.pyのエラーを解決してください」と言えばいいでしょう。空のドキュメントを試みているためだと思います。空のドキュメントを処理できるように修正しましょう。
エントリーを発見し、コンテンツが十分だと判断し、最終レポートを生成しています。再試行しました。最初は失敗しましたが、削除なしで挿入を試みて成功しました。
最終レポートを見てみましょう。Path of Exile 2のビルドメタとゲーム習得について、メタやスキルゲームなどがあります。完璧です。
私はこれにかなり満足しています。研究ノートの情報を使ってレポートを生成し、すべての補助プロセスをシャットダウンしました。これを設定しておけば、レポートが完了したら自律的にすべてが停止するので、私たちがその場にいる必要さえありません。
もちろん、このレポートに満足できない場合は、研究ノートがすでにあるので、もう一度実行することもできます。私に言わせれば、かなりの成功です。cursorで作業するのは本当に素晴らしく、最近良い更新もありましたね。まだ実行していない更新があるようですが。
このプロジェクトを楽しんでいただけたと思います。Google Docsを使用して独自の研究エージェントを作成するのは、それほど難しくありません。フェッチャーエージェントをより良い結果を得られるように改良する余地がたくさんあります。より良い結果は、もちろんより良いコンテキスト、より良いレポートにつながります。
メインエージェントについても、プロンプトを全く変更していないので、もちろんそこでもできることはたくさんあります。何か学んでいただけたと思います。完全なコードは私のコミュニティGitHubに置きます。アクセスしたい場合は、チャンネルのメンバーになってください。リンクは説明欄にあります。
面白かったり役に立ったと思ったらいいねを押してください。また近いうちにお会いしましょう。改めて、新年おめでとうございます。また近いうちに話しましょう。

コメント

タイトルとURLをコピーしました