
3,383 文字

私たちは本日、AIエージェントを活用して臨床試験プロセスをいかに迅速化したかについてお話しできることを大変嬉しく思います。私はスコットです。GenmabのAIイノベーションチームを率いています。実は、5歳の息子がChatGPTに会えると聞いて大興奮したおかげで、今日ここに来る時間が取れました。というのも、ChatGPTは私よりもずっと上手くお話を語ってくれるからです。
サムですが?
サム・ワグナーです。スコット、トークの後でミスターChatGPTに会えますかね。
そうですね、会うべきでしょう。Genmabは、バイオテック企業です。私たちはイノベーション企業ですが、生物学に焦点を当てています。その文化は社内に浸透しており、現在Genmabは生物学と抗体の分野で最高であることだけでなく、AIを単に採用するだけでなく、それを前進させることにも力を入れています。
これが、私たちが重要だと考えていることを支援するためのフレームワークの出番です。ご存じない方のために説明すると、臨床試験プロセスは非常に長く、非常にコストがかかります。1つの疾患に対する1つの医薬品で8年以上、数十億ドルかかります。
これを拡大するためには何かが必要です。そして私たちは、AIがここで役立つ立場にあると考えています。今日は、文書生成という非常に具体的なユースケースについて、どのように取り組んだかをお話ししたいと思います。政府に提出しなければならない規制文書についてです。これらの1つは、患者のストーリーと考えることができます。
すべての試験のすべての患者について、試験に参加している毎日、特定の臨床文書を生成しなければなりません。これには熟練した人材が相当な時間をかけて情報を照合する必要があります。数百の異なる文書、あるいは数百ページの文書、数千のデータポイントにアクセスしなければなりません。
臨床医としての技能を活かして、それらすべてをまとめ、要約を生成するのです。これは数多くある文書の1つに過ぎません。もっと詳しくお話しすることもできます。何千人もの患者についてです。これには相当な時間がかかります。そして多くの場合、社内の関係者や会社、データだけでなく、協力しなければならない外部のパートナーも存在します。
GPT-4oを単にプロンプトするだけでは、規制文書に必要な100%の正確性は得られません。99%では十分ではありません。そこで、私たちのフレームワークであるCELIがこの最後の一歩をどのように実現できるかについてお話ししたいと思います。サムが後ほど紹介しますが、私たちの高レベルなアーキテクチャについて説明します。
私たちの言語モデルは、現実世界の、自然な言語、タスクのユーストーリーを取り込み、文脈の中で将来を計画します。ステップ1を実行している時点でステップ10がどうなるかを知っています。自己修正が可能で、ガイドラインを持っています。各ステップの実行と成果を評価する方法があり、計画を進めながら調整とカスタマイズが可能です。
そして、それを取り込み、ステップ1で呼び出すすべてのツール、すべての入力が、次のステップのステップゼロとなります。これを何度でも繰り返すことができ、私たちが求める100%の正確性に収束できることを示しています。また、まもなく公開される予定ですが、解決策を評価する方法がわかっている一般的な問題も解決できることを示しています。
しかし、それについては後ほど触れることにして、今はサムにCELIの実際の動作を見せてもらうことにワクワクしています。サム?
ありがとう、スコット。では、CELIを起動してみましょう。ロードしている間に、スコットが話していたポイントをお見せしたいと思います。それは…
私たちが患者について進めながら学習できるということです。段階的に、セクションごとに草案を作成しています。そしてそれを行う際に、必要な情報を取得するための検索プロセスがあります。最初に行うのはシステムメッセージを表示することです。これを初期化する方法は、事前に作業の説明を指定する一連のプロンプトを持っています。まず最初に行うのは、この特定の文書を作成するという役割と目的を設定することです。タスクの基準を設定します。これは順次実行する必要があるタスクのリストです。チェックリストのようなものと考えてください。最初のタスクを完了し、次に2番目、3番目と進んでいきます。
そしてそれを行う際に、タスクを実行できない場合は、それを解決することができます。メディカルライターと臨床医が、これらの文書をどのように作成すべきかのガイドラインを私たちに提供します。これは指示書、プロンプトに含まれています。また、CELIの重要な部分であるプロンプト完了のメカニクスもあります。
これが本当の秘訣の一部です。進行に応じて、何が完了したか、何に取り組んでいるか、次に何を行うかを知らせる必要があると伝えています。ここで最初に起こることは、このシステムメッセージをGPTに送信することです。それが応答し、最初に行う必要があるのは臨床試験の特定の識別子に対する関数呼び出しであることを認識します。
興味深いのは、検索するIDやキーは文脈の中に残るということです。そのため、いつでも関数呼び出しでキーと値のペアの検索を行うことができます。それをGPTに送信すると、応答が返ってきます。最初のタスクが完了したことを知らせ、タスク2に取り組んでいることを示します。タスク2に進みます。
次の呼び出しが行われる際の指示を自身で行います。続行することを認識しています。関数呼び出しを行い、テーブルを取得します。その結果は文脈に追加されます。文脈は徐々に構築されていきます。これで2つのタスクが完了しました。興味深いのは、進化する物語があるということです。
特定の検索から得られる情報の種類を知らせてくれます。また、この情報が後でどのように使用されるかも把握しています。これは現在タスク2ですが、後の作成のためにこの情報が必要だと知らせています。システムプロンプト全体にすべての情報が含まれているため、タスク10まで先を見通すことができます。
念のため説明すると、これが完了してGPTに送信されるたびに、システムメッセージも一緒に送られます。そのため、全行程にわたってこの設計図を持っているのです。では、作成を開始する部分まで進みましょう。この時点で、必要なすべてのテーブルを持っています。書き始めます。これが背景セクションです。ここでは1日目について書いています。
これを続け、すべてのセクションを書き続け、それが完了してコンパイルする時が来るまで続けます。すべてをコンパイルしました。私たちがこれを行う理由の1つは、小さなセクションに分けて書く際に非常に正確だからです。そして文脈から必要なすべての情報を収集することができます。ここで保存します。
プロセスの最後にモニタリングエージェントがあり、保存されたことを確認します。その時点までに予定通りの順序ですべてが完了しています。そして完成した草案がこのようになります。では、スコットにバックします。
素晴らしい。今これを表示していますが、サムが示したことは数時間かかる可能性があります。
しかし、彼のプロセスは数分で済みます。私たちは多くの異なる試験で数千人の患者を扱っており、様々な日にちで多くの他の文書も扱っています。考えてみてください。最終的な目標は、試験期間を1ヶ月短縮することです。たった1ヶ月でも、それは文字通り、重篤な病気を抱える何百人、何千人もの人々が、病気の深刻さのために利用できなかったはずの私たちの薬にアクセスできるようになることを意味します。
これが私たちが朝起きて仕事に来る理由なのです。そしてもしこのような問題に私たちと一緒に取り組むことに興味があれば、QRコードがあります。オープンソースです。問題解決者として、文書生成者としてのCELIは一般的なものだと考えています。また右側は、重篤な病気を持つ人々を助けることに興味がある方向けです。
本日はどうもありがとうございました。ここに来られて大変嬉しく思います。ありがとうございました。
コメント