
6,175 文字
私はマイクと申します。AIを扱う企業、パルオアで働いています。私たちはコンタクトセンターの自動化を行っています。電話のホットラインに電話をかけた時のことを想像してみてください。今日では通常、保険は1を、契約は2を押してくださいというような応対ですが、これは良い体験とは言えません。
今日は、コンタクトセンター業界がどのように変革され、OpenAIのテクノロジー、特にGPT-4oとマルチエージェントクルー、そして安全に使用するためのヒューマンインザループ統合によって、近い将来どのように形作られていくのかについてお話ししたいと思います。
私たちパルオアでは、すべてのカスタマーインタラクションは友人との会話のように簡単であるべきだと考えています。電話をかけた時、自然で信頼でき、安全であることが望ましいと思います。これが、私たちがパーソナルAIエージェントと呼ぶものです。各会話はユニークで、単に電話を転送するだけでなく、実際に問題を解決することを確実にします。
現代の世界を見渡すと、世界中にコンタクトセンターがあり、カスタマーケア担当者と呼ばれる人間のエージェントが様々なレベルで働いています。これらはすべて、コールセンターで日々働く人間のエージェントです。実際、これは簡単な仕事ではありません。私はマラガやカイロのコールセンターを訪れ、エージェントと話をしましたが、本当に大変な仕事です。
将来を見据えると、私たちはコンタクトセンターで働く人間のエージェントの労働力にAIエージェントを導入することで、そのような仕事をサポートしたいと考えています。これは人間のエージェントの仕事を置き換えるということではありません。それを補完するのです。ロマのデモで見たように、彼はパイを注文していましたが、電話をかけていたのは彼自身ではなく、アシスタントに代わりに依頼していました。
ポケットの中にある個人のアシスタント、SiriやAlexaが、1つの場所だけでなく、おそらく10の異なるベンダーと価格交渉の電話をすることを想像してみてください。電話に出る相手が人間のエージェントであれば、それは不可能です。市場全体をカバーすることはできませんし、その通話量の流入を管理することはできないでしょう。これが、AIエージェントが解決策となり得る理由です。
課題は、私たちが実際の顧客とのやり取りを行っており、顧客を大切にしているということです。そのため、この技術を安全かつ責任を持って本番環境に投入するための新しいソリューションを考え出す必要があります。
これが、AIエージェントライフサイクルが重要となる理由です。単にHello Worldの例を作ったり、パフォーマンスを気にせずに本番環境に投入したりするだけではなく、ライフサイクル全体をサポートすることが重要です。
これが、今年9月に私たちがAIエージェント管理プラットフォームを立ち上げた理由です。1年半かけて取り組んできました。その間、話すことができず、口を閉ざしておく必要がありましたが、9月に発表し、ようやく話すことができるようになりました。
私たちは、本番環境に適切に投入するために必要なすべての部分をカバーしようと試みました。これには設計と統合が含まれます。設計と統合とは、AIエージェントを構築し、自然言語のブリーフィングでプロンプトを行い、外部世界と相互作用するためにサードパーティツールと統合することを意味します。情報を取得し、データを適切なシステムに戻すことと、適切にテストすることを確実にします。
テストは変化しました。以前はIVRの世界から来ていました。これは意図の分類、自然言語処理のようなもので、単語を取り、意図に変換し、固定された経路に沿って進もうとするものでした。とてもシンプルで、ハッピーパスのテストは簡単でした。しかし今、私たちは非決定論的な世界に直面しています。
そのため、アプローチを変更する必要があり、私たちが選択したアプローチはシミュレーションと評価です。実際にテストできることを確認します。最初の2つの部分が今日のセッションの主な焦点となりますが、もちろん、デプロイとスケールも確実に行う必要があります。
コンタクトセンターとカスタマーサービスでは、通常、通話量の大きな変動が見られます。ある日は前日より数千件多い通話があるかもしれず、入ってくる通話量に大規模言語モデルが対応できることを確認する必要があります。
一方で、私たちは定量的なデータ、KPIを導き出したいと考えています。何が機能しているのか、何人が電話をかけてきているのかといったデータです。これが最後のステップである監視と改善であり、その後、プロセス全体が再び始まります。これにより、使用しているAIエージェントの自律性を高めることができます。
最初のパート、設計と統合について説明します。AIエージェントを構築する際、このように見えます。自然言語のブリーフィングです。人間のエージェントが初日に仕事を始める方法と比較できます。どの会社で働いているのか、どの製品をサポートしているのか、誰かが電話をかけてきた時にどのように対応するのかを伝えられ、それを自然言語でプロンプトします。
このような体験を構築する方法全体も変化しています。私たちは自然言語を使用しており、もはやプログラミングではありません。主題の専門家にとっても、AIエージェントに取り組むことがより簡単になります。
しかし、これは難しいものです。プロンプトエンジニアリングは、それ自体が科学であることを皆さんご存知でしょう。近い将来も簡単にはならないでしょう。パルオアでは、特にサポートしたいケースがあり、ゼロからイチに到達する最初の段階をサポートすることに取り組んでいます。
これが、マルチエージェントプロンプトエンジニアリングクルーが活躍する場面です。私たちは会話デザイナーをサポートしようとしています。その仕組みは、通常チームに存在する役割を複製し、自律的なGPT-4ベースのエージェントで全プロセスを試みることです。
様々なワークストリームをナビゲートする豊富な経験を持つカスタマーサクセス担当副社長がおり、2人の協力者がいます。システムの接続方法に焦点を当てたソリューションエンジニアと、最適な会話戦略の作成に焦点を当てたCXデザイナーです。
このクルーは協力して作業し、マネージャーは、現場で見られるベストプラクティスやプロンプトの例、常に取り入れているすべてのベストプラクティスを使用して、設定した目標が達成されることを確認します。最終的に、M Studioで使用されるJSONコンフィギュレーションを生成します。
これは再帰的なループ自体です。会話デザイナーも、改善点や見落としていた点、最初に考慮していなかったユースケースについて、潜在的に指示を出し直す必要があります。最終的に、クルーが作成した最初の設計、最初のドラフトに満足したら、シミュレーションと評価を行う必要があります。
技術的な詳細に少し踏み込むと、私たちのコンフィギュレーション構造は、通常のプロンプトとは少し異なります。電話の古典的なユースケース、例えば人間のエージェントに引き継ぐ特定のケースのための電話ハンドオーバーなど、特定の部分をサポートする必要があるためです。
これがzipツールが活躍する場面です。また、プロンプトをペルソナ、サードパーティツールにメータ情報を渡したい場合のパラメータに必要な様々な種類の説明の間で構造化しており、これらすべてを考慮する必要があります。そのため、通常のテキストプロンプトよりもはるかに複雑です。
そして、YL方式で記述することを選択した役割の説明があります。これにより、ソリューションエンジニア自身も簡単に協力できるようになります。これらはすべてcrew AIフレームワークに基づいています。主に使いやすさと開発者体験のために、CXや私たちのソリューションエンジニアリングからより多くの人々をそのプロセスに組み込めるようにするためです。
そして今、プロンプトができました。課題は、生成したブリーフィング、考え出したブリーフィングが実際に想定通りに機能するかどうかをどのように知るかということです。これがシミュレーションと評価が重要となる場面です。プロンプトの信頼性をテストする必要があります。
会話デザイナーがいて、構成されたAIエージェントの構成があり、もう一方では実際の顧客との会話があります。私たちはコールセンターと協力しているため、現場の実際のユースケースからのサンプルデータがあります。これらを使用して顧客ペルソナを導き出します。
怒っている発信者、電話をかけてくる子供、高齢者など、まったく異なるペルソナを想像してください。私たちは、AIエージェントが異なる顧客とシミュレーションされ、提供したエージェント構成のブリーフィングに従ってこれらのケースを処理できることを確認するために、すべての異なるバリアントをシミュレーションする必要があります。
これらの会話はすべて、コンタクトセンター固有の評価基準で評価され、最終的に会話デザイナーに洞察を提供し、時間とともに構成全体を改善し、会社が設定した目標に準拠していることを確認します。
UIではこのように表示されます。私たちは顧客自身のために、すべての複雑さを抽象化しました。シミュレーションを実行し、テストしたいペルソナを構成し、実行したいイテレーションの数、実行したいシミュレーションの数を設定する簡単な方法があります。
数千、数万の会話を実行することを考えることができ、大規模言語モデルの信頼性を適切に定量化し、本番のユースケースにも安全に使用できることを確認できます。
評価基準自体は、技術的な正確性の組み合わせです。本質的には、ソフトウェアエンジニアリングで知られているエンドツーエンドの統合テストのようなものです。APIエラーもテストできます。時にはAIエージェントに問題があるわけではなく、顧客のAPIが不適切な応答を送信したり、適切に反応しなかったりすることもあるためです。
一方で、会話の扱い方、企業の言葉遣いを適切に使用しているか、特に質問された場合に競合他社を推奨しているかなど、言語の振る舞い自体があります。コンプライアンスのために必要なすべてのことを、基準に合格するか失敗するかを確認できます。
実生活では、すべての顧客とのやり取りを自律的に処理できるわけではありません。これが現状です。そのため、完全に自動化できない会話をどのように処理するかについてのソリューションを考え出す必要があります。
パルオアでは、AIエージェントと人間のエージェントの概念を組み込んだソリューションを構築しました。その仕組みは、人間のエージェントに電話を引き継ぎますが、顧客と人間のエージェントはお互いの声を聞くことはできません。人間のエージェントはこのインターフェースを見ており、会話全体がリアルタイムで文字起こしされ、AIエージェントが人間のエージェントに適切な応答を提案します。
小さな青いボタンが見えますが、人間のエージェントは提案された応答を選択するだけでよいのです。人間のエージェントが提案された応答に満足しない場合は、電話で話すだけでよく、人間のエージェントが言うことすべてが文字起こしされ、AIエージェントが使用するJMLコンテキストに戻されます。
人間は必要に応じて会話に介入して制御することができ、AIエージェントは次のターンでそのようなガイダンスや会話の流れを採用し、例えば次回はより良い提案をします。このように、エージェントは仕事をサポートされ、良い副作用として、人間のエージェントと消費者が直接つながっていないことで、同時に言語の壁を乗り越えることができます。これは完全に言語に依存しません。スウェーデン語の発信者が電話をかけ、ドイツ語の人間エージェントがサポートすることができ、大規模言語モデルを使用してプロセス全体を加速し、レイテンシーを可能な限り低く抑えることができます。
これは、生成AI利用に対して少し否定的な、あるいは懸念を持つ顧客にとっても非常に興味深いものです。このように、安全に使用でき、これらのケースの扱い方に経験のある人間のエージェントによって常に監督されていることを確認できます。
これが重要な理由について説明します。過去を振り返ると、世界はこのようでした。多くのIVRシステムで1を押す、2を押すといった形で、多くの人間のエージェント、ジュニアエージェント、シニアエージェントが様々なレベルで働いていました。
AIの出現により、私たちはAI移行フェーズに入りました。主に自然言語処理、一部意図分類に基づくルールベースのAIエージェントを導入しましたが、依然として多くのIVRとジュニアエージェント、それを処理しなければならないシニアエージェントがいました。
現在、私たちは自律型AIエージェントの時代に入っています。これらのエージェントはより多くの仕事を引き継ぎ、現時点ではルールベースのシステムを補完し、悪い顧客体験を生むIVRソリューションを徐々に着実に排除していくことを確実にします。
将来を見据えると、私たちはAIファーストコンタクトセンターと呼ばれる時代に入ります。面白いことに、約1年前、サム・アルトマンがレックス・フリードマンとのポッドキャストで、コンタクトセンターが最初に完全に破壊される可能性のある産業の1つであると推測していましたが、彼は正しかったのです。これは現在起きていることです。私たちは世界中のコールセンターやコンタクトセンターでそのソリューションを展開しています。
将来、より高性能なモデル、より高い自律性、サードパーティシステムに接続する方法が増え、指示に従う能力が向上すると、顧客が電話をかけてきた際のケースを自律的なエージェントが処理し、システムに統合して全プロセスを自動化し、完全に自律的にエンドツーエンドで解決するようになるでしょう。
重要な点は、依然として人間のエージェントは存在し続けるということです。現在の働き方と将来の働き方の違いは、本質的にシニアエージェントやAIコーチ、スーパーバイザーに昇進するということです。
私たちが描く未来のコンタクトセンターは、AIエージェントが良い仕事をするのを支援し、人間のエージェントはこれらのAIエージェントすべてのスーパーバイザーになるというものです。これが私たちが描く未来であり、パルオアでは、この時代のリーダー、良いコンタクトとカスタマーサービスを提供しようとする企業は、すべての顧客にパーソナルAIエージェントを提供するだろうと考えています。
最後に、大規模言語モデルが社会や人類に良い利益をもたらすことができ、また、起ころうとしている組織的な変化を考慮し、すべての人々がそれに適応するのを助けることを世界に証明しましょう。
お時間をいただき、ありがとうございました。また会いましょう。
コメント