
3,432 文字

Anthropicの最新機能発表は、ビジネスにおけるAIの聖杯の一つを、おそらく、少なくとも解決し始めたかもしれません。AI Daily Briefへようこそ。
生成AIと関わり始めた人々には、非常に一般的なパターンがあります。基本的にそのパターンは、最初は能力に完全に圧倒されるというものです。Midjourney のような画像生成や、Eleven Labs のような音声合成、もちろんChatGPTやClaudeのようなLLMにしても、AIができることは魔法使いのような気分にさせてくれます。
しかし、必然的に深く関わるほど、完全には正しくないことや、どこまで活用できるかという点で制限があることに気づきます。画像生成分野での良い例は、一貫したキャラクターです。一回限りの画像を作ろうとしているなら素晴らしく、見た目や雰囲気について信じられないほどの忠実さと具体性を得ることができます。しかし、それを一連の画像全体で実現しようとすると、アニメーションや漫画の基礎を作ろうとすると、かなり難しくなります。
大手画像生成企業やサードパーティの両方から、これをより良くする方法に多大な努力が費やされてきました。そしてその機能が実現すると、それまで実現できなかった一連のユースケースが解禁されることになります。
LLM分野におけるそのような聖杯の一つ、つまり、多数の新しいユースケースを解禁したり、LLMの既存の用途を根本的かつ大幅に改善したりする可能性のある更新の一つは、特定の文章スタイルを模倣する能力です。
ChatGPTやClaudeで人々がすぐに気づいたことの一つは、LLMが生成する文章には特定の味わいと雰囲気があるということです。LLMは実際の人間よりもはるかに頻繁に使う特定の単語があり、一般的に認識できる特定のスタイルがあります。
プロンプトを使ってこれを回避する方法はあります。LLMに特定の方法で書くよう指示したり、参考例を与えたりできます。しかし、人々が最も望んでいたことの一つは、自分の文書をアップロードするだけで、LLMがそれを自然に模倣できるようになることでした。
実際、私も広範にこれを試みました。短いエッセイから長文まで15の参考文書を持つカスタムGPTを作成しましたが、結論として、まあまあという程度です。確かにChatGPTらしくない文章にはなり、私の書き方のパターンをある程度模倣していますが、本当に私らしい文章にはなっていません。少なくとも、重要な文章作成を早々に外注できるほどではありません。
最近、他の企業もこの分野での製品化を試みています。たとえば、Everyが提供するSpiralという製品がこの分野で面白いアプローチを取っています。基本的に、ある種のコンテンツを別のコンテンツに変換することを容易にしようとしています。YouTubeビデオ、ポッドキャスト、LinkedInの投稿を生成していると言えば、元のコンテンツを他の多くの投稿に変換する方法を示してくれます。
このプロセスの一部として、追加のアセットを作成する際にスタイルを維持しようとします。例えば、何ができるかを示すために過去の例で遊べるようにしています。しかし、人々が本当に望んでいたのは、これがLLM自体にネイティブに組み込まれ、かつ優れたものであることでした。
そのため、Anthropicが昨日このスタイル機能を発表したとき、詳しい人々は本当に興奮しました。例えばMatt Wolfは「これは誰もが望んで待っていた機能だと思います。残念ながらこのニュースはSoraのリークに隠れてしまいましたが、私の意見では、これの方が重要です」と書いています。
Anthropic側は「Stylesを使用すると、Claudeの応答方法をカスタマイズできるようになりました。新しいプリセットオプションから簡潔、説明的、形式的を選択できます」と発表しています。
この機能には実際に2つの部分があります。まず、組み込みのスタイルセレクターがあり、どのプロンプトでも通常(Claudeのデフォルトの応答)、簡潔(より短い応答とより多くのメッセージ)、説明的(学習のための教育的な応答)、形式的(明確で構造化された応答)を選択できます。これだけでも素晴らしい機能です。望むスタイルについてプロンプトで明確にする必要がなく、代わりにUIに組み込まれているからです。
しかし、本当の進展であり、人々を興奮させているのは、スタイルを作成・編集できるという事実です。スタイルメニューを選択し、スタイルの作成と編集を押し、カスタムスタイルを作成します。ここで、文書をアップロードするか、テキストをコピー&ペーストするか、単に目指すスタイルを説明することができます。
私は最近のLinkedInの投稿から、より長めでブログ記事に近い実質的な内容のものを追加しました。すると「Tech translator」というスタイルが返ってきました。スタイルの要約は「会話的で権威のあるコミュニケーションを通じて分析的な洞察を提供する」というものでした。
では戻って、「企業におけるAIエージェントについて短いブログ記事を書いてください。まだ本番環境での準備は整っていないかもしれませんが、2025年は企業がエージェントを統合し始める年になる可能性が高く、先見の明のある企業は先行すべきだということを強調してください」と入力してみましょう。
まず通常モードでコピーすると、「企業におけるAIエージェント:2025年の波に向けた準備」という記事が出てきます。これはClaudeなので、私らしさは全くありません。私の書き方とは全く関係ありません。一例を挙げると、段落が私のスタイルに合わない長さになっています。
次に、私用に作成された「tech translator」スタイルを試してみましょう。完璧ではありませんが、私が思っているよりもツイート的です。最初の段落は「企業におけるAIエージェントについて現実的に考えてみましょう。デモビデオや実証実験を見ている間、ほとんどの企業はまだ様子見の状態です。そして正直なところ、これまではそれが正しい選択でした。しかし、今はその状況が変わりつつあります」となっています。これは私の書き方にずっと近いです。短く鋭い文章で、人々の注目を集めようとしています。
もちろん、ポッドキャストの文脈でこれがより良く機能するかどうかを説明するのは難しいですが、私の要点は、少なくとも初期の試行では、これまで私が試みたものよりもはるかに近づいているということです。特に、企業がコンテンツを大量生産しようとしている使用例を想像すると、Claudeから生成される文章の平均的な品質という点で、これは大きな進展です。
しかし、誰もが非常に感銘を受けているわけではありません。Matt Wolfは「熱心な会話的な専門知識で複雑なトピックを魅力的でアクセスしやすいものにする技術的AIニュースを提供する」というスタイル要約を得ましたが、「残念ながら、少し失望しています。90分分の書き起こしをアップロードしましたが、これは全く私らしくないと思います。幸い、フィードバックを提供してさらに近づけることはできます」と述べています。
一つ指摘したいのは、Mattがアップロードしたのは自身が話しているYouTubeの書き起こしであり、それは執筆とは異なるということです。この技術にとって、それはより難しい翻訳になると思われますが、ソースが何であれ、重要なのは個人のスタイルにどれだけ近づけるかを過大評価しないということです。
私は、本当の価値と、多くの人々が興奮する部分は、自分のスタイルを少し模倣することと、特定のユースケースに対して望む正確な出力タイプを得るために、既存のスタイルプリセットのバンクを作成してより速く切り替えられるようにすることだと考えています。
これは、LLMの開発における現在の位置を完璧に表しています。最先端を押し進めるだけでなく、これらのものを個人的にもビジネスの文脈でも実際に機能させるユーザーエクスペリエンスも重要なのです。
その観点から、私は文章スタイルが大きなアップグレードであり、さらに試してみたい機能だと考えています。今回のAI Daily Briefはここまでです。また次回まで、さようなら。
コメント