企業がAI導入で間違えていること – 這い、歩き、走り、飛ぶ

6,937 文字

YouTube
作成した動画を友だち、家族、世界中の人たちと共有

おおきに、みなさん。今日のエピソードはストレートな感じで、簡単に言うたら、ワイが「加速主義者」言うてカミングアウトしたんやけど、これはまあ、ただのミームみたいなもんやね。
要するに、ワイは技術オプティミストで、テクノロジーがもたらす変化を楽しみにしとるわけや。今日特に話したいのは、我々がどないしてAIの導入と展開を加速できるかってことやね。
ワイが長いこと言うてきたことの一つで、このモデルを最初に提案してから1年以上経つけど、それ以来もっとデータが出てきてん。私的に共有されたもんもあれば、公開されてる研究もあるし、そんなんやね。
今のAI導入の最大の制約は、AIに懐疑的やいうより、まあ新しすぎて、どない導入したらええか誰も分からへんし、何を期待したらええかも分からへんってことやね。
例えば、ワイに共有された研究があってん。大規模な企業調査で、AI CoE(Center of Excellence)を作った企業は、そういう集中型のアプローチやと、むしろ人々がAIを有機的で分散的に探索するのを邪魔しちゃうってことが分かってん。
特に製品リーダー、つまり製品オーナーやプログラムマネージャー、プロダクトマネージャーなんかを権限付与するのが、AIの導入や展開を集中管理するより、ええ方法やってことやね。
これが今回のエピソードの核心や。最初の2分でざっくり言うたら、少なくとも最初はCoEがええ方法やないってことやね。
これは1年半ほど前にワイが提案した「這い、歩き、走り、飛ぶ」モデルに戻るわけや。ちょっと背景を説明すると、当時ワイはフルタイムのコンサルタントとユーチューバーやってん。中小企業や一部の大企業に、生成AIの技術、特に言語モデルやチャットボットの導入についてコンサルティングしとってん。
「這い、歩き、走り、飛ぶ」モデルは、人工知能を正しく導入するための成熟度の順序を示すもんや。「這う」段階では、探索的で発見的な、いわゆるブルーオーシャン的な考え方をするんや。
コンサルティング時代に見た最大の問題の一つは、多くの人が深いところに飛び込もうとすることやったね。ある相談の電話で、「エージェントを導入したい」言われて、エージェントがまだ本当の意味であらへん時代やってん。ワイが「ジェネレーティブAIを導入したことあります?ChatGPT使ってます?」って聞いたら、「いいえ」言うて。
そこでワイは「エージェントを導入する準備できてへんで。この技術が何できるか全然分かってへんやん」言うたんや。その相談関係は長続きせえへんかったけど、聞きたくない話を聞かされたからやね。
よくあるディルバートの漫画みたいなもんで、「SQLサーバーが必要や」言うて、SQLはただのデータベースやのに、ディルバートが「どの色のSQLサーバーがええですか?」って聞いて、マネージャーが「モーブがええって聞いたで」言うような、完全にナンセンスな話やね。
多くの経営陣は、ただバズワードやハイプがあるってことは知っとるけど、「ジェネレーティブAIをせなアカン」言うて、それが何を意味するか分かってへんのや。ChatGPTを常用してる経営者もおって、従業員の教育とか、どない使うか、何に使うかの相談を受けたこともあるけどね。
多くの人が深いところに飛び込もうとするのは分かるけど、大企業やなくても、500人から5000人くらいの従業員がおる会社やったら、たぶんクラウド戦略があるやろ。クラウドは過去10年くらいの大きな技術のバズワードやトレンドやったからね。その前はビッグデータがあって、その次がクラウドやったわけや。
多くの企業がクラウドのセンター・オブ・エクセレンス(CoE)を作るんや。これはトップチーム、精鋭チーム、特殊部隊みたいなもんで、ベストプラクティスを所有して、会社全体の戦略を立てるんや。
これは理にかなっとるけど、業界自体が成熟するのに5年、10年、15年かかったことを忘れたらアカン。ベストプラクティスや、エンジニア、リーダー、アーキテクトも成熟するのに時間がかかったんや。
今すぐに人工知能のCoEを作るのは時期尚早や。まず、業界がそこまで成熟してへん。次に、個々の貢献者も成熟してへん。これは個人の欠点やないで。すべてがリアルタイムで進行中やからや。
製品やサービスもまだ整ってへんし、ベストプラクティスや業界の知識もまだ足りへん。個々の貢献者も、この技術が新しすぎて、まだ十分に訓練されてへんのや。
ごめん、ちょっと話がそれたな。「這う」段階に戻るで。まず大事なのは、価値の期待を持たんことや。
最大の問題の一つは、人々が即座の成果やすぐにROIを求めることや。これは実際のデータでも証明されとってん。「生成AIを使い始めろ。生産性が30%上がるって読んだで」みたいな上からの命令があるんや。
幹部や取締役からのトップダウンの命令で、この技術を疑わしく思ってる従業員に、能力を与えたり、権限を与えたり、オンボーディングしたりせんと、急に生産性を30%上げろ言うてるようなもんや。
実際に起こるのは、こういうトップダウンの命令がある会社では、生産性が下がってしまうんや。「この技術を無理やり使おうとしとるけど、使い方が分からへん。ちゃんと使えてへん」みたいな感じで、ただの中間管理職や上層部の大きな考えが、そういう効果を生むと信じとるだけやからね。
結果、組織内の全員がAIに怒っとる。みんな疑わしく思って、懐疑的になる。そして幹部陣は「まだ準備できてへんな」「役に立たへんわ」「幻覚を見るし」みたいに結論付けてしまうんや。実際には生産性を下げてしまうことになるんや。
これが中央管理で起こることや。「這う」段階では、全員に探索する権限を与えるんや。ただ試してみる。「家で使ってるやろ?子供も使ってるやろ?」言うて、個人の貢献者でもプロダクトオーナーでも、とにかく遊んでみることから始めるんや。
プレッシャーも価値の期待もなしや。「でも、結果をどない測るんや?KPIもROIもなかったら、なんで価値があるんや?」って思うかもしれへんけど、ここでのKPIは馴染み深さや。
メールが新しかった頃、インターネットが新しかった頃を思い出してみ。人々はただいじくり回してたんや。Googleに行って、「おっ、アラジンのウェブサイトがあるで」みたいな。たしか1994年くらいにディズニーの最初のウェブサイトの一つやったと思うわ。
そういうことをしてるだけで、馴染みができる。自信がつく。そして、価値の期待のプレッシャーを取り除くことで、好奇心を刺激するんや。
重要なのは、価値を無視して、好奇心に焦点を当てることや。多くの従業員も雇用主も、これをどない扱ったらええか分からへんやろ。生産性カルトに徹底的に洗脳されてるから、仕事中に何かを楽しみのためにしたり、好奇心に従ったりするのが、実は価値のある時間の使い方やということが分からへんのや。
ワイがコンサルティングした多くの人が「でも、どない測るんや?何を期待したらええんや?」って聞いてきた。その答えが気に入らへんで一回きりの電話になったことが数え切れへんくらいあるわ。
「あなたも従業員も何をしとるか分かってへん。この技術が何ができて何ができへんか分かってへんのに」って言うたからや。遊ぶ必要があるんや。このことはまだドキュメント化されてへんし、まだ本もないんや。ほとんどの本は基本的なプロンプトエンジニアリングの本やけどな。
これは全く新しいブルーオーシャンやから、発見的で探索的な、好奇心旺盛な考え方が必要なんや。これが「這う」段階や。
「いつ終わるんや?」って思うかもしれへんけど、退屈になったらやで。一番のシグナルは、好奇心と退屈の間のテンションや。脳は新しいものを探すんや。新しいものには潜在的な価値があるからな。
ただ探索したり、いじくり回したり、つついたりすることに退屈し始めたら、それは新しさがなくなったってことや。もう新しいものが見えへんってことやね。
退屈になったら、個々の貢献者やプロダクトオーナーや他の人たちが「歩く」段階に移る時やね。「歩く」段階では、実際に価値を付加しようとするんや。これが最初の段階で、一つのツールか一つのツールの使い方を見つけるか、一つの問題を解決するツールを作り始めるんや。
ワイが使うマントラは「より良く、より速く、より安く、より安全に」や。測定可能な利益を生み出すツールか、ツールのセットを見つけるんや。ここでKPIとROIが出てくるわけや。理想的には4つ全部やけど、ほとんどの場合は1つか2つ、せいぜい3つやね。
例を挙げるで。ワイは最近デビュー小説を書いて出版したんや。テキストを書くのは問題ないけど、アーティストやないから、表紙や裏表紙のアートは人間に依頼せなアカンかったんや。
最初この小説を書き始めた時、AIで生成したアートはまだなかったんや。最初の数枚の表紙はワイ自身で作ったけど、あんまりよくなかった。ストック画像を使って、Photoshopで簡単に合成しただけや。まあ、なんとかなったけどな。
時が経って、本を真剣に取り組もうと思って、人間のアーティストを雇ったんや。コミッションアーティストを見つけて、カスタムの表紙アートに約1800ドル払ったんや。全部で1ヶ月くらいかかったな。仕事の順番待ちがあって、それから変更も加えたからね。
そして時間が経つにつれて、AIで生成したアートが良くなってきて、DALLEが出て、アイデアをブレインストームできるようになったんや。DALLE 2は本当にゲームチェンジャーやった。それからMidjourneyはさらに良かったんや。
そこで「よし、この表紙アートについてアイデアをブレインストームしてみよう」って思ったんや。1ヶ月かかるものを作るときは、計画が本当に重要やけど、AIで生成したアートなら、素早く繰り返し試せるんや。
LinkedInやYouTubeチャンネルで画像投票を投稿して、どのアートが一番好きか、どれが一番目を引くかを投票してもらえたんや。「どれが一番目を引く?」って聞くだけでええんや。
そうしたら、全く違うスタイルや、アートの異なるモチーフにすぐに絞り込めて、それが本当に刺さったんや。AIでどれが一番良いかワークショップできるなら、最終的なアートもAIで作ればええやん、ってなったわけや。
それで、別のアーティストにもう一つのバージョンを作ってもらって、二人の人間のアーティストと、人間のアーティストとAIのアートでABテストをしたんや。そしたら何やと思う? AIで生成したアートの方が、人間のアーティストよりずっと市場テストの結果がよかったんや。
これで測定可能なものができたわけや。Midjourneyの方が人間のアーティストよりずっと安くて、ずっと早くて、しかも良いもんができるんやからな。
これが「歩く」段階の例や。ただやみくもに「みんな、ChatGPTとMidjourneyを使え」言うんやなくて、ワイの趣味やサイドビジネスの中で、AIが完璧に意味を成す特定の場所を見つけたんや。
「AIを使って書いたり編集したりするのはどうなん?」って思うかもしれへんけど、これらのツールをしばらく使ってきて分かったのは、AIは編集には向いてへんってことや。一般的すぎるように訓練されとるし、感情的な共鳴もないんや。何が際立っとるかも実際には分からへんし、普遍的なテーマもAIはまだ拾えへんのや。
聞いたら「ええテーマに見えるで」言うけど、「これが本当に心に響いた」言うような感情的な価値判断はできへんのや。人間の編集者の方がまだずっとAIの編集者より優れとるわ。
ただ、段落レベルの文章やったらAIは役立つで。一つの段落を書き直すのを手伝ってもらうなら、その規模の構文や実行にはすごく長けとる。でも、シーンレベルになると分からへんのや。シーンも章も理解できへんし、本全体なんてもちろん理解できへん。信じてや、試してみたから分かるんや。
でも、少なくとも今年は表紙アートにはAIがめっちゃ優れとる。来年はまた違うかもしれへんけどな。
これが「歩く」段階の例や。そして「走る」段階は、これを運用化し始める段階や。一つか二つのツールを見つけたり、価値を見出した場所から学んだことを取り上げて、「よし、一つ成功したな。AIがこの特定の機能で数千ドル節約できたり、数週間の時間を節約できたりするのを経験的に見たな」って言える段階や。
そこから、もっと見つけ始めるんや。運用化し始めて、人々を訓練し始める。特にこれをする仕事を持つ人を作り始めるんや。自動化ツールチェーンやパイプラインを構築するか、他の人を訓練する特定の人を持つかもしれへん。「この成功を再現しよう」言うてな。これが「走る」段階や。
「這う」から「歩く」への移行は、「這う」のに退屈したらや。そこで快適ゾーンから一歩踏み出すんや。「歩く」から「走る」への移行は、一つのツールで本当に成功したときや。「ほんまや、AIが自分の人生や仕事、ビジネスに価値を加えられることを証明できた」って言えるときやね。
ちなみに、「這い、歩き、走り、飛ぶ」モデルは個人にも企業にも当てはまるで。
何かで時間や日数、週単位、数百ドルを節約するような測定可能な結果が出たら、「走る」段階に移行する時やね。そこでまた快適ゾーンから出て、「もっとツールを見つけよう、もっと自動化しよう、これらの技術からできるだけ多くの価値を絞り出そう」って言うんや。そしてそれらの原則を一般化し始めるんや。
そこまで来たら、AIと「走って」るんや。そこから本当にモメンタムを築き始めるんや。「歩く」段階で一つのタスクで数千ドル節約したところで、何百万ドルの収益がある会社やったら、組織全体にとってはそんなに大きな影響はないやろ。全体で30%の生産性向上は得られへんやろ。
でも「走る」段階では、もっと体系的になるんや。「よし、ゴムが道路に触れ始めたな。AIが我々のプロセスやビジネス、仕事に与える影響を本当に測り始めて、理解し始めよう」ってなるんや。
「走る」段階の例を挙げるで。開発者やIT部門、つまりビジネスの技術サイドの人たちに「数ヶ月AIを使ってきたけど、これからはインフラやIT、他の技術分野におる人は、これでコーディングを学んでもらう。スクリプトを学んで、もっと自動化していこう」って言うんや。これが一つの例や。「このバックログがあるから、これを自動化しよう」みたいな感じやね。
あるいは、コールセンターやデータセンターのチケット、ヘルプデスクのチケットなんかを扱っとるなら、この時点でのゴールやKPIの一つは、MTXかもしれへん。MTXは平均解決時間(Mean Time to Resolution)、平均診断時間(Mean Time to Diagnosis)、平均サービス復旧時間(Mean Time to Service Restored)のことや。MTXはつまり、何かの結果に至るまでの平均時間やね。
ChatGPTやClaudeみたいな技術を組み込んどるなら、あらゆる面でMTXを短縮しようとするんや。「みんなAIを使うようになったから、全てのチケットをより早く解決して、全てのプロジェクトをより早く完了させよう」みたいな感じやね。もちろん、時は金なりやからな。
これが一つの例や。マーケティング側に持っていくなら、「AIの画像生成ツールやコピーを書くAIツールを使えるようになったから、そのコピーや画像のABテストを自動化しよう」みたいな感じやね。これが「走る」段階や。
最後に、組織全体が追いついて、社内の専門知識を開発し始めたら…これが一番大事なことやで。内部で成熟度と専門知識を築いとるんや。個人の貢献者や技術リーダー、マネージャーの中から、理想的にはその全てから、AIのためのAチーム、頼りになるチームが出てきたら…
最後に「飛ぶ」段階で、ようやくセンター・オブ・エクセレンスを作る時やね。過去6ヶ月から2年、あるいはそれ以上AI成熟度を築いてきた人たちに「よし、このビジネスも人工知能も分かっとるな。今からうちのセンター・オブ・エクセレンスのリーダーや」って言うんや。
ここでようやく、ベストプラクティスを確立して、中央集権的な権威を持つ準備ができたんや。「AIがこのビジネスをどない動かすか、このビジネスにどない価値を加えるか分かっとる」って言えるようになるんや。
これが人工知能の導入と成熟のための「這い、歩き、走り、飛ぶ」モデルや。この明確でシンプルな導入のフレームワークが理解できたと思うで。
ワイの目標は、できるだけ多く、できるだけ早く産業界にAIを普及させることやからな。AIを使う人が増えれば増えるほど、その経済的生産性についてのコンセンサスが得られて、これからの経済的・科学的進歩がより堅固なものになるんや。
聞いてくれてありがとう。乾杯や!

コメント

タイトルとURLをコピーしました