アマゾンが考える汎用人工知能の未来 | SXSW 2024

25,167 文字

Amazon on the Future of Artificial General Intelligence | SXSW 2024
Portuguese and Spanish language translations for SXSW 2024 Keynotes and Featured Sessions presented by ItaúAmazon believ...

おはようございます、皆さん。満員の会場で嬉しいですね。私はライアン・ヒースです。AIニュースレターを書いており、Axiosのグローバル・テクノロジー担当記者をしています。そしてこちらはヴィシャル・シャルマさんで、アマゾンの汎用人工知能部門の責任者です。ヴィシャルさん、大変な仕事を任されているんですね。
ヴィシャル: ありがとうございます。
ライアン: これから1時間ほどかけて、アマゾン内外での有名あるいは悪名高い汎用人工知能への道筋について掘り下げていきたいと思います。ただ、まずはみんなが同じ認識を持てるようにする必要があると思います。というのも、現在のアメリカはAIに関して意見が分かれているからです。
そこで、議論の中での対立点や、AIを巡る信頼のギャップや恐れにどう対処できるかについて見ていきたいと思います。さらに、小規模な会社や起業家の方々に向けて、今後AIをどのように仕事に取り入れていけばいいかというアドバイスもしていきたいと思います。
まずはヴィシャルさん、簡単な質問からいきましょう。ここはサウス・バイ・サウスウエストの初めてのAIトラックですが、どうですか? これまでで一番面白かった人や考えは何でしょうか?
ヴィシャル: ああ、一つに絞るのは難しいですね。本当に嬉しいです。
ライアン: みんな優れているってことですね。
ヴィシャル: そうそう、まさにそうです。本当に満足しています。私はAIに長年携わってきました。ディープラーニングが登場する前から、約20年間AIに関わっています。世界最大級のアシスタント2つに携わるなど、様々な仕事をしてきました。それが今、実を結んでいるのを見るのは本当に嬉しいことです。今、AIで見られるアイデアの豊かさには目を見張るものがあります。一つだけ選ぶのは難しいですね。
ライアン: なるほど。この1年間、私たちは大規模言語モデル(LLM)に関するたくさんのハイプに溺れてきました。これは生成AIの最先端の一部ですね。でも、それはあなたにとってどんな感じですか? LLMはAIの一部分に過ぎません。AIには多くの種類がありますし、汎用人工知能への道筋ではないかもしれません。
アマゾンで行っているすべての取り組みを見渡したとき、このLLMはそのパズルのどこに当てはまるのでしょうか?
ヴィシャル: ああ、AIについて一般的に言えることは、多くのアイデアが試されてきたということです。どちらかというと進化的だったと言えるでしょうね。LLMや生成AIで起こったことは相当画期的だったと私は考えています。それは認めなければなりません。他のAIも多くの興味深い結果を生み出してきましたが、これは特別です。
明らかな指標がいくつかあります。例えば、チューリングテストは明らかなものの一つです。1950年代に提案されて、72年間続いてきました。
ライアン: そうですね。
ヴィシャル: 専門家の間では議論がありますが、現時点ではほぼ乗り越えられたと言えるでしょう。これは非常に画期的なことです。
アマゾンの観点から言えば、私たちは2つのレベルでAIを考えています。そして、アマゾンでのイノベーションも2つのレベルで起こっています。最高レベルで言えば、私たちが技術開発で始めたことの連鎖が、人類にとって非常に興味深い利益をもたらす鍵を握っているという深い認識があります。
人類が直面している最も深刻な課題や、最大の機会のいくつかが、これらによって解決されつつあります。これを正しく行えば、人類にとって豊かさの時代が開かれる可能性があります。まるで産業革命の第二幕のようなものです。
では、これはアマゾンでの実際のイノベーションにどう反映されているのでしょうか? 大きく3つの要素があります。よく3つの層で考えると言っていますが、すべての層でイノベーションが起きています。
基礎となる層はハードウェアとチップです。基本的にチップですね。ここでアマゾンは、トレーニングシステムやインターンシップシステムを持っています。よく話題に上がるものです。
2番目の層はモデルです。モデルに関するアマゾンの哲学は選択肢を提供することです。つまり、多様性を重視しています。
最上位の層はアプリケーションです。例えば、買い物をサポートするRufusアシスタントを作りましたが、これはとてもワクワクするものです。こんな風にイノベーションを進めています。
ライアン: なるほど。アマゾンはこれらの層すべてに関わっていますね。チップを作り、モデルを持ち、それらの調整を支援しています。でも、モデルについてもう少し掘り下げてみましょう。
多くの人が、ChatGPTについてたくさん聞いているので、数個のモデルしかないという間違った印象を持っているように思います。アマゾンが構築しているものに、どのくらいの数のモデル、数十個か数百個のモデルが関わっているのか、感覚を教えていただけますか?
ヴィシャル: ああ、たくさんのモデルがありますね。確実に数十個はあります。例えばAlexaを例に取ると、1つのモデルがすべてを動かしているというのは少し誤解があります。実際にはそうではありません。
Alexaの内部では、約30の機械学習モデルが連携して働いています。中にはかなり小さなものもあります。例えば、Alexaを呼び出すときに「Alexa」と言いますよね。その呼びかけを検出するのは、非常に小さなモデルで、デバイス上で動作しています。何もストリーミングされず、そこで起動されるんです。
それから、存在を検知するモデル、音声をテキストに変換するモデル、理解に関するモデルもあります。
このように、多数のモデルが関わっています。大規模なシステムを見れば、たいてい複数のモデルが含まれています。
ただし、生成AIに関しては、確かにモデルはより大きくなっています。そして今のところ、モデルを大きくすることの利点はまだ尽きていません。まだまだ発展の余地があります。
しかし、そういったモデルも1つだけではありません。例えば、AWSのBedrock プログラムを通じて提供しているものを見れば、そこにはMishraがあり、最近発表されたClaude 3もあります。Claude 3も含まれていますし、私たちが取り組んでいるモデルもあります。
つまり、大きな、と言いますか、多様なファミリーが生まれつつあるんです。
ライアン: なるほど。モデルが専門化していく傾向はどれくらい大きいのでしょうか? 一方では、今や何兆ものデータポイントで訓練されたモデルがありますよね。でも、まだうまくできない基本的なことがあります。明らかに批判的思考ができないし、自分で考えることもできません。何兆ものデータポイントがあっても、まだできないことがあるんです。
そこで、私たちのデバイスやエッジコンピューティングで実行できる小さなモデルや、特定のデータセットに特化したモデルの傾向が見られます。これは実際にその分野で正確な結果を出すためです。例えば、医療AIモデルなら、インターネット上のランダムな情報ではなく、医療データで訓練されるべきですよね。
このような傾向は、みんなのAI利用においてどれくらい広がっていくと思いますか?
ヴィシャル: それはすでに一つの傾向になっていると思います。今使っているどのデバイスでも、スマートフォンなどで、エッジで動作しているモデルがあります。多くのアプリケーションでは、それが最も効率的な計算方法なんです。
そういったものが見られるようになるでしょう。また、基本的な問題に常に最大のモデルを適用する必要はないというのも事実です。
例えば、あなたがビジネスオーナーで、基本的なQ&Aをしたいとします。顧客とのやり取りや、何らかのデータセットを使って訓練したいとします。必ずしも最大のモデルは必要ありません。
一方で、あなたが作家で、創造性や独特の言い回し、ユニークさを求めているなら、そうですね、より大きなモデルの方がより多くのことができるでしょう。
ただ、あなたの質問の中に、生成AIがすべてなのかという考えがあるように思います。ある程度。
そしてそこには、ある程度まだ判断がつかない部分があります。ちょっと哲学的な話になりますが、大きな疑問は、これらのモデルがより大きくなるにつれて、基本的に世界モデル、いわゆる世界モデルをそれらの中に含むようになるのかということです。つまり、世界の完全な理解ですね。
確かに、生成AIでは、これらのモデルがある程度驚くべきことをしています。画像生成、ビデオ生成、テキスト理解など、予想もしなかったようなことをしているんです。それは確かに起こっていますが、一方で、そうではないという説得力のある議論もあります。
言語にはある程度の抽象性があり、世界のすべてを完全に表現するには十分ではないと主張する専門家もいます。
例えば、ロボットがある空間を動き回ろうとしている状況を考えてみましょう。その空間には多くの側面がある可能性があります。例えば、庭園ロボットが庭にいて何かをしているとします。木の葉が動いていたり、草が動いていたりします。
それらすべての詳細な理解が本当に必要なのでしょうか? そしてもしそれを持っていたら、計算上禁止的になってしまうのではないでしょうか? つまり、コストの考慮が必要になってきます。
特定のデータトレーニングも必要になります。これは基本層にまで及ぶかもしれません。今日ではトランスフォーマーがありますが、他の選択肢もあるかもしれません。MAMBAや、業界で取り組まれているJABAなどのアプローチもあります。
ライアン: 後ほど汎用人工知能についてもう少し深く掘り下げることができるでしょう。アマゾンではどのような基礎研究を行っていますか? AIモデル開発の代替方法を積極的に探っているのでしょうか? それとも、顧客が求めているからといって、トランスフォーマーモデルと生成AIにすべてを投入しているのでしょうか? アマゾンは非常に顧客重視の組織ですからね。
みんながLLMが必要だと言っているので、LLMに集中せざるを得ないのでしょうか。
ヴィシャル: そうですね、それは組み合わせです。私たちは非常に顧客重視ですが、だからといって多くの研究活動ができないわけではありません。顧客重視というのは、常に顧客にとってどうすればより良くなるか、顧客がどんな利益を得られるかを考えているということです。
しかし、それを掘り下げていくと、顧客に革命的な結果や非常に良い結果をもたらす可能性を秘めた基礎的なことがたくさんできることがわかります。つまり、組み合わせだと言えるでしょう。
すべてを生成AIに賭けているわけではありません。すでに説明したように、今日使っている多くのモデルは生成的な性質を持っていません。
例えば、私たちの倉庫には、人間の従業員と並んで働くロボットがいます。明らかにそこにもモデルがあります。製品を見つけたり、拾い上げたり、視覚的に欠陥を検査したり、最適なピックパスを計画したりしています。これらは必ずしも生成的な性質を持っているわけではありません。
つまり、組み合わせなんです。
ライアン: なるほど、そうですね。AIの世界は本当に広いですからね。トランスフォーマーについて少し考えすぎているかもしれません。でも、これらの実践的な例について話していますが、アマゾンが行っている3番目のレイヤー、つまりアプリケーションレイヤーについて話しましょう。
言い換えれば、AIを扱う際に私たちが最も頻繁に接するものですね。20年以上にわたってAIをアマゾンの業務に組み込んできた実践的な例をいくつか挙げていただけますか? アマゾンの顧客として、私たちはそれをどのように体験しているのでしょうか? 気づいていないかもしれませんが。
ヴィシャル: ああ、あらゆる場所で体験していますよ。正直なところ、現時点で生成AIはどこにでもあると言えるでしょう。会社のかなりの部分がAIに触れていないところはほとんどないんです。
たくさんの例を挙げられます。例えば、アマゾンで広告を出したい広告主がいるとします。昨年のunBoxedカンファレンス、これは私たちの広告カンファレンスですが、そこで画像生成ができるようになったと発表しました。ライフスタイル画像を作れるんです。
広告業界に携わっている人なら、クリエイティブが広告の中で最もコストのかかる部分であることをご存じでしょう。今では、それを支援する自動化ができるようになりました。これが生成AIです。
アマゾンで販売しようとしている販売者がいれば、その商品リストも生成AIで強化できます。より魅力的で正確なものにするためです。
プログラマーなら、Code Whispererがあります。これは非常に優れた結果を出しています。コードやコードブロックを推奨してくれるんです。平均して、効率が57%向上すると記録されています。これはとても大きな進歩です。
最近の例では、5人のアマゾン開発者がJavaのアップグレードを行いました。どのバージョンだったか忘れましたが、2日間で1000のアプリケーションをアップグレードしたんです。これは驚くべき成果です。
それからRufusもあります。これは買い物の旅をサポートするものです。Alexaには「Let’s Chat」というプレビュー機能があり、Alexaをより会話的で流暢にします。
本当にたくさんの例を挙げられますね。これらすべてが顧客のために実現されているんです。
ライアン: アマゾン内のチームや会社全体での経験から見て、それは従業員の仕事にどのような影響を与えていますか? より多くのことができるようになっていますが、それは単に人々がより多くを生産しているということですか? それとも12時間労働をしなくてよくなったということでしょうか? 誰も解雇されているようには見えません。文字通り何百万人も雇用していますからね。
AIがより日常業務の一部になるにつれて、これらすべての要素がどのように再構成されていくのでしょうか?
ヴィシャル: そうですね、これは世間でよくある、いわばミームのようなものです。新しい技術で、非常に強力で、生産性に多くの利点があります。だから、みんな仕事を失うのか、どうなるのかと。答えは「いいえ」です。それが私たちの経験ではありません。
これは新しい技術が登場するたびによく起こる感覚です。多くの場合、その技術が経済に何をもたらすかまだ完全には把握できていないからです。しかし、私たちの経験では、これらの技術はそれぞれより多くの成長をもたらします。
例を挙げましょう。アマゾンの倉庫には75万台以上のロボットがあります。これは何を意味するでしょうか? 倉庫がより効率的になり、より安全になり、物事がより速く進むということです。
同時に、私たちはそれらの利益を取り、顧客により多くのものを提供するために再投資しています。その結果、過去数年間で従業員数は2倍になり、現在は150万人になっています。
これが私たちの予想です。常により多くのことをする余地があります。常により魅力的なことがあります。世界で生み出せる経済的価値や価値に上限はないのです。
そしてそれを指導原則とすれば、ただより多くのことが解放されるだけなのです。
ライアン: そうですね。私が触れようとしていたのは、AIに関する信頼と恐れの側面でした。
これらはアマゾン特有のものではないので、あなたの会社に特化して話すつもりはありません。ただ、私はこれらの信頼のギャップについて多くの報道をしてきました。すべてのデータから本当に浮かび上がってくるのは、アメリカだけでなく、西側民主主義国全体に当てはまることですが、彼らはAIを恐れており、ある程度AIの使用を控えているか、他の国、特にアジアの人々よりも限定的な方法でAIを使用しているということです。
こちらの人々は、大手テクノロジー企業や、AIにおいて規制当局が果たす可能性のある役割に対して、より懐疑的です。最も衝撃的だった数字は、AIに興奮している人の約5倍のアメリカ人がAIを恐れているというものでした。
毎日仕事に行くときに、それはどんな感じですか? あなたの仕事のすべては人々により多くのAIを提供することですよね。それは違和感がありませんか? そういった数字を見て、「ああ、わかった。どうすればこのギャップを埋めるように製品を変えられるだろうか」と考えますか? 実際にはその情報とどのように向き合っているのですか?
ヴィシャル: そうですね、私はSFが大好きなんです。正直言って、読んで楽しんだことのないディストピア的なAIの未来はほとんどありません。
そして、これらのことについて、ポピュラーメディアにはたくさんのミームがありますよね。制御不能になるスーパーコンピューターからターミネーターまで、スカイネットまで。スカイネットと言っちゃいましたね。
これらのことは存在します。現実にはあまり基盤がありませんが、AIには責任ある取り組みが必要だと言えます。なぜなら、AIは以前のインターネットのように、そして他の技術がそうであったように、多くの可能性を解き放っているからです。
そのような意識を持って取り組む必要があります。そのためにいくつかの原則が生まれつつあります。興味のある方は、私たちのTitan Text LLMサービスカードをご覧ください。ちょっと長い名前ですが、Titan Textは基本的に企業に提供しているLLMモデルのファミリーです。
そこにはサービスカードがあり、責任に関するいくつかの原則が強調されています。さまざまな方法で表現できますが、私にとって理解しやすく、共感を呼ぶと思われる3つを挙げたいと思います。
ライアン: ちなみに、これはルイーズ・クレイバーさんからの質問にほぼ答えていますね。AIに関する3つの倫理的課題について知りたいとのことでした。
ヴィシャル: ルイーズさん、ありがとうございます。
最初の原則は真実性です。AIが根本的に幻覚を起こさず、真実に基づき、正確であることを望みます。これはかなり広い定義で、幻覚なども含みます。これは意図的なものではなく、モデルで起こることの副作用に過ぎません。
2つ目は安全性です。
ライアン: はい。
ヴィシャル: ここでは、広範なレッドチーミングなどを行います。これらのモデルをテストし、様々な状況でどのような結果が生じるかを確認する必要があります。
3つ目の点は、それに関連する制御可能性です。
ライアン: はい。
ヴィシャル: ここでの考え方は、大まかに言えば、AIモデルと広く似たような状況下で、広く似たような一連の入力で相互作用する際、広く似たような出力や結果が得られることを期待するということです。ある程度予測可能であるべきだということです。
これら3つの概念が、多くのことを生み出します。透明性や説明可能性などです。
ライアン: AIを真実に基づかせる一つの方法として、検索拡張生成(RAG)と呼ばれるものがありますね。これが最良の方法でしょうか? AIが自分のソースを証明し、あなたがその作業をチェックできるようにするために、どのような方法が最も有用だと感じていますか?
ヴィシャル: はい、RAGについて話す前に一つ指摘しておきたいことがあります。
RAGは非常に興味深く、価値があります。ただ、業界で長らく議論されてきたことを認識しておく必要があります。一つの考え方があります。わざと極端な説明をしますが、要点を明確にするためです。
その考え方では、必ずしも根拠付けに行く必要はないと言います…RAGの全ポイントは、真実の構造化されたセットだということです。例えば、RAGは「タリンはエストニアの首都である」といった事実を扱います。それであっていますよね? はい、合っています。タリンはエストニアの首都です。
これは単なる事実です。どんな状況でもモデルがこれについて幻覚を起こしてほしくありません。そこで、参照できる真実のリストを持つことができます。これは知識グラフとして組織化されたり、ベクトルデータベースとして組織化されたりと、様々な方法でその組織化を作ることができます。
そして、その状況では「真実」が保証されます。引用符付きの保証ですが。
別の考え方では、モデルが十分な能力を持つようになれば、この真実がモデル自体に織り込まれるのは時間の問題だと言います。つつまり、十分な能力を持つモデルの特性として、根拠付けが現れるということです。
ライアン: なるほど。オープンソースモデルでは、閉じたモデルでそれがどのように起こるのでしょうか?
ヴィシャル: はい、これらの議論の流れはすべて進行中です。まだ起こっていません。これに関するいくつかの論文があり、構造化された根拠付けが常に必要だと主張しています。
これらの議論の中には、ほとんど最も基本的で根本的なレベルまで遡るものもあります。つまり、トランスフォーマーが実際にこれを生み出せるのか? 他の技術がこれを生み出せるのか? 判断はまだついていません。多くの研究が行われています。
長い話を短くすると、根拠付けは必要です。現在、それを可能にするいくつかの技術があります。今のところ、私の経験では、RAGが最もよく機能する技術だと言えるでしょう。
ライアン: はい。
ヴィシャル: もし他にも人々が遭遇した技術があれば、ぜひ聞いてみたいですね。
ライアン: はい、質問があればヴィシャルさんに聞いてみましょう。
安全文化について考えると、安全なモデルを構築するための技術的な側面がありますが、これの多くは文化的なものです。AIリテラシーが必要で、プロセスの最初の段階で倫理について教育する必要があります。
そして、オープンモデルと閉じたモデルについて大きな議論があります。レッドチーミングについて聞いていると、オープンソースの一つの見方として、北朝鮮の金正恩にモデルを渡すのは本当に危険かもしれません。
別のレベルでは、オープンソースにすれば常にレッドチーミングを行い、モデルを再調整できます。これらの議論はアマゾン内でどのように扱われているのでしょうか? あなたの見解を教えてください。
ヴィシャル: それは素晴らしい質問です。本当に良い質問ですね。
まず一歩下がって、会社の文化について触れたいと思います。アマゾンについて理解しなければならないことの一つは、この会社にはリーダーシップ原則という概念があるということです。これについては広く公開されていますので、ご覧いただけます。
全従業員を統一する一つのリーダーシップ原則があります。皆がそれを聞き、内面化しています。それは「成功と規模は広範な責任をもたらす」というものです。
私はこれをその傘下に置いています。つまり、強力な技術を生み出すなら、それに伴う責任があるということです。そういう意味で、先ほど話した3つのこと、真実性、安全性、制御可能性は本質的な要素です。絶対にそうです。
これは閉じたモデルとオープンモデルの両方に当てはまります。他の人は違う言い方をするかもしれませんが、これらの原則は適用されると思います。これが一つの側面です。
もう一つの側面は、インターネットと同じように、AIが進化し登場したときに新しい課題や機会が生まれ、それに適応しなければならなかったことを認識する必要があるということです。例をたくさん挙げられますが、皆さんにもなじみのあるものでしょう。
ライアン: はい、具体例を挙げてください。みんな具体例が大好きですから。
ヴィシャル: 一つの例として、ソーシャルメディアでのサイバーいじめがあります。これは一例ですね。AIがどのような機会を切り開くのか、どのような課題を投げかけるのか、まだわかりません。だから、それに適応していく必要があります。
AIについて新しいことが発見されるにつれて、安全性を確保するための枠組みを進化させ、前進し続ける必要があります。これは非常に重要です。
別の側面もあります。アマゾンにはこういった慣行がたくさんありますが、それをパートナーにどのように広げていくかということです。私たちは多くの企業や人々と協力していますから、AWSを通じて人々を教育することは非常に重要な要素です。
教育資料を提供していますし、ツール自体に組み込むという側面もあります。先ほど画像生成について話しましたが、当然、悪いことをしないようにする必要があります。
ライアン: なるほど。アマゾン内部でこれらの原則について全員の意見を一致させるにはどうしていますか? これは今や新入社員研修に組み込まれているのでしょうか? 「よし、我々は生成AIに全力を注ぐ。ここにルールがある」というような大規模な社員研修を行ったのでしょうか?
どこかの細かい文字を読むことを信じるのではなく、どうやってみんなにそれを守らせているのでしょうか?
ヴィシャル: はい、リーダーシップ原則がその中核的な要素です。この概念を広め、全員が共有していることを確認するのに役立っています。頻繁に繰り返されています。
他の大規模組織と同様に、倫理や行動、原則のシステムを確立し、それに従うのです。「繰り返しは祈りを台無しにしない」という言葉がありますね。多くの状況でそうです。そういう側面があります。
しかし、先ほど言ったように、形式的になりすぎずに、AIで起こることに適応していく必要があります。確かに、AIにはいくつかの特性が現れつつあります。例えば、少し技術的な話になりますが、誘導ヘッドの概念などがあります。途中で発見されることもあります。
スケーリング則も観察されています。時間とともに他の原則も出てくるでしょう。半導体が大きくなる前にムーアの法則は存在しませんでした。メトカーフの法則も、人々がソーシャルネットワークやネットワークについて本当に考え始める前には存在しませんでした。
他の法則もまだ発見されていない可能性がありますが、それは時間とともに明らかになるでしょう。
ライアン: リチャード・グッチの質問を画面に表示しましょう。AIがあなたを驚かせた例を共有してくれますか?
ヴィシャル: ああ、リチャードさん。私のキャリアの中で、そういった例はたくさんありますよ。
ずっと昔のことを思い出します。1999年頃まで遡りますが、ある技術を試験的に使っていて…
ライアン: その時、あなたは博士課程の学生だったのですか? それとも既に働いていたのですか?
ヴィシャル: 実は、30年間博士課程の休学中なんです。
ライアン: なるほど。
ヴィシャル: いつかは。分散システムです。
ライアン: わかりました。その博士課程について話してください。
ヴィシャル: いつかは。分散システムです。これも大好きなんです。それについても話せますよ。
ライアン: わかりました。では、IDセクションでそれについて話しましょう。
ヴィシャル: そうですね、当時は、私たちが扱っていたカタログがあって、そこのアイテムを分類しようとしていました。今日では非常に基本的と考えられるようなクラスタリング技術を使って、それらをクラスタリングしていました。
いくつかの例を与えるだけで、厳密なルールを定義する必要がなく、これらのものをクラスタリングできるのは魔法のようでした。それを見るのは本当にワクワクしました。まるで…
ライアン: それは良い驚きだったんですね。
ヴィシャル: そうです、良い驚きでした。何かがこれらのものを結びつけているような感じでした。それは本当にワクワクしました。
もう一つの例は、それから何年も後のことで、ディープラーニングが登場し始めた頃です。画像を取り、そこに猫がいるかどうかを分類しようとしているプロジェクトに触れる機会がありました。
テック業界の人々は猫が大好きですよね。皆さんも猫が大好きでしょう。ここに猫が嫌いな人はいますか?
それで分類していて、異なる層で何が起こっているかを見ていました。ある層で、猫の輪郭が抽出され、現れ始めているのが見えました。
それを調べてみると、システムにそのような抽出をプログラムしていないのに、それが自然に起こっていたんです。ある程度自己組織化しているのを見るのは、本当に魔法のようでした。
ライアン: そうですね、それは実際に汎用人工知能(AGI)と自己組織化の問題に入る良い方法です。明らかに、人間または能力のある人間の原則の一つは、自律性と自分の人生や家族を自己組織化する能力ですからね。
AGIの定義とは言えないかもしれませんが、アマゾンがAGIを「顧客のニーズと欲求を即座に理解し、予測し、達成する安全で制御可能なAI」と定義していると思います。他にもいくつかの定義がありますが、私にはこれは今日話している種類のAIとは異なるものを描写しているように思えます。
これは一歩先を行っています。11月にサム・アルトマンは、LLM以上のものが必要になるだろうと言っていました。Metaのヤン・ルカンは基本的に白紙の状態から始めて、AGIに対する異なるアプローチを考え出す必要があると考えています。
そして今朝、Verses AIというスタートアップに関する記事を公開しました。彼らは実際に自然ベースのアプローチが必要だと考えています。生物学的生物を再構築し、単一または融合した超知能システムを目指すのではなく、小さなAGIのウェブを作る必要があるというのです。
これは少しあなたの博士課程の分散知能のアイデアに戻ります。アマゾンが目指しているAGIの種類と、AGIに到達したときの枠組みについてのあなたの考えを聞かせてください。これらの小さな専門AGIの大きなネットワークやウェブを持つことになるのでしょうか? それとも今日のテクノロジー市場のように、いくつかの大きな支配的なシステムに向かっているのでしょうか? あるいは国家的な超知能のような主権AGIを持つことになるのでしょうか?
ヴィシャル: ああ、深い質問ですね。
ライアン: ちょっとした質問です。
ヴィシャル: 全然難しくありませんね。一つ訂正させてください。実は博士課程は修了していないんです。
ライアン: なるほど。
ヴィシャル: その点で功績を主張したくはありません。少なくともまだですが。
ライアン: でも、その博士課程についてもう少し教えてください。どんなことを考えていたのですか? それはある意味でAGIに向けられていたように思えますが。
ヴィシャル: そうですね、それについて具体的に話すことなく言えば、複数のエージェントやノード、マシンがある場合、それらをどのように調整し協力させるかという考え方があります。これは明らかに多くの状況で必要になる可能性があります。
分散システムには、緩く結合されたものと密に結合されたものという概念があります。非常に密に結合されているものは、すべてが同じメモリを共有し、そこから操作できるものです。緩く結合されているものは、単にメッセージを交換するようなものです。両方にメリットとデメリットがあります。
私が言いたいのは、今日の技術の世界は、そしておそらく進化していく世界は、これらのものの組み合わせになるだろうということです。テック業界でもこれについて行ったり来たりしているのが見られます。
世界は昔、メインフレームとクライアントサーバーから始まりました。巨大なシステムがあり、それほど賢くないターミナルがぶら下がっていました。それからクライアントサーバーにやや分散化されました。
ライアン: はい。
ヴィシャル: ウェブとインターネットの出現により、さらに分散化が進みました。そしてクラウドコンピューティングが登場しました。これには固有の経済的効率性があり、技術的な能力も向上したからです。つまり、行ったり来たりしているのです。
個人的には、これらのものが共存する異質な世界が見えると思います。小規模で焦点を絞ったモデル、小規模で焦点を絞ったAIが動作しているのは間違いありません。今日でもそれらは大きな効果と利益をもたらしています。そして、より大規模なものもあります。
AGIのGは「一般化」を意味します。
ライアン: そうですね。
ヴィシャル: そこには、これらのモデルがますます一般化され、人間の専門知識レベルでより多くのことができるようになるという固有の概念があります。
ライアン: はい。
ヴィシャル: そして、それがAGIの概念です。ただし、AGIの正確な定義を得るのは難しいことはご存知の通りです。
AGIの専門家10人に聞けば、10通りの説明が返ってくるでしょう。しかし、一般化の概念はそこから生まれると言えるでしょう。
ライアン: そうですね。
ヴィシャル: さて、単に大きなモデルを作ることは、小さなモデルをより良くする可能性もあります。なぜなら、蒸留のようなことができるからです。
ライアン: はい。
ヴィシャル: 大きなものを取り、それをより焦点を絞ったものにすることができます。そして、より分散した状況もあり得ます。
あなたが言及していたスタートアップについては、あまり詳しくありませんが、すべてが分散化される世界という考え方は興味深いですね。
現在の開発の軸は大きなモデルを中心に展開されています。そこにはいくつかの効率性があることがわかっています。おそらく大きすぎて、必ずしもそれほど大きくする必要はないかもしれません。どのように進化していくかはまだわかりません。
ライアン: そうですね、大きなモデルは特定のタスクで利点があるように思えます。しかし、他のタスクもあります。ヤン・ルカンが言及しているのはこれです。
彼はこう言っています。「これらのモデルには何兆ものパラメータがありますが、食洗機を空にする方法をロボットに指示することができません。しかし、私は10歳の子供に30秒で食洗機の使い方を教えることができます」と。これら何兆ものパラメータが、このような基本的な人間のタスクを実行できないのなら、何の意味があるのでしょうか?
そこで彼の考えは、基本に立ち返り、赤ちゃんがどのように学ぶのか、そして私たち生物学的生物として、体内のすべての細胞がどのように相互作用し、互いに通信しているのかを考える必要があるというものです。それがどのように起こるのかを理解し、それらすべてが互いに話すようにしない限り、最終的には超知能や一般知能と呼べるようなものには到達しないだろうというのです。
ヴィシャル: はい、超知能という言葉は使いたくありません。一般化された知能については…
ライアン: 超知能は単一の支配者を暗示しているからですか? それとも他に何か否定的な意味があるのでしょうか?
ヴィシャル: それは今日の専門用語ではないからです。AGIに10の定義があるとすれば、超知能という言葉を使えば、100万の定義が生まれるでしょう。
単に、みんなが同じものを想像するわけではありません。これは単に意味論的な問題に過ぎません。
私が言いたいのは、AIに関してより基本的な作業が必要であるということは確かにそうだろうということです。現在我々が持っている技術が全てではありません。その意味では、それは正確だと思います。
しかし、これは少し前に言ったことに戻ります。世界モデルが十分に大きなLLMの中に含まれているという仮定は公平でしょうか? そしてそれは推論できるのでしょうか?
例えば、十分な言語を使って、猫が歩く行為をn次元まで詳細に描写できれば、十分に大きなシステムが単に言語について十分に学ぶことで理解できるでしょうか?
ライアン: そうですね。
ヴィシャル: この点については意見が分かれています。完全な合意はありません。今日存在する最大のモデルでも、特定のことができないという非常に有効な指摘があります。あるいは、時にはそれらを効率的に行うことができないだけかもしれません。
ライアン: はい。
ヴィシャル: それは有効な指摘です。画期的な研究や開発が登場するのを見ることになるでしょう。それはおそらく事実です。
ライアン: さて、ここで聴衆からの質問をいくつか取り入れましょう。ジュリアス・リーヴィッシュが「近い将来、アマゾンが克服しなければならない最大の技術的障害は何ですか?」と質問しています。これはAGIへの道に関連していると解釈しますが、他のことについても触れてください。
ヴィシャル: そうですね、私たちは長い間AGIに取り組んできました。Alexaはその初期の例です。何百万もの家庭に入り、ポピュラーカルチャーの一部となっています。それについての歌もありますし…
ライアン: 歌も作られていますね。ここではとても人気があります。
ヴィシャル: そうです、私たちは長い間これに取り組んできました。一つ言えることは、AGIの追求とAGIに到達するために、ある時点で突然「AGIはまだここにはなかった」が「今日AGIがここにある」と決定する瞬間はおそらくないだろうということです。それはおそらく起こりません。一連の発展があるでしょう。
そして私たちはその旅の途中にいると思います。おそらく20年前からその旅にいると言えるでしょう。そう感じないかもしれませんが、私たちはその途上にいるのです。
私たちは会社のほぼすべての側面でAIを使用しています。先ほど言ったように、ショッピング、ロボティクス、どの例を取っても、それは続いて適用されていくでしょう。
興味深いのは、これまでに存在しなかった可能性を解き放つことです。
ライアン: はい。
ヴィシャル: 例えば、自動運転があります。Zooxユニットが自動運転に携わっており、他のユニットもこの性質のものに取り組んでいます。
私の考えでは、最大の技術的障害は、人々や人類にとって非常に価値があり、まだ解放されていない使用事例を解き放つことです。
ライアン: そうですね。あなたの夢のリストは何ですか? 退職までにこれができたら本当に成功したと思えるようなことは何でしょうか?
ヴィシャル: そうですね、次の産業革命という概念に内在するもの、豊かさの時代を解き放つという概念に内在するものは、可能になる使用事例の広がりと利益が限りなく、ほとんど限りがないように感じられるだろうということです。
私の心に近いアイデアの一つは、AGIをすべての人に、すべての状況に適用するという考えです。特に今日挑戦的な状況に適用することです。
例を挙げましょう。世界の発展途上地域で医師をしているとします。薬が不足し、情報も不足しています。患者が来たとき、どのように接し、診断し、治療するのでしょうか?
ここで、メモを取り、患者の病歴を把握し、その地域の健康状態や病気の傾向、さらにはその地域で利用可能な薬についても考慮に入れることができる助手がいると想像してください。そして診断を行い、いくつかの代替治療法を提案することができるのです。この人の人生に与える影響は絶大でしょう。これは本当に魔法のような応用例です。
あるいは、中学生が授業についていくのに苦労しているとします。彼らは原理やトピック、基礎について特定のレベルの理解を持っています。そして今、別のレベルに到達する必要があります。
今日私たちが持っているのは、経済的な理由から、これらの画一的な橋渡しです。何とかしてその橋があなたに合わなければなりません。そしてそれがあなたが渡る方法です。一方、AGIが可能にするのは、本質的にはるかに柔軟になり、あなたを考慮に入れ、あなた自身のペースで、あなたに合う方法で、あなたが理解している原則を使って、あなたが行く必要のある場所まで導くことです。
これは本当に魔法のようです。どうぞ。
ライアン: パーソナライゼーションの点については同意します。最近、多くの議論があり、AIが超能力を持つアシスタントのようなものだという話に絞られてきています。
それは素晴らしく聞こえますが、私が投げかけたい課題は、異なるAIシステムを使おうとした多くの場合、それが最小公分母や平均、陳腐な表現に基づいているのではないかと心配になることです。特に、派手な自動補完をしているだけの場合です。
そこで私の質問は、これは神経多様性のある人々にとって何を意味するのでしょうか? 私自身もその一人だと考えています。私は自分を箱に押し込もうとしたり、自分の脳の働き方と合わないものを望んでいません。
私たち一人一人のためのAGIを想像することはできるでしょうか? それとも、それは遠すぎる夢でしょうか? いくつかの巨大なAGIがある代わりに、実際にこれらの非常にパーソナライズされたAGIを持つことができ、他の人の箱やラベルに押し込められることなく、本当に超能力を持つ本物のアシスタントとして機能するような世界を想像できるでしょうか?
ヴィシャル: まず、あなた自身のことを共有してくださってありがとうございます。本当に感謝します。
そして、はい、AGIによって人々とのインタラクションをますますパーソナライズする能力が得られると思います。正直なところ、もっと些細な例を挙げると、私は朝と夜で同じ人間ではありません。
朝は仕事に向かおうとしています。より集中しているかもしれません。AIに何を見るべきか、何をすべきかなどを提案してほしくありません。簡潔な応答が欲しいです。具体的なやり取りが欲しいです。私がしようとしていることを手伝ってほしいのです。
夜には気分が変わっているかもしれません。もっとリラックスしているかもしれません。料理のレシピのアイデアや、エンターテイメントの選択肢など、何か別のことを教えてほしいと思うかもしれません。
これは神経多様性のような、もっと重要なことにも適用できると想像できます。AGIはあなたとのパーソナライゼーションをはるかに高度に行い、あなたに関する個人的な文脈を維持できるようになるでしょう。それは何でもいいんです。好きな音楽かもしれません。好きな食べ物かもしれません。あなたの気分かもしれません。社会的な交流かもしれません。これらすべての側面です。
ライアン: はい。
ヴィシャル: 別の言い方をすれば、ある程度、本質的にあなたのモデルを持つということです。そして、あなたに合ったスタイルでコミュニケーションを取り、適応できるようになるのです。
だから、あなたの希望は実際によく根拠があると思います。
ライアン: そうですね。公平を期すために言えば、時々私たちは自分に嘘をつくこともあります。自分が思っているほど独特ではないとか、自分が思っているほど違っていないと考えることがあります。なぜならそれは自分に語る素敵な物語だからです。
そして、ソーシャルメディアの多くのアルゴリズムから今気づいているのは、AIは「実際、私たちは思っていたよりもお互いに似ています」とか、「私たちは賢い人間で、様々な生活様式や考え方を持っていると思っていますが、実際には思っているほど繰り返しがないわけではありません」ということを示しているようです。時にはAIは私たち自身よりも私たちのことをよく知っているようです。
ヴィシャル: そうですね、私たちの類似点を祝福し、違いも祝福すべきです。両方とも私たちの人生に大きな価値を加えていると思います。
ライアン: そうですね。
ヴィシャル: もちろんです。あなた自身の個人的な利益のために、あなたに合った方法で行われる限り、それを反映されることは必ずしも悪いことではありません。信頼できる友人がいるようなものです。それがAIが進むべき方向性です。
他のレベルでも非常に有益です。例えば、メディアを消費するとき、どれだけのメディアを消費しているかを知り、それを意識することは良いことです。過去1ヶ月間に行ったすべての場所を追跡し、それを振り返るだけでも価値があります。
ライアン: でも、その数字を見て実際に何か変えていますか? 私はただ説教されているように感じるだけで…ああ、今日もまた9時間も電話に費やしてしまった。でも何も変えようとしません。
ヴィシャル: (笑) そうですね、これは少し別のトピックですね。私が言いたいのは、私たちが長い間AIで取り組んできた別の側面として、アンビエントコンピューティングがあるということです。
これは私たちが行っている非常に大きな側面です。その考え方は、人々が常に頭を下げて生活するのではなく、頭を上げて外に向かって話せるようにしたいということです。Alexaで見られるものは実際にそこから来ています。コンピューティングをあなたの人生に織り込みたいのであって、それを中心にしたくはありません。
必要なときに使い、必要ないときは背景に消えていくようなものです。
ライアン: そうですね、奇妙なことに、それは今、具現化されたAI、例えばロボットとAIの使用について考えさせられます。Alexaは、60年代のジェットソンズのアイデア、つまり私たちの前を車輪で動き回り、サンドイッチを作り、子供の世話をするアシスタントを持つというアイデアとは逆のようです。
そして、あなたが話しているAIは背景に消えていくものです。アマゾンではこれらの選択はどのようになされているのですか? 倉庫では具現化されたAIまたはAI駆動のロボットを持っていて、一方で背景に消えていくものもあります。それぞれの使用事例によって異なるのでしょうか? これらの問題をどのように扱っているのですか?
ヴィシャル: それは本当に顧客の利益に焦点を当てています。
顧客が使用し、生活の一部として持つことが良いものは何か、それに焦点を当てています。実際、倉庫以外でもロボティクスを行っています。例えば、Astroロボットがあります。これはあなたの周りを動き回り、いろいろなことをしてセキュリティを高めるロボットです。
ライアン: ああ、それは知りませんでした。
ヴィシャル: アマゾンからそのロボットを購入できます。
ライアン: アマゾンからロボットを買えるんですね。
ヴィシャル: はい、購入できます。小さくて、あなたの周りを動き回ります。
そう、私たちはこれらのことを調査し、投資しています。繰り返しになりますが、顧客中心であることが重要です。これは実際にリーダーシップ原則の一つで、文字通り「顧客への執着」と呼ばれています。それがその一つの要素です。
私も具現化されたAIにワクワクしています。それはAIの境界線をいくつかの興味深い方法で押し広げているからです。既存のものの限界について話しましたが、具現化されたアプリケーションを検討する際に興味深い考え方が生まれています。視覚入力を取り入れたい、音声入力を取り入れたい、それらすべてをマルチモーダルなアプローチで組み合わせたいと考えています。
ライアン: これらは独立したAIツールなのでしょうか、それともAIを搭載した義肢のようなものについて話しているのでしょうか? どのようなものを想定しているのですか?
ヴィシャル: そうですね、AGIのGは一般化を意味します。
したがって、これらのアプリケーションがすべて存在し、それから恩恵を受けない理由はありません。
ライアン: そうですね。
ヴィシャル: すべてが含まれると言えるでしょう。
ライアン: なるほど。議論の最後の四分の一に入ってきました。AIがあなたを驚かせたことや、構築したい夢のようなものについて聞きましたが、あなた自身の仕事や家庭生活を改善するための「キラーアプリ」は何でしょうか? AIについて。今のあなたの生活で最も欠けているものは何ですか?
ヴィシャル: まず、私の家庭生活は現在でもAIによって非常に改善されています。それは様々な面でのことです。
Alexaは間違いなく私の生活を改善しています。そこからいくつかの具体的なことを取り上げることができますが、それらはかなり興味深いものです。実際、これは先ほどの質問に戻ります。AIがあなたを驚かせたときの例です。
例えば、Alexaには「Hunches(直感)」という概念があります。ご存じかもしれませんが、これはAlexaを使って家をコントロールしている場合、つまり照明のオン・オフなどを行っている場合に機能します。
毎晩寝る前に決まったルーティンがあるとします。テレビを消し、照明を消し、裏口をロックし、ベッドに入り、眠りに落ちるのを助けるためにホワイトノイズをオンにします。そしてある晩、裏口のロックを忘れたとします。
ライアン: はい。
ヴィシャル: よくあることですが、Alexaがそれに気づき、AIがそれを認識して「裏口をロックしますか?」と尋ねます。これは、あなたの生活のセキュリティと安全性を本質的に高めるものの一つです。
ライアン: ゴミを出している間にそれをされたら、閉め出されてしまいますね。
ヴィシャル: そういうこともありますよ、確かに。
ライアン: 一度夫をアパートの外に閉め出してしまったことがありますから、心配しないでください。そういうことは起こります。
ヴィシャル: きっとそのことについて聞かされたでしょうね。
そうですね、ここでの考え方は、これが私たちの生活のあらゆる側面に利益をもたらすということです。安全性とセキュリティに関することを考えることができます。
常に、難しい状況にあった人々についてのメールやコミュニケーションを受け取っています。例えば、ある紳士が階段から落ちて、一人で家にいたときに、Alexaを使って助けを呼び、誰かが来て救助したという事例がありました。
安全性を確保し、セキュリティを確保することは非常に重要な基本的なケースです。そして、より創造的になるのを助けることまで、人生でより充実感を得るのを助けることまで、それはマズローの欲求階層のようなものです。
ライアン: はい、はい。
ヴィシャル: AGIはその範囲を網羅し、すでに様々な程度でそれらすべてを可能にし始めていますが、これが私のポイントです。それは一つのプロセスであり、特定の時点ではないのです。
ライアン: そうですね。ChatGPTが登場して以来、企業がAIをプロセスに統合しようとする中で、私を驚かせたことの一つがあります。一部の企業が先行し、一部が規制上の影響を恐れて躊躇するなど、AIの採用に異なる道筋があると予想していました。
人々がAIを生産性の向上のために使用するようになるとは予想していませんでした。より創造的な方法で何かをしたり、まだ行っていないことをするためにAIを使用すると思っていました。しかし、多くの組織が単に生産性と効率性の側面に注目しています。
創造的な側面が解放される特定の時点があるという感覚はありますか? それとも、私たちがもっと慣れ親しんで快適になってから創造性に目を向けるのでしょうか? それとも、これを創造的な目的で使用するべきだということが明らかになる異なるタイプのAIが必要なのでしょうか?
ヴィシャル: それは非常に興味深い質問です。
質問の背後にある仮説に完全に同意できるわけではありません。
ライアン: 同意しなくて構いません。私は反論されたいのです。
ヴィシャル: その理由を説明しましょう。私の感覚では、それらの生産性の側面の多くは実際に創造性に関連しているからです。エッセイを書くこと、ブログ投稿を作成することなどかもしれません。
確かに、人々がそれに取り組んでいるのは、それが多くの人にとってより直接的で具体的な方法で経済的価値につながる創造性の側面だからです。そのため、その方向に向かわせるのです。
しかし、おそらく世界には以前よりもはるかに多くの詩が書かれていると思います。その質については保証できませんが、おそらく世界にはより多くのリメリックや詩、お気に入りのジャンル、俳句や歌があると思います。
そして、これは一種の説明のようなものになると安全に予測できると思います。
ライアン: はい。
ヴィシャル: これは以前から起こっていることです。例えば、人々が写真に適用するフィルターなどを見てください。これは継続的に展開されていくでしょう。
再度言いますが、バニラな要素以上のものが起こるという考えには全面的に賛成です。すでにそうなっています。私たちはマルチモーダリティについて考えています。画像を取り入れるなどのことを行っています。
確かに、私たち自身も書かれたテキストから音声を合成するなど、LLMベースではない異なる技術を適用しています。しかし、LLMが行ったことは、この旅を加速させたということです。
以前よりも大きな能力の飛躍が見られたのは久しぶりのことでした。そのことは否定できません。だから、生成AIは常にその位置を占めると思います。AGIに向けて段階的に私たちを移行させた最初のものだったという意味で。
ライアン: そうですね。ニールスがここで質問をしています。これはそれに関連していると思います。
質問は「AGIを手に入れたら、知能の爆発が起こると思いますか?」というものです。これは豊かさの点に戻るのかもしれません。LLMでこのように急激な進歩があり、AGIに向かってそのように進み続けることができるのでしょうか?
ヴィシャル: はい、ニールスさん、知能の爆発はすでに進行中だと思います。
例えば、あなたが何か考えたり、質問があったりしたとき、夕食のテーブルで誰かと何かについて議論していて、文字通りAlexaや検索、あるいは他の多くの技術に向かって「エストニアの首都は何?」と尋ねることができます。誰かがヘルシンキだと言いますが、そうではありません。そしてその議論を解決できます。
これはすでに私たちの世界に知能をもたらしていると言えるでしょう。それがさらに加速し、どんどん大きくなっていくでしょうか? 間違いなくそうなると思います。そして、私の意見では、それは世界にとって素晴らしいことになるでしょう。責任を持って行う限り、驚くべきことを解き放つことになるでしょう。
ライアン: さて、ここにいる人々が、例えば自分の会社内であなたのアドバイスをどのように適用できるかについて考えてみましょう。
ここには多くのスタートアップがあり、少なくとも多くの創業者がいます。AIを構築しようとしていなくても、AIを利用する必要があることは分かっています。AIのオプションを検討している人々に対して、どのようなアドバイスがありますか? また、もし誰かがそれを行えば、アマゾンの世界に入ってこられるような、まだ十分にサービスが提供されていない機会の分野はどこでしょうか?
ヴィシャル: 良い質問ですね。
私自身も起業家だったので、その立場にいたことがあります。これらのことについて定型的に考えるのは難しいです。もし機械学習で博士号を持ち、数学の博士号も持っていて、トランスフォーマーはそうではないと決めた人がいて、トランスフォーマーを凌駕する次の基本的なものを発明しようとしているなら、どうぞやってください。ぜひ見てみたいです。
特にスタートアップの取り組みにAIを組み込むことに関する一般的な考えについて言えば、こう言いたいです。AIは完璧ではありません。それを認識してください。AIが完璧になるという前提で会社を作らないでください。
今日存在する不完全さとは何でしょうか? 例えば、答えを生成する際の遅延があります。生成される画像が完璧ではないかもしれません。余分な腕を持つカンガルーのような、やり方によっては…
ライアン: あるいはケイト・ミドルトンですね。余分な腕ではなく、ジッパーの4分の1インチでした。彼女は大変な批判を受けています。
ヴィシャル: そうですね。適切なプロンプトを使えば、余分な腕を得ることもできるでしょう。
そういったことが起こると想定してください。つまり、あなたが取り組んでいる製品や提供しているものは、それに対して弾力性を持つ必要があります。それに対応する余地を設ける必要があります。これが最初に言いたいことです。
2つ目に言いたいのは、AIに賭けるべきで、AIに対して賭けるべきではないということです。
つまり、AIが進化し続け、より能力が高くなっていくことを認識してください。それは非常に急速に起こっています。おそらく、それに適応し進化する会社の概念とロードマップを持つべきでしょう。
これは、先ほど不完全性について言及したポイントの対極にあります。より多くのことができるようになると仮定してください。そしてそれが起こったとき、あなたの会社で何が解放されるでしょうか? それについての考えを持つことは非常に有益です。あるいは、もし一連のことがあれば、これがあればこれをするというような考えを持つことで、その時が来たときに利点を活かす準備ができます。
3つ目に言いたいのは、おそらくすべてのビジネスとすべての人にとってより永続的なポイントですが、顧客を知ることです。顧客を非常によく知る必要があります。
ここで言いたいのは、顧客を2つのレベルで知ることができるということです。今日顧客が行っていること、彼らが従事しているワークフロー、彼らが行わなければならないタスクの種類、そして今日存在する技術を使ってそれらをどのように達成しているかについての概念があります。
これを顧客についての従来の知恵による理解と呼びましょう。もし彼らに利益をもたらすもの、彼らに利点をもたらすもの、より良い生活を送るのを助けるものについて、より深い何かを知っていて、それをAIで解放できるなら、それは非常に強力です。非常に強力です。
アマゾンでは「バックワード・ワーキング」と呼ばれる技術を使っています。これは実際にとても有益です。プロジェクトを始める前や製品の構築を始める前に、最初にプレスリリースを書くのです。
そのプレスリリースには、明らかに技術の詳細や、それがどれほど素晴らしいかについての情報は含まれません。エンジニアにサービスを提供している場合を除いて、おそらく製品のすべての機能や特徴の詳細は含まれません。
おそらく、そこに入れようとする顧客の引用があり、世界があなたが構築したものをどのように認識してほしいかが書かれているでしょう。
そして、それを書いた後で、その価値のある製品を構築し、その技術を実装するのです。これは非常に単純なことのように聞こえますが、実際には非常に難しいです。特に私のような技術的なバックグラウンドを持つ人にとっては、そのようにするのは本当に難しく、そのようにすると非常に有益で教育的です。
4つ目に言いたいのは、AIは高価だということを認識する必要があります。スタートアップの場合、リソースには限りがあります。それらを保存し、価値を実現するまでは慎重に扱う必要があります。
それを意識することが重要です。必ずしも最大のモデルを実行する必要はありません。そういったことをする必要はありません。そして、構築する準備ができたら、アマゾンで構築してください。
ライアン: その続きとして、個人的にチャットボットからより有用な回答を得ようとして挫折を経験しました。大規模なワークフローに統合しようとしているわけでもないのに、です。
このような挫折に直面した人々へのアドバイスはありますか? 明らかに諦めろとは言わないでしょうが、どのようにしてその挫折の段階を乗り越え、続けていけばいいのでしょうか? あなたの考えでは、続けることの利点は何でしょうか?
ヴィシャル: はい、これは非常に根本的な変革であり、私たちはおそらく…これについて話す方法はいくつかありますが、技術の新しいS曲線に乗っていると言えるでしょう。
イノベーターのジレンマの枠組みをご存知の方もいるでしょうが、技術の異なるS曲線に移行するときに起こることです。その考え方は、最初は技術が存在し、しばらくの間は特定の状態にあり、その後急速に改善され、物事に対処するのが非常に上手になります。
そして、それがプラトーに達し、収穫逓減が始まります。新しい技術に移行する際には、しばしば異なるS曲線があり、この次元で利益と価値があります。それは前のS曲線よりも高いですが、2番目のS曲線の下部は下にあります。
そのため、実際にはある面では能力が少なくなりますが、異なるタイプの能力を持つことになります。
ライアン: AIジャーナリストに転向したとき、まさにそれが起こりました。でも、続けてください。
ヴィシャル: 私自身、人生で何度もそれを経験してきました。例えば、インターネットが大きくなり始めたとき、ウェブ上でできなかったことがいくつかありました。
明らかにそれは加速しました。だから、私が言いたいのは、継続することです。この曲線は大きく上昇するでしょう。それはほぼ避けられません。そこから学び、新しいツールに適応することが私の世俗的なアドバイスです。
誰もが、私のようなエンジニアも含めて、Code Whispererのようなものを生活に取り入れて、より効率的になりたいと思うでしょう。ソフトウェアエンジニアとして伝説的な存在であっても、それから利益を得られることを保証します。
ライアン: そうですね。みなさん、継続してください。素晴らしい聴衆でした。ヴィシャルさん、ありがとうございました。
ヴィシャル: ありがとうございます。
ライアン: サウス・バイの残りをお楽しみください。ありがとうございました。

コメント

タイトルとURLをコピーしました