

グスタフ:こんにちは。素晴らしい歓迎ですね。ジョエルにAGIのUIを考え出すように言われたのですが、彼に何日あるか聞いたら、30分だと言われました。私はそれは無理だと言ったら、彼は35分くれると言ったので、AGIのUIを理解できるかどうか試してみるつもりです。早速始めたいと思いますが、まずはジョシュにお聞きします。ビル・ゲイツは少し前に、アプリの終焉と、新しい時代はエージェントの時代であるというブログ記事を書きました。エージェントは、あなたが自分でやっていたことをあなたの代わりにやってくれます。あなたが自分でやっていた多くのことを、消費者としてやってくれます。2つのことをお聞きしたいのですが、あなたはArcブラウザを立ち上げ、Arc searchのキャッチフレーズは「あなたのために検索する」ということですが、Arc searchをこれらのエージェントの一つとして考えているということでしょうか?
ジョシュ:お招きいただきありがとうございます。冒頭で聞いたように、私はこれらの技術に懐疑的な時がありました。その理由の一つは、エージェントのような言葉です。私はそれが何を意味するのか分からないので、それを信じているかどうか分かりません。だから、私が信じているのは3つのことだと思います。1つ目は、本当に理解するのに時間がかかりましたが、私たちのコンピュータは初めて読むことができるようになったということです。画面上で起こっていることを見て理解することができます。2つ目は、私たちのコンピュータが初めて私たちの真似をすることができるようになったということです。彼らは過去何十年にもわたってインターネット上で行ってきたすべてのことを学習し、その行動を模倣することができます。そして3つ目は、エージェントの問題に関連することですが、もし私たちのコンピュータが私たちが言うことと画面上にあるものを理解し、それに反応して私たちが何をするかを模倣できるなら、ソフトウェアはアプリケーションの世界を超えて動くべきだと思います。これらの異なるツールのために、サイロ化されたアプリケーションに行く必要はありません。私は自分のコンピュータに、フォームファクタが何であれ、やりたいことを伝えることができるはずです。コンピュータはそれを理解し、少なくともある程度の能力で、私の介入なしにそれを実行できるはずです。だから、私はこのコンセプトを信じているのでしょうか?人々がエージェントと言うとき、彼らはスマイリーフェイスとあなたのアシスタントのようなものを考えると思います。そして、多分それがそうなるでしょうが、私はよく分かりません。
グスタフ:文字通り、アプリを開くとスマイリーフェイスがありますよね。
ジョシュ:私はそれが好きかどうか分かりません。
グスタフ:では、追加の質問です。エージェントの世界と呼ぶかどうかにかかわらず、中心となる概念は、あなたのためにあることをしてくれる人間の助手のようなもので、私たちがよく目にする典型的なユースケースは、昨日Google IOで見たように、旅行を予約することです。通常、航空会社、ホテル会社、アクティビティ会社など、複数の消費者向け企業とやり取りしますが、これらのアシスタントはあなたのためにそれをやってくれます。この世界をどう思いますか?消費者向け企業の多くが、消費者向けではなく、エージェント向けになるような気がします。彼らは消費者を目にすることはなくなり、広告で収益化されている企業の多くは、エージェントに広告を表示したり、エージェントにその製品を購入するように説得したりすることはできないかもしれません。これらの企業はどうなると思いますか?ビジネスモデルを変える必要がありますか?どのタイプの企業が他の企業よりも置き換えられるか、置き換えられないにしても、自分たちの見方を変える必要があるかについて、何か考えはありますか?
ジョシュ:エージェントという言葉と私が実際に信じているものについてコメントを始めた理由の一つは、ここに来る途中で空港で友人グレースに会い、グレースとはしばらく一緒に食事をしていないと思い、来週グレースが住んでいるニューヨークに行くので、一緒にランチをするのは素晴らしいことだと思ったからです。もしあなたがそれを考えると、新しいと感じるのは、私がコンピュータに言うことができるはずだということです。私は今、コンピュータにニューヨークでグレースとランチしたいと言うことができ、それは私が必要なものをルーティングして引っ張ってくることができるはずです。しかし、それは必ずしもそれらのアプリケーションを私のために使うという意味ではありません。それは入力を意味するものではありません。アプリケーションがより構成可能になり、レストラン検索について少し、私のカレンダーから少し、そしてグレースに電子メールを送るために電子メールから少しを引き出す可能性があります。そして、私はそれが私のために生成した動的なインターフェースでそれを行います。だから、私はあなたがどう思うか本当に興味がありますが、あなたがサードパーティのアプリケーションやツールを全く見ないような、この万能のオペレーティングシステムがある世界を想像するのは難しいです。私はそれが起こるとは想像できません。
グスタフ:あなたはこれらの会社の一つを経営しているのですが、どう思いますか?
ジョシュ:私はここで質問をすることになっています。答えはありません。
グスタフ:もし、消費者向け企業がビジネス向け企業になったら、このエージェントは、このことが本当に始まる前に、あなたに代わって買い物をするための財布を必要とするでしょう。予測するのは難しいです。おそらく、あなたが実際にやりたいとは思わないことに焦点を当てたもの、つまり時間を節約したいものが最初に置き換えられるでしょう。旅行の予約などは、必ずしも人がやりたいと思うことではありません。時間を無駄にしたいエンターテインメントは、あまり影響を受けないかもしれません。知る由もありません。人間としての私の答えは、たとえこれが私の会社を傷つけるかもしれないとしても、私は一つの会社がすべてのインターフェースを支配する世界に住みたくないので、何かサードパーティのもの、そして私たちが毎日使うソフトウェアの中で、異なるUI、異なる美学、異なる意見があることを本当に願っています。
グスタフ:この点については、カールさんにもお話を伺いたいと思います。カールさんはNothing phoneを作っていて、UIもオペレーティングシステムとの統合という利点があり、アプリケーションを統合すればユーザーにとっての摩擦を軽減できるため、垂直統合への圧力があるように思えます。カールさん、エージェントの話から、この新しいエージェントの世界には新しいフォームファクターが必要だという共通認識のようなものに移りますが、それは電話ではなく、Rabbit R1、あなたのメインピンLimitless、Meta Ray bandsなどを見てきました。あなたはChat GPTを搭載したAirbudsを発売しましたが、フォームファクターについてはどうお考えですか?新しいフォームファクターになるのでしょうか?それとも、電話、時計、Airbudsのようなものが融合していくのでしょうか?
カール:まず第一に、これらの企業には多くの称賛を与える必要があります。3年半前にNothingを始めたとき、テック業界は非常に退屈で、それが私たちが始めた理由の一つですが、今はテックは本当に楽しいと言えます。多くのことが起こっていて、突然GPT 4が出てきて、能力が向上し、これらの新しいハードウェアのフォームファクターがすべて出てきました。彼らには多くの称賛を与える必要があります。なぜなら、業界は違う場所にあり、人々は新しいものを試して、何がうまくいくかを見る必要があるからです。すべてがうまくいくわけではありません。そうは言っても、ユーザーの習慣を変えるのは非常に難しいと思います。新しいフォームファクターを導入する場合は、次のステップと次のステップについて本当に考える必要があります。それは、ユーザーにそれを教育する方法です。それは本当に良い製品なのでしょうか?だから私たちにとって、ユーザー教育をする負担はスタートアップ企業にあるべきだとは思っていません。スマートフォンを例にとると、年間10億台売れています。あなたは自分の言葉にお金をかけたのですね。ワイヤレスイヤホンは年間3億台売れています。モバイルインターフェースについて考えると、長い間変わっていないと思います。確かにiPhoneで全てがよりきれいになりましたが、ホーム画面、アプリ、アップストア、アプリ間の切り替えという基本は変わっていません。では、なぜ私たちにはできないリスクを冒すのでしょうか?ソフトウェア側で作業して、現在のフォームファクターとの相互作用に良い方法があるかどうかを確認してみましょう。
グスタフ:お二人とも、何十億台もの携帯電話や時計、Airpodsなどが普及していることのメリットが多く、このエージェントの世界は、既存のオペレーティングシステムや企業を通じて、そして願わくばあなたのオペレーティングシステムを通じて実現するだろうという直感をお持ちなのでしょうか?電話になると思いますか?それとも、電話の代わりに身につけるピンや、電話になると思いますか?
ジョシュ:私は知りませんが、私が最初に言った2つのことに戻ってくると思います。私たちのコンピュータは今や見ることができ、理解することができ、私たちの代わりに物事を行うことができます。私にとって、それらはフォームファクターというよりも、ソフトウェアの変更のように感じます。もう一度言いますが、私たちのコンピュータが何を見ることができるかという事実は、もしあなたがAirpodにカメラを置いたら、私は私のAirpodsを愛しています。それはマルチモデルで何を開くのでしょうか?だから私はそれを完全に信じることができます。そして、カールが言ったように、人々がいろいろいじくり回して、創造性と新鮮なアイデアを持っているのを見るのは素晴らしいことです。私たちの業界にとって、活気のある時期だと感じています。しかし、最初の原則の観点からは、ソフトウェアが変化することを期待します。そしてカールが言ったように、私たちはアプリケーションモデルでしか生きていません。それは何かを成し遂げるには非常に不器用な方法です。だから、それを乗り越えるために私たちにはやるべきことがあると思います。私の直感は、おそらくそこから始まると思いますが、私はハードウェアの人間ではないので。
グスタフ:もし、iOSとAndroidが多くを占めると仮定すると、OSの統合、摩擦の除去など、彼らが有利な立場にあると言えるでしょう。ウェブ上ではアプリは分散していますが、電話上ではそこにあり、もしあなたが実際にそのランタイム上のオペレーティングシステムであれば、たとえそれがプライバシー保護の方法であっても、あなたがその所有者であれば、文字通りデータを見ることができます。AIはあなたが使っているすべてのアプリを見て、あなたが何をしているかを理解し、あなたのためにアプリを実行することさえできます。彼らはこのような世界で有利な立場にあると思います。実際には、お金の問題です。Googleは検索広告から収益を得ているので、Chromeブラウザは一つの大きな検索ボックスになってしまいます。この製品の目標は、あなたを検索や検索広告に誘導することです。だから、もしあなたが直接それを追いかけて、私たちの目標はそうではない、私たちの目標は毎日インターネット上でできるだけ多くの時間を節約することだと言えば、それは大手企業として彼らにとっては競争するのが非常に難しいでしょう。アップルについてはよく知りませんが、彼らはハードウェアから多くの利益を得ており、アプリケーションからも多くの利益を得るでしょう。彼らが今、アプリケーションが変化したり、もしかしたらなくなったりするかもしれないこの瞬間にどう感じているのか興味があります。もしかしたら、多くの計算能力と価値がどこか遠くのサーバー上にあるので、以前のようなアップグレードサイクルは必要なくなるかもしれません。ウェブやブラウザ層に移行することで、ビジネスモデルを狙うことは、創造性と新鮮さ以外の唯一の競争優位性の一つだと思います。彼らはお金も技術も資本も持っているので、参入点を見つけなければならないと思います。
カール:ビジネスモデルの点については、私もよく考えてきました。これらの大企業は、すでにアプリストアなどで多くの利益を上げているので、ビジネスモデルを変える前にはよく考えると思います。企業文化についても思うところがあります。最近、チームと一緒にMacintoshの発表会を見ていて、スティーブ・ジョブズがベールを持ち上げると、コンピュータが観客に語りかけるのですが、Appleが最後に個性を持っていたのはいつだろうと考えていました。しかし、当時は創造性の文化があり、誰にとってもすべてであることはできませんでした。彼らは非常に小さかったので、一人のユーザーを見つけて、本当にうまくサービスを提供しなければなりませんでした。しかし、今では彼らは非常に大きくなり、誰にとってもすべてである必要があるので、文化には何かがあると思います。あなたが非常に大きくなると、あなたの文化は変化し、あなたの戦略は変化し、あなたは次の波をキャッチするために十分速く動くことができないかもしれませんし、重要な消費者に十分近づくことができないかもしれません。
グスタフ:舞台裏で話していたように、一つの機会は、より意見を持つことかもしれません。なぜなら、大企業は、彼らが非常に大きいので、そうしなければなりません。Open AIの発表で、AIがより意見を持っているのを見ることができますし、Googleも翌日には同じ機能ですが、より当たり障りのないものになっています。だから、もしあなたが小さければ、あなたは平均化する必要はありません。
ジョシュ:私が考えているメタファーは、80年代にそれが起こり、今は40年後なので、同じ戦略を取り、現代の戦術と現代の技術を適用して、その映画をもう一度再生するにはどうすればいいかということです。インターフェースでリープフロッグする機会もあると思います。なぜなら、これらの大企業は、何十億人もの人々にサービスを提供するという特権を持っているからです。ChromeやAppleの人々だけでなく、彼らは非常に創造的で善意のある人々ですが、ビジネスモデルのインセンティブだけでなく、iOSに出荷するものは、iPhoneを持っている私の人生の中の誰にとっても直感的でなければなりません。Chromeも、文化、帯域幅、デバイスの種類を超えて同じことが言えます。責任はより高く、小さな会社として、5年先を考えてみましょうと言うこともできます。なぜなら、今日10億人、あるいは1億人がそれを手に入れる必要はないからです。10万人がすぐにそれを買えばいいのです。Rabbitが10万台を販売できたことは、GoogleやAppleが何かを思いついても、10万人しか買わなかったとしたら、それは大失敗でしょう。だから、インターフェースについて話すとき、それは私が今、私たちのチームにプッシュしていることの一つです。未来を少しでも多くの人々のために前進させようとすることで、ゆっくりと、ゆっくりと時間をかけて、人々にとってより直感的にしていくことができるからです。
カール:私はこれらのカンファレンスにはたまにしか来ませんが、最後に私が話したときにカールに会いました。Nothingチームに会ったり、カールに会ったりすると、彼らはもっとそれを欲しがっているように感じます。これらの企業は、インセンティブを持った人々の集まりであり、マクロレベルでそれらを理解し、ミクロレベルでカールが勝ちたいと思えば、彼は本当に良いチャンスを持っていると思います。
ジョシュ:先日、フォームファクターについて話したとき、あなたは私に「何がうまくいくか見て、それからもっと速く作ればいい」と言いました。ハードウェアを作る時、ほとんどの人はハードウェアは非常に遅いと思っています。それはソフトウェアについて人々が考える方法ですが、あなたはハードウェアに対してほとんどソフトウェアの視点を持っているようです。あなたは非常に速く動くように見えます。
カール:ハードウェアのリスクははるかに大きいと思います。なぜなら、すべてのミスが多くの費用を要するからです。だから、あなたが取りたいリスクについて、本当に慎重にならなければなりません。しかし、一度ターゲットを持てば、実際にはそれほど遅くはありません。しかし、間違った決断は、製品開発費だけで2000万ドルから3000万ドルの費用がかかります。だから、リスクを管理しなければなりません。あなたはかなり高い確率で正しい必要があります。
ジョシュ:しかし、もしそうなら、かなり速くできるんですね。
グスタフ:Spotifyのスマートシャッフルで、最近、天気がいいのでランニングに戻ろうとしていて、もっと走るべきだと思っています。プレイリストを再生するだけで、たくさんの良い曲を見つけられました。時々、聞いたことのない曲が流れてくるので、Spotifyは、たとえ静かにであっても、実際に多くの価値を提供するAI製品を統合する最前線にいるように感じます。すでに革新的で、最前線にいて、急速に成長しているマーケットリーダーとして、スマートシャッフルのようなリスクを取るインセンティブをどのように考えていますか?そして、すでにあなたは伝説的と呼ばれていますが、私たちはいつかそこにいることを願っています。
カール:スタンはここにいます。スマートシャッフルを作った彼はとても喜んでいます。
グスタフ:では、AIのための製品開発についてどのように考えているかについてお聞きします。少し違いますが、以前は決定論的な製品を開発していましたよね。舞台裏で言っていましたが、パラダイムは、全世界のために一つのアプリケーションを書くことでした。100万ドルかかるとしましょう。1人のユーザーを獲得すると、そのユーザーは100万ドルかかります。2人になれば、各ユーザーは50万ドルかかります。ゲームの名前は、その固定費の投資を宣伝することです。そして、ベンディ・ディーンズが言ったように、AIでは2つの問題があります。1つは、すべてのユーザーに限界費用がかかるということです。償却だけではありません。2つ目は、製品が統計的であるということです。すべてのユーザーに対して同じように動作するわけではなく、毎回同じように動作するわけでもありません。統計的には良いかもしれませんが、悪いこともあります。ArcブラウザとArc searchを開発する際に、どのようにユーザーテストを行い、次のユーザーには同じではないかもしれないこの世界で、これらのことについてどのように考えているのでしょうか?
ジョシュ:わかりません。いくつかの意味で、私はそれを間違えました。私は、これは暗号2.0のように、この誇大広告から離れて、すべて誇大広告だと思っていました。間違っていました。その後、私たちはプロトタイピングを始めました。基本的に、私の本能はこのことについて間違っていたのです。私たちの会社の価値観の一つは、「知らないことを前提とする」ことなので、会社の前提は、私はスティーブ・ジョブズではない、私たちは自分たちが何を話しているのか全くわからない、ということです。しかし、正しい態度と正しい心のこもった強さと創造性があれば、十分なことを試せば、私たちはそれを正しく得ることができるかもしれません。それは、誰も彼らが何を話しているのかわからないこの新しい遊び場に非常によく合います。ビル・ゲイツのエージェントに関するエッセイには敬意を表しますが、彼がそれが何であるかを知っているとは思いません。だから私たちのアプローチは、プロトタイプ、プロトタイプ、プロトタイプ、プロトタイプ、そしてまたプロトタイプでした。今日私たちが最大の成功だと思うのは、Arc searchモバイルアプリで、「Browse for me」という機能があります。Google検索をして「Browse for me」をクリックすると、6つのウェブページを読んで要約し、答えを教えてくれます。この機能は、私が初めて試したときはひどいものでした。私たちのチームの誰かが、GPT 4を使ってGPT 3.5モデルを微調整し、ユーザーインターフェースを少しだけ変更して、このような引用文を引き出し、引用文を検証するという、本当にユニークなアプローチを取った後でのみ、それは可能になりました。あまり科学的ではありませんし、もっとクールに聞こえたらいいのですが、私たちの答えは、もっと速く、もっと創造的になることでした。それはあまりにも新しく、24時間、48時間前に変わったものです。舞台裏で誰かが私に、GPT 4についてどう思うか聞いてきました。チームは今取り組んでいますが、明日には「Browse for me」の仕組みが変わるかもしれません。だから、それはスリリングです。もしあなたが、ただそこにいて、いろいろいじくり回してもいいんだと言う気があれば。
グスタフ:このパネルはユーザーインターフェースに関するものなので、それについて質問したいのですが、明らかにこの時代はテキストボックスから始まりました。ある意味では、テキストボックスは究極のインターフェースです。なぜなら、初めてコンピュータに文字通り何でも聞くことができるようになったからです。コマンドライン時代に戻ったようにも感じますが、コマンドラインの使い方を習得する人はほとんどいません。グラフィカル・ユーザー・インターフェースは良いイノベーションだったようです。ユーザーインターフェースはどうなると思いますか?どのように進化していくと思いますか?何か考えはありますか?まだアプリのようなものになると思いますか?それとも何か他のものになると思いますか?
カール:それは、私たちが話しているタイムホライズンによると思います。より長期的なタイムホライズンは、長い時間軸で見れば、物事はより流動的で生成的なものになると思いますが、最初は、これらの製品の消費者として私たちが知っているものに頼る必要があります。段階的なプロセスになるでしょう。
ジョシュ:インターフェースの点では、私の強い意見の一つは、価値はオペレーティングシステムレベル、あるいはそれに相当するものに帰属するだろうということです。なぜなら、これらの新しいツールとその新しい能力を利用するためには、人々が日常生活で何をしているのかを観察し、見て、読んで、理解し、その理解に基づいて行動できる必要があると思うからです。また、その理解に基づいて行動し、人々に代わって物事を行うことができる必要があります。そのためには、アプリケーションにアクセスする必要があります。だから、過去3回のコンピューティングの進化を振り返ってみても、ビジネスマシンからパーソナルコンピュータへ、パーソナルコンピュータからモバイルコンピューティングへ、モバイルコンピューティングからウェブベースあるいはクラウドコンピューティングへと、勝者はすべてインターフェースを定義した人たちでした。パーソナルコンピューティングとデスクトップコンピューティングではMicrosoft、モバイルコンピューティングではApple、ウェブベースコンピューティングではGoogleです。だから、それが何なのか、スペクトラムのどこにあるのかは分かりませんが、同じ企業が支配し続け、新興企業にチャンスを与えたくない場合、怖いことの一つは、ほとんどの価値がインターフェース層に帰属するだろうということです。少なくとも歴史的にはそうでしたし、時間的に見ても、この技術は、人の生活と、その下にあるアプリケーションランタイムを水平にカバーする必要があるように思えます。
グスタフ:人々はエキサイティングなことよりも退屈なことをしているというあなたの指摘ですが、私たちは未来がどうなるか全く分からないと言ってきましたが、とにかくやってみましょう。この経済的枠組みに基づいて未来を考えるための一つの枠組みは、もし何かのコストが下がれば、あなたはそれをたくさんやるだろうということです。コーヒーのコストが下がれば、人々はより多くのコーヒーを飲むでしょう。代替品であるお茶は消えてしまいますが、砂糖やクリームなどの補完物は爆発的に増えるでしょう。コーディングのコスト、認知タスクのコストが全般的に底をつき、非常に安くなると考えると、私たちは全く新しいことをするようになるというのは理にかなっているようです。トイレに座っている間に、この世界でもっとたくさんのことをするだろうという奇妙なことに、何か心当たりはありますか?
ジョシュ:最近、第二子が生まれたばかりで、6週間の育児休暇から戻ってきたばかりなのですが、5週間、ラップトップに触れませんでした。一度も開かなかったんです。私はデスクトップブラウザ会社を経営しているので、あなたもそうしてください。私はそれを愛していました。つまり、それは私たちの人生と家族の中で特別な時間でした。しかし、ある瞬間には、ウェブブラウザを本当に殺したいのかと自問自答します。それは、人々がより多くのラビットホールをしたり、インターネット上でより多くのことをしたりするのではなく、実際にコンピュータとブラウザを使うことが少なくなるという、私たちの会社にとっての成功事例です。紙の上では、その逆であるべきだと本当に思えますし、あなたが言ったように、それが安くなれば、私たちはもっとそれをすべきですが、人間として正直なレベルでは、私の人生で必要なことをするためにラップトップに触れる必要がなければ、私はかなり幸せだと思います。それは、テクノロジーの観点から、スクリーンが悪であり、それらはすべてなくなるべきだという意味ではありません。そうではありません。しかし、ニューヨークでグレースとランチの予約をする必要があるとして、「ニューヨークでグレースとランチの予約をして」と言うだけで、携帯電話でいくつかの質問が返ってくるなら、従来の意味でコンピュータが必要でしょうか?私は分かりません。
カール:ジョエルの生産性に関するプレゼンテーションが本当に好きです。なぜなら、それは私が本当に信じていることだからです。私は、テクノロジーは根本的に常に人間がより多くのことをできるようにすると信じています。だから、ある意味では、生産性はゼロになると思います。生産性のコストはゼロになり、私たちが持っている有限のリソースでより多くのことができるようになるでしょう。そうすれば、もっとクールなことができます。他の惑星を探索することができます。想像力が私たちを導くことができるものは何でも、非常にクールです。
グスタフ:それでは、時間になりました。AGIのUIを見たかどうかは分かりませんが、質問をお願いします。ありがとうございました。
コメント