IQ300の10兆パラメータAIモデル

12,934 文字

The 10 Trillion Parameter AI Model With 300 IQ

Earlier this month, OpenAI raised the largest venture round ever at .6 billion. The company’s CFO says AI is now at th...

もしO1がこんなに素晴らしいモデルやったら、創業者やビルダーにとってどういう意味を持つんやろか。一つの見方としては、O1があまりにも強力すぎて、OpenAIがすべての価値を独占してまうから、ビルダーにとっては悪いニュースになるかもしれへんな。
つまり、過去も現在も未来も含めて、すべての価値の光円錐を独占してまうってことやな。
そうそう、過去、現在、未来のすべての価値の光円錐を独占してまう。うわぁ、すごいことやな。
でも、もっと楽観的な見方もあって、特にバッチ期間中に創業者たちがプロンプトを正しく機能させたり、出力を正確にしたりすることにかなりの時間を費やしてるのを見てきたけど、もしそれがもっと決定論的で正確になったら、彼らは基本的なソフトウェア開発に時間を使えるようになる。勝者は結局、最高のユーザー体験を作り出して、細かい部分をすべて正しく仕上げられる人になるんちゃうかな。
おかえりなさい。また光円錐の新しいエピソードにようこそ。今、OpenAIが過去最大のVラウンドとなる66億ドル（B=10億）を調達した瞬間にいます。OpenAIのCFOであるサラ・フリーアーは、この資金の使い道についてこう語ってます。
「まず第一にコンピュート。これは安くありません。次に優秀な人材の確保です。そして当然、より従来型の企業としての通常の運営費用もかかります。でも、今私たちは桁違いに重要な法則に従ってます。次のモデルは桁違いに大きくなり、その次はさらに桁違いに。だからこそ、非常に資本集約的になるんです」
つまり、すべては桁の違いの話なんですな。未来に目を向けてみましょう。10兆パラメータ、つまり10兆パラメータの大規模言語モデルが登場する。これは現在の最先端から2桁大きい規模です。何が起こるんでしょう。人々は実際にこの10兆パラメータモデルにクエリを投げかけて使うんでしょうか。トークンごとに10分待たなあかんようになるんちゃうかな。
少し背景を説明すると、現在のフロンティアモデルは、正確なパラメータ数は公表されてないけど、だいたい500億台くらいやね。Llama 3は405億、Anthropicは500億と推測されてて、GPT-4もだいたいその程度やと思われます。10兆まで行くと、それは2桁の飛躍になります。
このレベルのイノベーションの可能性は、GPT-2（約10億パラメータ）からの飛躍に似てるかもしれません。GPT-2は、スケーリング則に関する論文と共に公開されました。これは重要な論文の一つで、トランスフォーマーアーキテクチャを使って、たくさんのエンジニアリングと努力を投入したらどこまでスケールするのか、この対数的なスケーリングはどうなるのかを人々が理解するきっかけになりました。
これはGPT-3.5や3が約1,700億パラメータで登場したときに証明されました。これも2桁の飛躍でした。そして私たちはその結果を見てきました。これが新しいAI企業の繁栄する時代を生み出し、2023年にGPT-3.5の上に構築された企業が次々と登場し、大きな富を生み出すのを経験しました。
もしこのスケーリング則が続くなら、2022年から2023年への移行期に感じたような変化がまた起こるかもしれませんね。
そうですね、すべてが変わった瞬間でした。もしまたそれが起こるとしたら、すごいことになりますね。
これについて興味深い点が一つあって、現在の最先端モデル、特にO1のチェーン・オブ・ソートを考えると、これらは基本的に通常の知能に匹敵するレベルに達しています。AGI（汎用人工知能）が基本的にすでに存在すると主張することも可能やと思います。
知識労働者の98%が日々行っている大半のタスクについて、今や120IQの人間の知識労働者が一日中やっているような仕事を、カーソルの前に座ったソフトウェアエンジニアが90-98%の精度で実行できるようになってます。実際、過去数年間で私たちが関わってきた何百もの企業が、今まさにそれを日常的に行っているんです。
奇妙で興味深い疑問は、10兆パラメータ、つまりIQ200から300レベルの、通常の人間を超えたASI（超知能AI）の場合、どんな可能性が開かれるのかということです。
アトランティック誌に面白い記事がありました。有名な台湾の数学者テレンス・タオについてです。彼は文字通りIQ200を超える天才ですが、現在のChatGPTをどのように使っているか、そしてそれが彼に新しい能力をもたらしているという内容でした。
人類の歴史の中で、これに似たような例がいくつかあります。核力がその一例かもしれません。核分裂が可能であることを、実験的に試みる前に理論的にモデル化する必要がありました。フーリエ変換もそうですね。
興味深いのは、現在の能力はすでにここにありますが、均等に分散していないということです。街を歩いて一般の人に話を聞いても、彼らはAIを感じていません。普通の生活を送っていて、何も変わっていないように見えます。
でも反例として、これらの発見が本当に実を結ぶまでには時間がかかることもあります。フーリエ変換の例を見てみましょう。ジョセフ・フーリエが1800年代に発見した数学的表現で、周期的に繰り返す関数の級数を表現する画期的な論文でした。
フーリエ変換以前は、これらは長い和の級数として書かれていて、それらを足し合わせて方程式をモデル化するのは非常に手間がかかりました。でも彼は、級数の和を使う代わりに、すべての数学関数を正弦波と余弦波に変換する非常にエレガントな方法を見つけました。
基本的に振幅と周期という2つの変数だけで、あらゆる周期的な信号や関数を表現できるようになったんです。これは本当にすごい数学で、今のLLMやユースケースの話に似ています。「ほう、コーディングができるんだな」というような感じです。
でも、フーリエ変換は1950年代まで、つまり150年経ってようやく人々がその使い道を見つけました。フーリエ変換は信号の表現に非常に適していることが判明し、アナログ世界のあらゆるものをデジタルに変換するために信号が必要でした。ビットは1と0ですからね。それをどうやって圧縮するか。
大きな応用例の一つは電波で、通信をはるかに効率的にしました。画像表現や情報理論にも使われ、現代世界の多くを解き放ちました。インターネットや携帯電話の基地局もこの理論のおかげで機能しているんです。でも、それには150年かかったんです。
興味深いですね。それは本当に強力なアイデアでしたね。時間がかかりましたが、1950年代にはカラーテレビが登場しました。これもフーリエ変換のおかげですよね。
そうです。でも、これを今日のAIに当てはめると、時計の針をどこから始めるかが明確ではありません。2年前のChatGPT-3の時点からなのか、それとも数十年続いてきた研究全体からなのか。以前も話しましたが、実際には私たちはもう数十年この中にいて、今まさに変曲点に達しているのかもしれません。
確かにそうですね。ダイアンのフーリエ変換の例を使えば、この新しいAIの基礎となっているすべての数学は、100年前の線形代数です。ただ、GPUさえあれば、それをどこまで押し進められるかが判明しただけなんです。
それが、この10兆パラメータモデルが人類の能力を実際に変える可能性のある一つの方法かもしれません。現実の性質と私たちのモデル化能力について何かを解き放ち、それが核兵器やカラーテレビのような結果につながる可能性があります。
もう一つの大きな違いは、これがすべてソフトウェアだということです。フーリエ変換と比べると、多くの応用はレコードプレーヤーや電話機のような物理的なデバイスにありました。だから、新しい機器を購入する必要があるので、技術の採用に時間がかかったんです。
今はFacebookやGoogleが世界のかなりの割合のユーザーを持っていて、これらが展開され始めるとすぐに…特にMetaがMeta Raybanのような消費者向けデバイスを出してきていることも注目され始めています。
消費者は、これが視覚的なものになって、スマートグラスと人間と見分けがつかないような音声アプリで話せるようになれば、それが世界を変える瞬間になるでしょう。常にAIと話せるようになれば、人々はAIを実感し始めるでしょう。
どうやら、この能力を手に入れたときに予想される結果には、本当に二極化があるようです。一方の極には、テレンス・タオのような人々が、私たちの理解できる世界の境界を押し広げていく。そのために10兆パラメータモデルを実行するには、数千万から数億ドルのインファレンスコストがかかるかもしれません。
そして、私たち残りの人々にとってより有用な方法は、実際にはディスティレーション（蒸留）でしょう。例えば、Metaの405Bは主に70億パラメータモデルをずっと良くするために役立ったという証拠があります。
実際、今日でもそれが見られます。GPT-4の重みをすべて抽出してしまおうと考えた時期がありました。某政府機関がすでにそれを行っているという証拠もあるようです。
しかし、GPT-4自体、そしてOpenAI自身が、独自のAPI内でディスティレーションを可能にしました。O1やGPT-4、4.0を使って、内部的にはるかに安価なモデル（GPT-4.0ミニのような）に蒸留することができます。これが彼らのロックイン能力の一つですね。
あまり話題に上がりませんが、これは興味深い点です。400億か500億かは分かりませんが、これらの巨大モデルは基本的に教師モデルとなっています。すべてを学習し、時間がかかる巨大な教師モデル、マスターモデルが、より小さく高速で安価な生徒モデルを教えているんです。
405億パラメータモデルのインファレンスは非常にコストがかかるので、これらのディスティレーションモデルが機能していることは、バッチ内の企業からも証拠が得られています。最新かつ最高のモデルを使って構築している企業は、最大のパラメータ数を持つ巨大モデルを使って最高の結果を得ようとはしていません。
バッチでの統計もあります。ハーシュ、少し話しましたよね。
ジャレッドがいくつかの数字を出してくれました。これは本当に興味深いですが、もっと大きなポイントは、創業者やスタートアップがより小さなモデルと大きなモデルを選択できるという事実自体です。
1年前、この業界全体が存在し始めたとき、すべてはChatGPTの上に構築されていました。ChatGPTラッパーのミームで、100%のマーケットシェアでした。
特に過去6ヶ月間で、人々が他のモデル、ClaudeやSonnetについて話し始め、コーディングではChatGPTより優れているという口コミが広がり、人々は異なるモデルを使い始めています。
ジャレッドが2024年夏のバッチについて集計した数字は驚くべきものです。開発者がその上に構築しているLLMやモデルの多様化がさらに進んでいることを示しています。際立っているのは、Claudeが冬のバッチから夏のバッチまでの6ヶ月で、開発者のマーケットシェアが5%から25%に急増したことです。バッチ内の企業の25%、これはすごい数字ですね。
そんな急激な伸びは見たことがありません。Llamaも0%から8%になりました。YCを長年運営してきて分かることは、バッチ内の企業が使用しているものは、世界の最高の企業が使用しているものの非常に良い予測指標になるということです。つまり、どの製品が最も成功するかを予測できるんです。
YCの最も成功した企業の多くは、基本的にバッチ内の企業が何を使用しているかを見るだけで、どの企業が成功するかを予測できました。
OpenAIの最新の資金調達とO1モデルを一旦置いておくと、開発者やビルダーの間では、OpenAIは負けているように見えます。唯一の選択肢から、他のモデルに非常に急速にマーケットシェアを失っているんです。
でも面白いのは、もしかしたら彼らは巻き返しているかもしれないということです。バッチの15%がすでにO1を使用しているという統計がありましたよね。まだ完全には利用できないのに、発表からたった2週間でそこまで来ているんです。
そうですね。O1については興味深いことがいくつか起きています。実は今、YC企業にO1の早期アクセスを提供するハッカソンを、この建物の下で開催しています。サム自身がキックオフに来て、多くのOpenAIの研究者やエンジニアが参加しています。
ハッキングを始めてたった4時間ですが、すでにいくつかのデモを見ました。チームの様子を見に行ったときに、これまでのモデルでは不可能だったものを既に構築していました。
何か例を挙げてもらえますか？
私が一緒に仕事をしている企業の一つに、Freestyleがあります。彼らはTypeScriptで構築されたクラウドソリューションを開発していて、Durable Objectsというフレームワークを使用しています。フロントエンドとバックエンドの開発をシームレスにする本当にクールなフレームワークです。
彼らのデモを見て驚いたのは、たった数時間の作業で、製品とRepitエージェントの連携バージョンを動作させていたことです。O1に対して、開発者向けドキュメントとコードの一部を与えただけで、「To-doリストを作成するウェブアプリを構築して」というようなプロンプトを与えると、すぐに動作しました。ドキュメントを理解して推論し、実際のアプリを構築したんです。時間はかかりましたが、ちゃんと動きました。
私たちが話し合うべき興味深い点は、O1がこんなに魔法のようなものだとしたら、創業者やビルダーにとって実際にどういう意味を持つのかということです。一つの議論は、ビルダーにとっては悪いニュースだということです。O1があまりにも強力すぎて、OpenAIがすべての価値を独占してしまい、価値があり得るものすべてを彼らが所有することになるかもしれません。
つまり、彼らは未来のすべての価値の光円錐を独占するということですか？
そうです。過去、現在、未来のすべての価値の光円錐を独占することになります。
なんということでしょう。
でも、もっと楽観的なシナリオもあります。私たちは特にバッチ期間中に、創業者たちがプロンプトを正しく機能させ、出力を正確にするためのツール周りに、どれだけ多くの時間を費やしているかを目の当たりにしています。人間が介在するループ、すべての時間が製品を機能させることに費やされています。
しかし、もしそれがより決定論的で正確になれば、彼らは基本的なソフトウェアに時間を使えるようになります。より良いUI、より良い顧客体験、より多くの販売、より多くの関係構築といったことに時間を使えるようになります。
そう考えると、今はかつてないほど良いスタートのタイミングかもしれません。プロンプトを正確に機能させる方法について学んだすべての知識は、これらがより強力になるにつれて、もはや関係なくなる一時的な知識だったかもしれません。
実際、我々はこの会話をCaseXのジェイク・ヘルと行いました。法務コパイロットを100%機能させることが大きなブレイクスルーでしたが、それは本当に難しかったんです。
そうですね、彼は実際に正確さを得るために必要だったすべてのことについて話してくれました。
1日目から100%の精度が保証されていたら、まるでデータベースの上にウェブアプリを構築するように、これらのものを構築するための参入障壁は大きく下がります。これまで以上に競争が激しくなり、おそらく従来の勝者総取りのソフトウェア市場のように見えてくるでしょう。
ジャレッドが例を持っています。Dry Mergeという、あなたが一緒に仕事をしている会社がありますよね。彼らは80%の精度から実質的に99%、つまり目的に応じて100%の精度にまで上がり、多くのことが可能になりました。その話をしてもらえますか？
GPT-4.0をO1に置き換えただけでね。もっと楽観的な見方があるかもしれません。現在、精度を上げようとしても十分に上げられないためにLLMを使用できないユースケースがあります。特に、ミスの結果が深刻な重要なジョブを考えると、LLMを本番環境で使用するのは非常に難しい。
でも、より正確になっていけば、そういったアプリケーションも実際に機能し始めるでしょう。
YCの大きなポートフォリオ内にもたくさんの証拠があります。2017年の企業と会っていたと思います。ツイートしたと思いますが、その時点で年間収益が5,000万ドルで、1-2年前は年50%の成長率でした。
彼らは収益を上げておらず、さらなる資金調達が必要だと分かっていました。しかし、その後の1年で顧客サポートチケットの約60%を自動化し、すぐに新たな資金調達が必要な状態から、年50%の成長を維持しながら完全にキャッシュフローがブレイクイーブンになりました。
これは企業価値を構築する上で夢のようなシナリオです。なぜなら、十分な規模があり、継続的な事業であることが分かっていて、さらに追加の資本なしで成長を複利で重ねることができるからです。
このような企業が実際に年間5億から10億ドルの収益を上げ、数億ドルのフリーキャッシュフローを生み出すようになります。ある意味で創業者の夢ですよね。これは私が見てきた中でも最も劇的な例の一つですが、決して孤立した事例ではないと思います。
2024年の今、まだこの余波の中にいて、多くの企業が過剰に資金を調達し、今後12ヶ月の収益の30倍や40倍という評価額で苦労しているように見えます。でも、新たな資金調達は二度と行わないだろうという状況です。
これは実際には彼らにとって非常に良いニュースかもしれません。なぜなら、収益性のない状態からブレイクイーブン、そして潜在的に非常に収益性の高い状態に移行できるからです。この話はまだあまり広まっていませんが、創業者にとっては本当に良いニュースだと思います。
おそらく注目を集め始めていますね。数週間前、Clear社のCEOが注目を集めました。どれだけ本当なのかは不明確ですが、少なくとも彼らは、HRや営業の内部システムを自社開発のLLMアプリに置き換えていると主張しています。
そうですね、Workdayを廃止したと言っていましたよね。
本当に驚くべきことです。OpenAIを今後20年のGoogleと考えるなら、Googleとそれが可能にしたすべてのものに投資したいと思います。Airbnbのようなものですね。GoogleはAirbnbを作ることもできましたが、おそらくそうしませんでした。
コースの企業理論から考えると、おそらくあまりにも非効率で困難すぎ、実際にそれを実現するには多くのドメイン知識が必要だったでしょう。
では、構築されている新しいGoogleとは何でしょうか？垂直方向のエージェントがありますが、私たちが話せる例はどのようなものでしょうか？
私は前回のYCバッチからTax GPTという会社と一緒に仕事をしていて、本当に気に入っています。最初は本当に文字通りラッパーとして始まり、名前の通りTax GPTでした。
でも、彼らについて私が気に入っている例は、税務アドバイスが、IRSや国際的な政策文書からの既存のケースローや政策文書に対する基本的なRAG（検索補助生成）を行うことで、数万人の会計士や会計事務所の前に登場することができたということです。
人々がGoogleで検索するようなことに対して安価または無料で提供し、そして一度あなたについて知り、信頼するようになると、文書のアップロードに関する企業向けビジネスを構築しています。年間10万ドルのACVの契約を獲得し、会計士一人あたり数十から数百時間の実際の作業を削減する本当のワークフローを引き継いでいます。
O1モデルについてもう一つ興味深い点は、最初はChatGPTが唯一の選択肢で、OpenAIが唯一のゲームでしたが、その後多くのモデルが登場したという話をしていました。
この部屋の中で私たちが持っているある種のアルファ情報は、今この下のフロアで人々がO1の最先端で構築を行っていて、一般の人々はまだアクセスできないということです。私たちが目にしているのは、これが本当に大きな一歩前進だということです。O1は、AIアプリケーションを構築している任意のプログラマーやエンジニアにとって大きな意味を持つでしょう。
興味深いのは、このサイクルが繰り返されるのかということです。一時的にOpenAIにリードを与え、マーケットシェアが100%近くまで戻るでしょう。しかし6ヶ月以内に、Llamaはアップデートされ、Claudeは新しいリリースを出し、Geminiは改善を続け、同等のレベルの推論能力を持つ4つの異なるモデルが存在することになるでしょうか。
それとも、これがOpenAIが本当のブレイクスルーを達成する最初の機会となるのでしょうか。本当のブレイクスルーとは、誰も複製できないような防御可能なものを指します。そうなれば、彼らは非常に強力な立場に立つことになりますが、私たちにはまだ分かりません。
これが興味深いところです。OpenAIは常に一歩先を行っているように見えます。彼らは常に大きなブレイクスルーを最初に達成しているように見えますが、これまでのところ、そのリードを維持することはできていません。
O1について興味深いもう一つの点は、推論に多くの時間を要するため、インフェレンスのための計算需要がさらに高くなっているということです。このことは、AIインフラを構築している多くの企業にとっても、基盤となるダイナミクスを大きく変えることになると思います。これは考えさせられる点ですね。
二つの異なるユースケースがあるように見えます。彼らはちょうどO1から4.0へのディスティレーションを可能にしたので、比較的定型的で繰り返しの多いユースケースでは、難しいものにはO1を使用し、その後ディスティレーションして4.0や4.0ミニの価格で利用することが考えられます。
そして、もう一つの種類の問題は、非常に具体的なものです。私は、ほとんどのコード生成の状況はそれに近いと想像します。詳細で具体的なものなので、完全なO1エクスペリエンスのために支払う必要があります。
建築するものにもよりますよね。エンタープライズソフトウェアで、コストを顧客に転嫁でき、高いレイテンシーを許容でき、即時性をそれほど気にしない場合は、O1を多用できるかもしれません。でも消費者向けアプリならおそらく違いますね。
でも、消費者向けアプリと言えば、OpenAIの最新リリースで印象的だったのはリアルタイム音声APIです。本当に素晴らしく、最も注目すべき点は、継続的な使用ベースの価格が1時間あたり9ドルということです。
これは強力な示唆を含んでいます。もし私がマクロトレーダーなら, コールセンターに大きく依存している国に対して非常に悲観的になるでしょう。なぜなら、1時間9ドルというのは、まさにコールセンターのコストと同じくらいだからです。
これは間違いなくバッチ内でも見られる傾向です。音声が killer app（キラーアプリ）であることは明らかです。例えば、このバッチで私のグループにいる会社の一つは、債権回収のためのAI音声を開発していて、その成果は素晴らしいものです。本当によく機能しています。
S24の音声アプリの多くは、最も急成長している爆発的な成長を遂げている企業でした。これはS24の明確なトレンドでした。以前のバッチで音声に取り組む企業と仕事をしていたときを思い出しますが、十分にうまく機能していませんでした。レイテンシーが高すぎて、中断があると混乱してしまうなどの問題がありました。
しかし今や、ついに機能し始めているんです。Happy Robotという別の会社と仕事をしていましたが、彼らは物流の電話連絡を調整する音声エージェントというアイデアに行き着きました。
トラック運転手がAからBに移動する必要があり、「今どこにいるの？」と確認の電話がたくさんかかってくるような状況です。Find My Friendsのようなものがないので、彼らはこれに対して多くの使用実績を得始めています。
以前も話しましたが、この時点でAIはチューリングテストを通過し、電話を通じたこれらの非常に単調な問題を解決しているんです。これはかなり驚くべきことですね。
あまり議論されていないことの一つは、これらの既存産業のエンジニアリングチームがどの程度真剣に取り組んでいるかということです。かなり二極化しているように感じます。
おそらく4年以上前に設立された大多数の企業や組織は、これらを全く深刻に受け止めていません。これに関する取り組みが全くないんです。これは世代の問題かもしれないと思い始めています。
マネージャーやVPは今や私と同じ年齢、43歳くらいです。もし私がここにいて、まさに何が起こっているのかを目の当たりにしていなければ、「これはいつもの古いAIの話だよ」と言いたくなるでしょう。
でも、私たちほど近くで見ていない人々は、改善のスピードを理解していないと思います。一般的な企業の人々は、確かに技術による破壊的革新には慣れていますが、それは非常に長い時間をかけて起こるものだと考えています。
むしろ彼らは懐疑的になっています。「クラウド」という言葉が長い間バズワードでしたが、確かにエンタープライズソフトウェアの構築と提供方法を変えました。でも、それには10年ほどかかりました。
私は、みんながAIに対しても同じように感じていると思います。自然なデフォルトモードは懐疑的になることです。「まだしばらくは準備ができていない」と。そして、おそらく6ヶ月前にこれらのものを見ていたとしても、先ほど話したように、6ヶ月前にAI音声アプリを見ていたら、「これは真剣に受け止めるべきものになるまでまだ何年もかかる」と思っていたでしょう。
実際には3-4ヶ月後には本当の大きな変曲点に達していて、これはテクノロジー業界の中にいる人々でさえ驚かせています。この速さで進化するのは前例がないですね。
確かにプロセッサーよりも速く、クラウドよりも速いです。実際に見ているのは楽しいですね。
バッチでのもう一つの例を見てみましょう。技術系の創業者たちと一緒に座って、彼らのコーディングの様子を見ることがあります。この波の前と後では大きな違いがあります。
以前は標準的なIDEとターミナルで人々は問題なく製品を出荷していました。しかし、バッチ期間中に創業者たちが構築しているデモと製品は、次元が違うレベルの完成度です。
彼らがコーディングする様子を見ていると、まるで未来に生きているかのようです。この時点でGitHubコパイロットはすでに古いニュースになっていて、最新のコーディングアシスタントを使用しています。多くの人がContinueやCursorのようなものを使っていますね。
これもジャレッドが指摘したことですね。創業者たちにIDEについて聞いたときに。
そうです。2024年夏のバッチの創業者たちを調査したところ、半分がCursorを使用していて、GitHubコパイロットを使用しているのはわずか12%でした。これには驚きました。
彼らはまだ完全なエージェント化されたコーディングエージェント（repet hazerのような）を使用していません。これはまだコパイロットの段階のものです。でも、GitHubコパイロットからCursorへの移行だけでも、AIがどれだけのことをするかという点で次のステップアップになっています。これは信じられないブレイクスルーで、非常に急速に進化しています。
今日のハッカソンで彼らが構築したものを見て感心しました。エディタを見ていて、「Cursor、なるほど」と思いました。これは創業者たちが優位性を持っているもう一つのサインですね。
私にとって、GitHubコパイロットが最初に登場したとき、GitHubとMicrosoftが組んで、すべての開発者とすべての資本を持ち、OpenAIへの内部アクセスも持っているのに、どうしてコーディングIDEと競争できるのだろうと思いました。彼らに飲み込まれてしまうはずでした。
しかし、Cursorは突然現れ、私たちの数字によると、バッチ内ではGitHubコパイロットの5倍の規模になっています。先ほど言ったように、スタートアップの創業者たちは実際にこの種のものの先駆者になっています。
特定のタイプのビジネスでは、スタートアップの創業者を早期の顧客として狙うことは意味がないかもしれません。しかし、開発者向けツールに関しては間違いなくそうすべきです。StripeやAWSは特にYCのバッチを獲得したいと考えていて、それは彼らにとって非常にうまくいきました。
したがって、Cursorがバッチ内でこれほど高い浸透率を持っているということは、彼らにとって本当に良い兆候だと思います。
私もCursorは本当に素晴らしいと思います。でも、AltaVistaも素晴らしかったですよね。
私も検索エンジンとして使っていましたが、次のバージョンがあり、その次のバージョンは10倍良くなりました。これがこれからの流れになるでしょう。この競争から本当に勝利するのは開発者たちです。
これは、このすべての楽観的な見方に戻ります。モデルがより強力になるにつれて、勝者は最高のユーザーエクスペリエンスを構築し、細かい部分をすべて正しく仕上げた人になるということです。
だからこそ、Cursorはすべてのアドバンテージを持つGitHubコパイロットに勝つことができました。AltaVistaは良い例ですね。Googleが現れて彼らを圧倒したように、まだ余地があります。誰かがCursorに対して、CursorがGitHubコパイロットにしたことを続けることができるんです。
では10兆パラメータに話を戻しましょう。ASIまたはそれに近いものが実現したとき、私たちはどのような世界に住むことになると思いますか？人間は実際に何をすることになるのでしょうか？そしてそれはどれほど素晴らしいものになるのでしょうか？
本当に楽観的なケースの擁護をしてみましょう。科学的・技術的進歩の速度を妨げているのは、世界についてすでに知っているすべての情報を実際に分析できる賢い人々の数だと言えるかもしれません。
何百万もの科学論文があり、信じられないほどの量のデータがありますが、それらをすべて読もうとしても、人間の理解をはるかに超えています。モデルが十分に賢くなって、正しい論理で独創的な思考と深い分析ができるようになれば、世界について私たちが持っている事実上無限のデータと知識に対して、ほぼ無限の知性を解き放つことができます。
そうすれば、ただ狂ったような科学的発見を次々と生み出すことができるでしょう。室温核融合、室温超伝導体、タイムトラベル、空飛ぶ車など、人間がまだ発明できていないすべてのもの。十分な知性があれば、ついにすべてを発明できるかもしれません。
その未来に参加したいですね。素晴らしそうです。
全く同感です。これは単なる「心の自転車」ではなく、自動運転車、あるいはさらに凄いことに、火星への宇宙船になるかもしれないと思います。
では、また次回お会いしましょう。