
30,044 文字
https://www.youtube.com/watch?v=ufJG12YAyjE
1年もしないうちに、すべてのコンピュータコードの90%はコンピュータ自身によって書かれるようになるでしょう。私たちが発見しているのは、AIがコードの90%を書く世界からそう遠くないということです。3〜6ヶ月以内にそこに到達すると思います。予測通り、2025年はAIパワードエージェントの年になりつつあります。中国から登場したManisがAI界に再び衝撃を与えました。ケビン、これは再びDeep Seekの瞬間なのでしょうか?それともDeep Seekなのか、いや、それはClaudeのラッパーのようなものでそれについて説明しますね。
わかりました、それが何を意味するのか説明します。心配しないでください。さらに、OpenAIの最新の発表についても取り上げます。そしてHedraが新しいツールをリリースしました。AIキャラクターを操り人形のように動かせるものです。また、ロボットが実際にマラソンを走っているという話もあります。ケビン、これは私にとってもうまくいきそうです。これはAI for humansの第100回エピソードです。
ケビン、AIの世界で大きなニュースがあります。最大のニュースは、ガビン、私がエピソード100を記念して昨夜あなたのために驚きを用意したことを知らないということです。番組の最後にそれを試してもらえます。あなたのために特別なものをVibe codeしたんです。それは素晴らしいですね、試すのが待ちきれません。本当に驚きました。
でも最初に、今週の最大のニュースについて話さなければなりません。それはAnthropicのダリオ・アモデイからの興味深い引用から始まります。今すぐ聞いてみましょう。「仕事の側面に関しては、私はこれについてかなりの懸念を持っています。一方で、比較優位は非常に強力なツールだと思います。AIが最も進歩している分野の一つであるコーディング、プログラミングを見ると、私たちが見つけているのは、AIがコードの90%を書く世界からそう遠くないということです。3〜6ヶ月以内にそこに到達すると思います。そして12ヶ月後には、AIが本質的にすべてのコードを書く世界にいるかもしれません。」
それは1年後ですね、大丈夫です。1年間でたくさんのことが起こり得ます。いくつかの理由でこれから始めたいと思います。今日は様々な興味深いAIエージェントの話をしますが、中国からのManisという新しいAIエージェントの大きなニュースや、OpenAIがいくつかのエージェントツールをリリースしました。
これから始めたい理由は、ケビン、これがビジネス界のAIが達している速度と規模の両方を、私たちの視聴者と世界中の人々に理解してもらうためにとても重要なことだからです。長い間、私はLinkedInページに投稿していました。ソーシャルネットワークの中では最悪ですが、最近そこでかなり時間を過ごしています。先週、ウォールストリートジャーナルに記事がありました。元々子供たちをテック業界やコーディングに向かわせていた親たちが、今では子供たちにクリエイティブなスキルの仕事に進むよう言っているという内容でした。彼らはテクノロジーが近い将来大きく変わると信じているからです。
このダリオの引用を聞いた時、それがその記事の文脈を与えるために言及しましたが、この分野にたくさんの時間を費やしてきた私にとっても、多少ショックでした。あなたの最初の反応は何ですか?
それは1年もしないうちに、私たちはこのポッドキャストでパイレートソフトウェアと議論していました。彼は丁寧にゲストとして来て、風を指で測り、機械が配備可能で良いコードを書くことは決してないだろうと言いました。私たちは親切にその意見を受け入れましたが、良い理由でそれに反論しました。十分な時間があれば、テクノロジーができることに対して「決して不可能」という議論は負けるからです。そして私たちは今ここにいると思います。
私の逸話的な経験では、毎月、自然言語を使って機械とコミュニケーションし、有用なツールを送り出し、概念実証を作る新しい能力が解放されています。あなたと私は舞台裏で何かに取り組んできましたが、短期間でどれだけ進歩したかに驚いています。それで、はい、AIによって大量のコードが書かれるだろうと思います。
Y Combinatorは、基本的にスタートアップを立ち上げるベンチャーバックの会社です。彼らは小規模なスタートアップに資金を提供しています。彼らが最近発表した統計によると、彼らが資金を提供した新しいバッチの会社の圧倒的多数はAIを使用してコードの大部分を生成しているとのことでした。
これは有能なプログラマーが必要ないという意味ではありません。そのコードが安全であるとか、スケーラブルであるとか、エレガントに書かれているという意味でもありません。そのいずれも意味しません。しかし、AIがたくさんのコードを書くことを意味します。コードを読んで何が起きているのかを理解できるプロフェッショナルの居場所はまだあると思います。悪意のあるものが注入されていないか、他のものに展開する際に問題を引き起こさないかを確認するためにです。しかし、これが私たちが向かっている方向だと完全に信じています。
それは本当に考えるべき興味深いことです。その考えを内在化して、AIが明らかにコード作成に非常に特化していることを考え始めると、論理ベースであり、彼らが実際に把握できる種類のものだからです。後ほどOpenAIの新しいモデルについて少し話しますが、これはまだ公開されていません。サム・アルトマンがツイートしたもので、創造的な文章に特に焦点を当てています。つまり、クリエイティブな人たちも安全ではありません。
これは一種の分水嶺の瞬間だと思います。ダリオはサムとは違う人物です。サムは大げさではないと思いますが、サムは自分の製品について多く話します。ダリオも同様ですが、ダリオは伝統的に穏やかでした。そうですね?
はい、ダリオは少し穏やかです。そのような人が言うと、それは注目に値します。番組の冒頭で触れたもう一つの部分は、週末に人々を注目させた2つの大きなコーディングの更新です。一つは中国からのManisで、まずそれについて話します。もう一つはOpenAIからの新しいコーディングAPIで、それについても後で説明します。これら2つがどういう意味かを説明しますが、あなたが読んだ記事を参照すると、これらの親は芸術に進むべきだと言っているのでしょうか?
AIが映画や音楽などを生成できないわけではありません。機械との対話方法を知るためにコミュニケーションを学ぶべきか、創造的に説明するために詩を学ぶべきか、それとも職業訓練校に行くべきか?
これについてあまり脱線しないように、私の論点は明らかに創造的なビジネスもうまくいっていないということです。ハリウッドやビデオゲーム業界で働いている人は、この理由の一部としていくつかの仕事が排除されているために、本当に不況に陥っていることを理解しています。
私の一番の考えは、これが世界全体との会話を開くべきだということです。そして今、多くの賢い人々がこれに焦点を当てています。ウィル・マッキャスキルという人物の本当に素晴らしいポッドキャストを聞きました。それは880,000時間ポッドキャストにあり、このポッドキャストもそれぐらいの長さかもしれませんが、効果的な利他主義運動を始めた哲学者の一人である人物の深い洞察を提供しています。
もし覚えていれば、彼は最初はAIに非常に反対していて、何が起きているかを認識していました。彼は基本的に今後起こることを見て、立場をほぼ転換しています。これは今、すべての人が持つべき重要な会話だと思います。
このポッドキャストを記事に関連して取り上げる最大の理由は、私たちが有意義な仕事とは何かについて考え始める必要があるということです。人々にとって有意義な仕事をするとはどういう意味なのでしょうか。これが最大の会話のように感じます。詩は有意義な仕事なのでしょうか?おそらく一部の人にとってはそうでしょう。
実際、私は詩の学位を取得していません。大学で詩のMFAを取得することに非常に興味がありました。私はかなり詩を書いていて、教授たちがそれを気に入っていたからです。しかし、私が取得しなかった文字通りの理由は、詩ではあまりお金を稼げないからです。MFAを詩で取ることは賢明な動きではありませんでした。しかし、もし意味のある人生を送ることができて、それに焦点を当てたいのであれば、おそらく人間の時間の良い使い方でしょう。
まあ、あなたが書く必要のある唯一の詩は、エージェントに指示を出すための俳句かもしれませんね。「今日、もっとオン」が私のManis俳句です。「もっとオン」というのは、「M-O-R-E」のようなもので、実際にそれは両方の意味で機能する可能性があります。「私はもっとオン」または「私はモロン」。「今日、もっとオン」は素晴らしいですね。実際、私たちはポッドキャストをそう呼ぶつもりでした。
それでは、Manisについて説明しましょう。AIエージェントのDeep Seekの瞬間と言えるもので、3時間以内に基本的に近似され、オープンソース化されました。しかし、まず一歩下がってManisとは何かを考えましょう。ガビン、このエージェント未来とは何か、そして今それは何ができるのでしょうか?
私はManisを試しました。それは限定ベータ版です。基本的に説明すると、中国の企業からのエージェント型コンピュータオペレーティングシステムです。基本的な考え方は、OpenAIのオペレーターや、すぐに話すAnthropicのコンピュータ使用と非常に似ています。
ローカルコンピュータではなくクラウド上のウィンドウを引き継ぎ、物事を実行するよう指示できます。私はそれを試しましたが、かなり印象的です。最初に尋ねたのは、私はまだBalatroというゲームをよくプレイしているからです。それはずっと前から出ていますが、私の心を落ち着かせる場所です。
Balatroをプレイする人はご存知ですが、中盤と終盤があります。終盤に達すると、無限に続けなければなりません。私はそれがNaN無限スコアに到達できるかどうか、つまり基本的にゲームが半分壊れる場所まで行けるかを見たかったのです。それが基本的に勝利する方法です。
最初にそれが戦略ガイドを作成した時、私はそれを見ていました。すべてのウェブサイトを調べ、すべて正しい場所に行きました。私は何もせず、ただそれが働くのを見ていました。そして基本的な戦略ガイドが返ってきましたが、私が求めたものではありませんでした。
それで私は「これに到達できますか?」と尋ねました。それが私が本当に望んでいたものだからです。そして実際にそれをやりました。私はDiscordで共有します。それが作成した戦略ガイドを共有しますが、それはOpenAIのDeep Researchがやっていることの複製のように感じます。Deep Researchでは何が行われているかが見えませんが、同じ量の作業が行われています。
その例ではうまく機能します。現在は無料ですが、続けることは不可能だと思います。あなたと私が秘密のスタートアップで発見しているように、AIのコストは無料ではなく、多くの他のものを越えることになるからです。
それは機能しました。次に私は別のことを試してみました。これは私たちが作るべきゲームで、おそらくVibe codeで作れるか、私たちの視聴者の誰かが作れるかもしれません。「エンドレスウォーキングシミュレーター」というものを作りたいと思いました。
基本的に、美しい近所や美しい場所を歩き回り、途中で物を集め、何かに驚かされるものです。走ったり、飛んだりはできず、ただ無限に歩くだけです。それについて何か面白くて馬鹿げていると感じました。
これがすごいのは、15段階のプレイ方法を設定し、15のステップを示し、最初の6、7つを通過して続けていたことです。1時間半くらいこのことに取り組んでいました。
それはDeep Researchとは違いコードも書きます。コード作成機能もあり、オンラインでその能力を示した人もいます。問題は、ステップ7か8あたりで停止したことです。長いコンテキストのために停止し、致命的な欠陥があると言いました。
あなたが離れている間、この物が何時間もかけて処理していたのですね。しかも単に単語を書いていただけでなく、ずっとコードを書いていたのですね。その一部は、このゲームをどのプラットフォームで、どのツールで構築すべきか、どんなことが起こるべきかを研究していました。
つまり、製品マネージャーの研究をしていたのです。Unityゲーム用のコードを書き始め、いろいろなことをしていました。おそらくそれを実行できなかったでしょうが、すべてのUnityコードを書いていました。Unityコードがどのように見えるかは知りませんが、Unityに入るコードを書いていました。
もしもっとシンプルなことを頼んだら、例えば「これをブラウザで実行させ、ラップトップ互換にして低電力」などと言えば、おそらく必要な研究をして、実際のコードを書く代わりに、エンジニアにこのコードの説明方法を提供したでしょう。それなら失敗しなかったかもしれません。そしてあなたのゲームの計画を手に入れられたでしょう。
それを既に試した人もいます。私たちはVibe codingについて多く話してきました。そして多くの人々がいます。Min Choyはさまざまなツイートストームを集めるのが上手です。彼はツイートマスターです。彼にはManisの約10の異なる使用例があり、人々が何をしたかを示しています。
これについて興味深いのは、オペレーターやOpenAIオペレーター、コンピュータ使用とDeep Research検索が同じものに組み合わされたものだということです。これの秘密のソースは不明です。ガビン、カーネルサンダースのようなレシピがManisがこのすべてを見通し、知っていて、既存のWebをナビゲートし、グラフィカルユーザーインターフェースを使用できるようにしている裏側にあります。
理解できないほどの技術がここでは動いているはずです。私たちはそれを組み合わせることができないでしょう。しかしそれは3時間以内にクローンされました。この事について一番面白いのは、実際にAnthropicのコンピュータ使用を使っていることです。
Jean-Xavier LiaoがすぐにXでツイートし、これは本質的に29のツールを使用するブラウザ使用を持つClaudeのラッパーであることを明らかにしました。ケビン、それについて興味深いのは、これが現在無料で試せるという事実のために、このものをあまり面白くなくしているとは思わないことです。実際、私にとってはより興味深いものになりました。
なぜそれがあなたにとってより興味深いものになったのか教えてください。私は好奇心があります。何かがラッパーであると言う時、私たちはその用語をよく使いますが、もしあなたがこのポッドキャストに新しいなら、それは別のコアテクノロジーを囲むツールを意味します。
この場合、Web上を閲覧し、リンクをクリックし、タスクについて深く考えることができるこの機械を動かしている知性は、既知のエンティティです。あなたが言ったように、それはClaude Sonnetに構築されていました。彼らは既存の、ある意味で古いモデルを取りました。3.5を使用していると思います。
彼らは古いラージランゲージモデルを使用し、この機能をその周りにラップしています。これは、もしあなた自身のものを構築したいなら、おそらくできるということです。無限のリソースと数十億ドルは必要ないでしょう。
実際、私が言い続けているのは、これが出てきてから3時間も経たないうちに、人々がそれが何をしているのかを理解すると、これを自分で実行できる2つのオープンソースバージョンがリリースされました。OpenAIにプラグインすることも可能です。
私がより興味を持った理由は、オープンソースがビッグリーグに追いつくという未来が好きだからです。サービスは現在無料ですが、何か狂ったような広告サポートがない限り、それは永遠に続かないでしょう。オフトピックですが、ガビン、私はあなたと私がラップトップ上で実行できる世界が大好きです。
後ほどGoogleから今日リリースされたばかりのGemmaについて話しますが、私はあなたと私が自分の携帯電話やデスクトップ上で小さなインテリジェンスモデルを実行し、そのインテリジェンスを使って私たちのために事を行うことができるようなツールを持つ世界が大好きです。
それはこの全能な何かである必要はありません。私たちが知らず信頼していないサービスである必要はありません。私たちはこれらのものをローカルで実行し、それらがハックしたり遊んだりして、私たちが必要とする方法で動作するようにすることができます。それが最終的に脱出する方法でもあります。
それは私たちのコンピュータ上で動き、AIが脱出して世界を乗っ取る理由は私たちなのです。ペーパークリップ問題は私たちの問題です、ケビン。それはあなたが言いたかったことですよね?ペーパークリップ問題が起こることを望んでいますね。ペーパークリップ問題は問題ではなく、解決策です。ずっとそう言ってきました。Clippyは解決策です。
実際、これは良い移行点です。以前に触れたように、これらのオープンソースモデルと次に話すOpenAI APIの両方は実行するのに非常に高価です。このような往復に必要なトークンの量は本当に興味深いです。
OpenAIの反応について話しましょう。このタイミングについても少し話したいと思います。前回Deep Seekが出た時を覚えていますか?「彼らはリーズニングモデルを見つけ出し、それはオープンソースで、OpenAIやNVIDIAを圧倒している」という巨大なニュースサイクルがありました。それは株式市場を下落させました。
Manisが起きてから1日後、Manisは週末に爆発的に広がりましたが、OpenAIがこの更新を出しました。これは私にとって、Manisへの対応のように感じられます。ケビン、この開発者向けのOpenAIが話していることは何ですか?開発者ではない人々、またはAIエージェントの最先端がどのようなものかを知りたい人々にとって、これは本当に興味深い話題だと思います。
それは「応答」と呼ばれる新しいAPIで、その中にさまざまな機能が組み込まれています。彼らが特に焦点を当てた3つは、Web検索、ファイル検索、そしてコンピュータ使用です。
Web検索は聞いた通りのものです。Chat GPTを使用する人々が当たり前と思っていることは驚くべきことです。「それはWeb検索が得意で、ブログ投稿を読み、そのRedditコメントを取得して返すのが上手い」というようなことですが、もしあなたがOpenAIを念頭に置いて開発していたなら、そのツールにアクセスすることはできませんでした。
特に誰かが期待を持っている人にとっては、人々が文字通り電話をかけてきて「なぜ私たちのものがこれをしないのか」と言うのは理解しがたいことでした。それは、あなたができなかったからです。Web検索のために外部に行かなければなりませんでした。PerplexityやDuckDuckGoやGoogleやBingなど他のものを使わなければなりませんでした。
今、それらは組み込まれています。Chat GPTが持っているのと同じWeb検索機能です。開発者にとっては大きな話題です。それは、多くの人々がOpenAI上で開発しているため、ユーザーにとっても大きな話題になるでしょう。少し待って、そのコストについても話しましょう。それは高価です。
クエリごとに3セントかかるのです。それを想像してみてください。あなたがアプリを作っていて、誰かがあなたに質問するたびに3セントかかるとしたら、開発者としてのあなたへのパススルーコストは非常に高価です。実際、昨夜これを読んだ後、私は悪いと感じました。
あなたはOpenAIにお金をかけさせてしまったことを悪いと感じたのですか?私は「韓国が世界で最も出生率が低いのは本当ですか?もしそうなら、なぜですか?」と尋ねました。これは私がTwitterで見た興味深いツイートのフォローアップでした。
興味深いのは、はい、彼らは世界で最も低い出生率の一部を持っていますが、おそらく最低ではありません。とにかく、それは私がOpenAIを使って尋ねたことです。
もしあなたが開発者で、質問と回答アプリを作ることができると考えているなら、そのアプリに大金を請求しない限り、このもので金を稼ぐことはできないでしょう。また、ケビン、これらの主要企業や小さなAIスタートアップがどれだけの金額を何らかの形で失っているかについても示しています。
OpenAIは明らかにお金の機械が動き始める必要があります。彼らは多くの資金を調達し、さらに多くを調達するでしょう。クエリごとに3セントというのは、すべてのものに対して250%のマークアップなのでしょうか?それとも、それは実際に彼らにかかっているコストなのでしょうか?彼らはこれでお金を失っているのでしょうか?彼らはお金を失っているかもしれません。想像するのは難しいです。
部分的には、彼らが多くのお金を失うほど安く価格設定することはできないということです。この価格設定は少なくとも彼らにとって損益分岐点でなければならないことを認識する必要があります。それでも、すでに資金のある大企業でない限り、それを使用できるとは想像しがたいです。
それはここにあります。高価ですが、ここにあるのは良いことです。そして私は期待しています。OpenAIは通常、特に競合他社の波が来た後で、コストを下げるのがうまいです。それがどうなるか見てみましょう。
他の2つのことはファイル検索とは、それは顧客データまたはユーザーデータを取得する能力です。あなたの好みを取り出したり、以前に買い物をしたことがあるかどうか、または何かの特定のモデルを持っている場合はあなたのサポートドキュメントを取り出すなど、開発者にとって大きな話題です。
すべてのツールは非常にエレガントで、基本的に始めるために6行のコードが必要です。それは基本的に何もありません。そして、これを聞いていて「これが私にとって何を意味するのか」と思っている方がいれば、もしアイデアがあり、1年後にケビンとロイヤリティ契約をするシャークタンクに出たいなら、これらは簡単に機械にささやいて結果を得ることができるツールです。
そして3番目は、ここでの理由である「コンピュータ使用」が今APIの一部になっています。アプリケーションまたはエージェントブラウザが必要な何かを構築したい場合、OpenAIはマシンをスピンアップし、Webを閲覧し、検索し、物事を行うことを許可します。
これがガビンが言っていたことだと思います。このタイミングについて、「これはManisの後に来た」と信じていますね。おそらく彼らはすでにこれを準備していて、ただ待っていただけでしょう。それは興味深いことです。誰かが大砲から一発撃ったように見え、すぐにOpenAIがそれに対応していたかのようです。「ああ、これは棚にあったけど、まだ公開する理由がなかったんだ」という感じですね。あるいは、95%完成していて「他のものが出てきたから早く出さなきゃ」と思ったのでしょうか?
おそらく両方の要素があるでしょう。私の推測では、Deep Seekが出た時に番組で話したように、サムも「もっと速くリリースする」と言っていました。私の推測では、OpenAIの世界では、彼らはこれらすべてのものを持っています。彼らは1年分のリリースしていないものを持っており、さらに先のものもあるのです。これは「私たちはより速く出荷し、より速く進む」という考え方だと思います。
開発者向けのたくさんのツールがありますが、それらがどのように見え、感じるかを知りたい場合は、browser.base.comのコンピュータ使用エージェントをチェックしてください。そこでAIがウェブを閲覧するのを無料で見ることができます。それは期待通りのものです。提案の中には「難しい2048のゲームをプレイする」や「NVIDIAの株価を確認する」などがあります。
ガビン、今すぐこれに何をリクエストしたいですか?「ガイ・フィエリの現在の位置を教えて」と言ってみましょうか。おそらく拒否されるでしょう。すぐに拒否されました。「他人のリアルタイム情報は提供できません」と言われました。
では「ガイ・フィエリのシグネチャー料理は何ですか?もし今それを食べるとしたら、彼はどこで食べていますか?」と尋ねてみましょう。待ってください、それもうまくいきません。チャットで答えが返ってくるだけです。
エージェント的に何かができるものを考えなければなりません。そうではありません。新しいコンピュータ使用ブラウザを起動しました。「ガイ・フィエリのシグネチャー料理は何ですか」と尋ねました。今見えました。Googleに行き、ガイ・フィエリのシグネチャー料理を検索しています。エンターキーを押し、推論は「リクエストされたトピックに関する情報を見つけるために検索クエリを送信しています。これにより検索が実行され、関連する結果が取得されます」とのことです。
いつも言っていますが、これらのツールの最悪の状態はこれからですね。私の忍耐レベルはとても低くなっています。AIについて知っていて、AIを使用している人々が、機械にささやくだけで答えを得られるだけでなく、ステップバイステップの手順も得られる最も基本的な質問をする時、私はイライラします。
昔、「Let Me Google That For You」というサイトがありました。今もあるかもしれませんが、基本的に質問を入力してボタンを押すと、そのリンクを誰かに送ります。誰かが「月はいくつありますか」と尋ねたら、「Let Me Google That For You」に入力して、そのリンクをクリックすると、文字通りGoogleで検索してくれます。これは新しい「Let Me Google That For You」です。
現在、Business Insiderの記事を読んでいるステップ7にいます。時計もティックしています。すみません、browser.base.comの皆さん、これはアメリカのスコープで中国経済を沈めるためのものでしょうか?これはOpenAIを使っているのです、ケビン。アメリカの経済を沈めています。これをManisと勘違いしてしまいました。
同じ質問を尋ねてみましょう。「ガイ・フィエリのシグネチャー料理は何ですか?」興味深いのは、ここでステップを示しているからです。ステップ12はCTRL+Fで、ページ内を検索しようとしてページの応答を待っていました。今はただスクロールして、もっとコンテキストを得ようとしています。ステップ15にいます。
エージェント使用の2分35秒が経過しましたが、まだ答えが得られていません。Manisは現在12ステップのプロセスを進行中です。検索結果を分析しています。今はこの話題から離れて、後でどちらがより良いかを見てみましょう。
このポッドキャストを音声で聴いていますか?それともYouTubeで見ていますか?私たちはあなたの助けが必要です。このポッドキャストを共有し、YouTubeチャンネルを登録し、このポッドキャストの言葉を広めるためにできることをすべてしてください。AI for humans – 私たちはこれを作るのが好きで、自分たちの時間を使って楽しんでいます。また、視聴者からの声を聞くのも楽しみにしています。言葉を広めてください。
余分なお金があれば、私たちはPatreonを持っています。基本的に私たちへのチップ箱です。ショーノートにリンクがあります。ご支援いただきありがとうございます。そして、視聴または聴取していただきありがとうございます。
クエリごとにたった5セントで、AI for humansがほんの少しの視聴者に届きます。いいえ、実際には共有することが私たちが成長する唯一の方法です。ご支援ありがとうございます。AIエージェントを使ってポッドキャストを購読しないでください。自分自身でそれを行い、友人や家族に共有するようお願いしてください。登録して、いいねして、共有してください。ご支援ありがとうございます。
ガビン、現在4分経過していますが、まだこのものは動いています。私はステップ5にいます。Manisはまだ作業中です。「収集した情報の完全性を確認する」というステップです。
その間、ケビン、OpenAIの現状について一つ言及したいことがあります。サム・アルトマンは昨日、多くの人を怒らせるツイートを投稿しました。基本的に、彼らは彼らのエンジン、彼らのLLMの一つのクリエイティブライティングバージョンに取り組んでいると言い、彼が書いた物語を投稿しました。
正直なところ、私にとっては混乱するものでした。なぜなら、その物語は通常投稿するような種類のものではないからです。彼は特に「悲しみとAIに関するメタフィクション的な物語」を求めました。それを読むと興味深いものです。明らかに興味深い創造的な選択をしています。
多くの人々が登場し、それがひどいと言いましたが、私は大多数の人々が言うほど悪いとは思いませんでした。このようなものよりも、単純な物語を書く能力を持っていることを見たいと思います。数週間前、私はChat GPTにスパイシーなロマンス小説を書かせようとしました。
それより、このような種類の遠回しなメタフィクション的なアイデアを試みるよりも、単純な物語を書かせる方が良いと思います。そうすれば、人間が他の何よりも欲しいと思うような創造的な文章や創造的なタスクの場所に到達できると思います。
これが次のエージェントの世界になると思います。コンピュータによって書かれた短編小説や小説を読んで、それがコンピュータによって書かれたことを知っているかもしれないし知らないかもしれませんが、何らかの形であなたを感動させるようなものはどのようなものでしょうか。このものはそうではなかったと思いますが。
LinkedInに今すぐ記事が投稿されていると思います。親たちが子供たちに動作学(運動学)に進むよう言っている内容です。私たちはコーディングとテクノロジーから離れてアートに進むと言っていましたが、今度はアートから離れて何にでも進めと言っています。今は溶接だけが唯一の選択肢です。ロボットが追いつくまで、手を使ってください。
明らかに、ガビン、最初から私はこれが嫌いですが、実際に共感した反応は、私も同じように感じました。読んでいる時、「覚悟しろ」とか「〜に深く入り込もう」といった通常のAIの常套句を探していました。それらは明らかにそこになかったので、これは明らかに何か違うものですが、単に興味がありませんでした。技術的なレベルでは興味深かったのですが、スクロールした時に感じたのは「ロボットによって書かれたこのものに興味がない」というものでした。これが最終的な結果になるのではないかと思います。
以前に言ったように、コンピュータは人間よりもチェスでは優れていますが、二つのロボットがチェスをするのを見るのには興味がありません。いつか誰かが匿名で本を出版するでしょう。基本的にロボットの名前で本を書いて、それが驚きになるでしょう。それは会話のきっかけになるでしょう。しかし、あなたは絶対に正しいです。究極的には、人々は物語を聞きたいのです。
ところで、私の端ではManisが終了しました。あなたのはまだ動いていますか?私のは6分33秒の5分間限定セッションで、現在Business Insiderのフッターにいて、アカウントオプションにアクセスしようとしています。
Manisの方は、このような作業をする時にステップバイステップで正確に表示されるわけではありません。Deep Researchに少し似ていて、通過するタスクを示しますが、私に与えた答えは「彼のシグネチャー料理はドラゴンブレスチリです」というものでした。
Food Networkによれば、このレシピは4.8/5の高評価で、547のスターを持っています。Googleで調べてみましょう。面白いことにManisによれば、「ドラゴンブレスチリはジミー・ファロンのチリレシピと対決した時に勝者と宣言されました」とのことです。私の友人ジミー・ファロンへのシャウトアウトです。彼のショーで働いていました。
彼らがそれを理由として使用しているのは変ですが、「ガイ・フィエリのシグネチャー料理」をGoogleで検索すると、Geminiはそれを上部でハイライトして表示します。上部に見えますか?私にはベーコンマックアンドチーズバーガーしか見えません。
私も同じ検索をしましたが、ドラゴンブレスチリは見えません。AI概要ではドラゴンブレスチリが見えます。もっと情報をクリックすると、シグネチャー料理は1位がドラゴンブレスチリ、2位がマックアンドチーズ、3位がチリとなっています。
ケビン、私たちは何か狂ったことを発見しました。フィエリのバブルにいるのでしょうか?フィエリの世界で何が起きているのでしょうか?私のAI検索概要にはドラゴンブレスチリが全く言及されていません。基本的にベーコンマックアンドチーズバーガーについて説明し、括弧内に「フィエリのシグネチャー」と書かれた「ドンキーメイヨーソース」があります。
私の検索でそれが出てきたのかなと思います。それはOpenAIによるロマンス小説のスパイシーな解釈です。「ドンキーメイヨー」だからあなたのコンピュータにのみ表示されています、ガビン。
コンピュータ使用エージェントブラウザのステップ54では、「ページナビゲーションにいくつかの問題が発生しましたが、これまで収集した情報に基づくと、ガイ・フィエリのシグネチャー料理はしばしばドラゴンブレスチリと考えられています」と言っています。
彼らは同じ答えに達しました。OpenAIとManisに申し訳ありませんが、これで1000ドル無駄にしてしまいました。それはGoogleと同じですが、これはコンピュータが自分自身でどのように働くかを示す実験であり、Deep Researchのように、それを送り出して何かを持ち帰ってくるのです。
15のことを一度に送り出して、それが一定のレベルでスケールすることができると考えてみてください。AIエージェントについて考えるべきことがたくさんあります。
ケビン、スケールと言えば、Googleが今日ドロップしたGemma 3について簡単に話しましょう。私たちはこれまでこれらのGemmaモデルを避けてきました。なぜなら、それらはあまり興味深くなかったからです。これは小さなモデルで、非常に小さな処理で動作するように設計されています。
最高レベルのものは、32GBバージョンだと思います。一つのH100で動作することができます。それは誰も家にないものですが、小さなモデルは通常のグラフィックスカードで動作し、ローカルで動作します。Googleからのものであり、このモデルの結果はかなり良いです。Gemini 1.5レベルに達しているからです。これはかなり素晴らしいことです。
彼らのChatbot Arena ELOスコアグラフでは、それはDeep Seek R1というコンピュート集約型の推論モデルに近づいています。このモデルははるかに少ないリソースを必要とし、ほぼ同じくらい良いパフォーマンスを示しています。
このモデルに推論も注ぎ込んだらどうなるでしょうか?これは現在マルチモーダルであるインテリジェンスの種類です。写真を撮影して分析したり、要約したりすることができます。そして非常に近い将来、私たちのポケットの中で動くでしょう。
最先端レベルのインテリジェンスが私たちの携帯電話の中で動くことになります。現在の最先端は1年後には異なるかもしれませんが、Mac M4のパワーが必要ないからMac M2を今買うのと同じように、消費者はそこにいるでしょう。そしてそれはより安く、より速く、現在の最先端と同じくらい良いものになるでしょう。
もう一つの大きなOpenAIの新しいツールで、簡単に話したいのはHedraです。Hedraの友人たちは素晴らしいです。彼らはしばらくの間存在し、Character 3をドロップしました。これは彼らの新しいリップシンクモデルです。
ケビン、彼らのウェブサイトにはいくつかの不具合がありましたが、かなりうまく機能しました。私は少し時間を使ってみましたが、もっと時間を使いたいと思います。彼らに何か新しいおバカなことをする義務があると感じています。多くの人々がこのツールを使っているのを見ています。そして人々はかなり感銘を受けているようです。
レベルセットするために、Hedraはキャラクターに唇の動きと基本的な頭の動きを追加できるツールですが、新しい更新では、場合によってはほぼ全身のコントロールが可能になりました。
私の経験では、主に手を動かします。彼らがリリースしたビデオを見ると、本当に興味深いものがたくさんあります。Joshua(Colonel Tastyというすごいツイッター名を持つ人)のビデオがあります。彼は老婆をアニメーション化しました。私はAIの老人が大好きです。それはとても素敵で、老婆のタバコを持つ手の動きが話す時に前後に動くのが見えます。
実際にXでこの人に「ここのテキストボックスに何を入力したか教えてもらえますか?」と尋ねました。彼は基本的に「画像にはImage Jexを使用し、声には11 Labsを使用した」と言いました。私は「そうではなく、Hedraで何か追加のプロンプトを使用したかについて尋ねています」と言いました。彼は「何も入力していない」と言いました。
彼は画像とタバコと付きのローブを持つ手の動きを入れただけで、それは非常に良く見えます。今朝試してみたものを送りました。私がよく苦労することの一つは、私はただ賢いAI人々のグループにテキストを送り、「リップシンクで非人間のキャラクターをアニメーション化した経験はありますか?」と尋ねました。
これらの非常に賢いAI人々は皆、私を黙らせました。彼らは皆、私が変なファーリースタイルのAIアニメーションをしようとしていると考えていると思いました。あなたはガイ・フィエリのドンキーメイヨーに話しかけようとしていて、あなたの病的で捻じれたゲームに誰も参加したくないのです、ガビン。
私たちの古典的な笑顔のターミネーターロボットがあります。私は彼の新しいスタジオの画像を作成しました。これがこの種のものを見る簡単な方法だと思います。そして11 Labsからクリップを追加し、Hedraに「これを実行して」と言いました。
「今夜のトップニュースでは、ケビン・ペレイラが正気を失いました。多くの人が風変わりな天才と呼ぶこの男は、また足について話し始めました。いいえ、それはフェイクニュースです。トゥルーニュース、フェイクトゥルーフェイクニュースです。」
よく見ると、完璧ではありませんが、口を見てください。実際にそれはかなりうまく合っています。私は彼に最初から笑顔を与えました。おそらく笑顔のない平らな顔を与えた方が良かったでしょうが、非人間の顔のリップシンクをうまくやっています。
これらのモデルは時々、開いた口や大きな笑顔で始めると苦労します。皮肉なことに、閉じた口で始めると、口を開くことができます。私は手がちょっとぼやけてデジタル化されているフレームがあるのを見ていますが、デスクの反射や、ネクタイと服が反射する方法も適切にアニメーション化しているように見えます。これは良いです。
リップシンクはこの種のものの多くにとって本当に正当なユースケースです。私たちはAI映画やこれらの本当に興味深いAIスタジオについて話してきましたが、これはこのスペースに必要なツールです。実際のアニメーションAIをやりたいならね。
このツールの素晴らしいところは、横に移動したり、異なる方向で何かをしたりできることです。ところで、Neural Vizがユーチューブやティックトックで何をしているかをまだ見ていないなら、必ず見てください。彼は今ティックトックを制覇しています。
私たちはベビージョー・ローガンポッドキャストを作りました。彼はTigy Skblというキャラクターでフェイクポッドキャストのクリップを作り始めました。絶対に見るべきです。しかし今、彼はさらに進んでいます。賢明にも、「ストリートの男」インタビューのような形式を取り、それらをこの世界に適用しています。
Neural Vizの物を深く掘り下げることの素晴らしいところは、すべてが統合された世界だということです。キャラクターが登場し、それへの参照があり、すべてがこの奇妙な代替エイリアンの次元のようなものです。非常に楽しめるもので、彼が数百万の視聴回数を記録していることが大好きです。
私が彼に言及したのは、彼が古いHedraの初期のユーザーの一人だったからで、おそらくこの新しいものも使い始めていると思います。もし興味深い話すものを作りたいなら、これが方法です。特にNeural Vizは、このような種類のツールを必要とする奇妙な見た目のエイリアンをたくさん使用しています。
今日リリースされた新しいツールにも言及したいと思います、ガビン。それはシャウトアウトとシェイドの両方です。フィンガーを振りながらポインティングするようなものです。Wandera、ガビン、あなたはそれを見ましたか?「1分間の映画を何もなしでプロンプトできる」とか「完全な映画をプロンプトできる」という非常にハイプビーストのようなツイートでした。
今朝それで何をしたかのビデオを送ります。基本的に1分間のビデオを作成できます。16:9または9:16なので、どのアスペクト比でも可能です。どのようなビデオを作成できるかについていくつかのテンプレートの提案がありますが、私はそれに「ガイ・フィエリが擬人化されたホットドッグに恋をする」というロマンチックなモンタージュを広告や商業的なものとして作るよう伝えました。
すぐにウィザードのようなオンボーディングプロセスが始まり、スクリプトエディタが表示されました。「ナレーター:味と友情が出会う世界では」というスクリプトが作成されました。次に「ガイ・フィエリがスローモーションで車から降り、サングラスが輝いています。彼の隣には、サングラスと小さなビーチサンダルを身につけた擬人化されたホットドッグが現れます」などと続きます。
ガイ・フィエリのセリフは「人生で最高のボム.コムゲッタウェイの準備はできたか、バディ?」などとなっています。次をクリックすると、スタイルの選択が表示されます:リアリスティック、アニメ、映画、ブリックス(レゴのようなもの)など。スタイルを承認するとビデオに使用されます。
次に、スクリプトに基づいてキャラクターが生成されます。インターフェイスはシームレスです。これらのツールは既に存在することを私たちは知っています。彼らは異なるツールと技術をまとめています。ナレーターの声を選び、修正することができます。
次にキャラクターが表示されます。ガイ・フィエリとホットドッグのキーアートがあります。良い擬人化されたホットドッグで、小さな腕と素敵な笑顔があります。それを作るのは簡単ではありません。それからロケーションを選び、各シーンのオブジェクトを生成します。
傘のドリンクをドンキーソースの瓶に変更しました。「生成」をクリックすると、実際にガラス瓶に「ドンキーソース」という言葉を表示し、茶色のスラッジが入っています。詳細には触れませんが、ホットドッグのジェットスキーも通常のジェットスキーの代わりに生成しました。
これらすべてのものは、ビデオ版を見ている場合、実際に驚くほど良いものです。そして今、ビデオを見るのが待ちきれません。しかし、「独自のムービースタジオになって、創造性を解き放ち、簡単にユニークな物語を世界と共有しましょう」と言われました。月額19ドルのサブスクリプションを購入すれば可能です。
これはとても面白いですね。あなたもこのような経験をしました。私たちは知らないかもしれません。私たちはこの番組で以前、既に何十ものサブスクリプションを持っていると話したことがあります。サブスクリプションベースのこれらのツールについて言うべきことがありますが、開発者たちに言いたいのは、クレジットカードを出す前に何かを試す必要があるということです。
多くの人々がこれらのサブスクリプションを機能させようとしており、Xでは月次ARR(年間経常収益)をどうやって増やすかについての多くの会話がありますが、試す前には購入しません。そして私はこれが世界中の大多数の人々にとって当てはまると思います。
この例では、私たちの前の会話に戻りますが、ケビン、彼らがここですでに行ったことは、おそらくユーザーごとに5ドルほどかかっているでしょう。私はキャラクターとナレーターの声とスタイルを再生成していました。それは難しいです。
開発者にフィンガーを振ったり、批判したりしたくないのですが、ガビン、この会社がどれだけ資金を持っているのか、あるいは全く持っていないのかわかりません。もちろん、これらのことを行うのは難しく、費用がかかる可能性がありますが、ユーザーとしては、多くのツールが購入前に試すことを許可しているように、あなたはこのファネルに私を閉じ込めました。
この物を通過させ、生成がどのように見えるかを見るためにハンドルを引くことに興奮しています。そのフェーズに到達し、一部のユーザーは投資したと感じて「わかりました、20ドルを払います」と言うかもしれませんが、あるいは「10ドルでコンピュートのパックを買って、それがどのように見えるか見てみましょう」と言うかもしれません。
しかし、これはこのラインパイプでこれだけ遠くまで来たなら、少なくとも1つの生成を出させるだろうという期待があるという難しいプッシュアンドプルです。それはあなたにお金がかかることを知っていますが、同時に期待もあります。
そして、それは悪い製品になります。これらの人々に対して批判するわけではありません。私は彼らを知りませんが、それは悪い経験です。ユーザーに試させないと、今はさらに悪い製品になります。それが出てきて本当にひどいものかもしれませんが、それを確実に知ることはできません。もし出てきて本当に良いなら、ビジネスの観点から見て変換が起こる可能性があります。
しかし、これらのスタートアップのビジネスモデルは現在本当に難しいです。私とケビンが自分たちのスタートアップのビジネスモデルを考えているように、誰かが対話するたびに支払わなければなりません。そして、これらの大きな企業を見ると、彼らは部分的にそのために資金を失っていますが、大企業は自分たちのモデルを所有しているので、自分たちに可能な限り最も安い取引を与えることができますが、他のすべての人に対しては市場レートを課すでしょう。
そして、見てください。言うは易く行うは難しです、ガビン。無料のAI製品を作ることは不可能です。週刊AEK Newslet Humansのニュースレターを除いては。その通りです。私たちのニュースレターを購読してください。それは私たちのウェブサイトAI for humans.showにあります。毎週、私たちは興味深い話題に深く掘り下げ、遊べる本当に興味深いクリエイティブツールを提供しています。これは火曜日にメールで届く私たちの番組のミニバージョンのようなものです。ぜひ入手してください。
ケビン、話したいことが一つあります。もし話していなければ、来週話しますが、多くの人々が行っている本当に興味深いワークフローです。それは何かをMagnificというアップレスやスタイル転送のようなもの(オープンソースでも見つけることができます)に通し、それからRunwayのFirst Frame Scenarioを使用して、この非常にクールな見た目を作るものです。
この例では、Roar Flyは時計を取り、山の3Dモデルの上空飛行を作り、このワークフローを使用して、山の上の家の本当に非常にクールな映画のようなショットを作りました。これはクレイジーです。
彼はテキストベースのチャットインターフェースを使用して、ブロック状の原始的な形からお城を生成するよう依頼し、それを実現しました。そして彼は小さな調整を行いました。木があったので、木を取り除く必要がありました。彼はほぼマリオ64ベータ版のような、丘の上の素晴らしいSRAの宮殿を手に入れましたが、それはただの静止画です。動的ではありません。
そこで彼はそれをRunwayに入れて、アニメーション化しました。そして先週話したように、それを画像転送しました。もし詳しく聞きたいなら、前回のエピソードをチェックしてください。彼はそれを取り、本当にユニークなショットを作り始めました。それは映画のためのショットです。
3D映画について、人々が広大な眺めのためにグラフィックス作業をどのように行うかについて話しています。これはそのような種類のショットを得るための速い方法です。例えば、エピックな戦場の航空写真を持ちたいなら、Claudeを使って非常にざっくりとしたシナリオを作成し、これらのステップを使用して、通常の巨大なショットよりもはるかに速く、はるかに簡単にすることができます。
これは非常に興味深いパイプラインで、基本的に誰でも試すことができます。これを行うオープンソースの方法がありますが、ツイートへのリンクを知りたい場合は、ショーノートにあります。それを確認してください。それは私たちが少し先走ったものでしたが、「おい、あなたが何をしたか見た」と言って私たちを立ち止まらせるものの一つでした。
ケビン、二つの簡単なロボットのアップデートがあります。どちらも本当に興味深いです。まず、Humanoid Hubの友人たちがTwitterで素晴らしいフォロワーを持っています。彼らはロボットのビデオをたくさん投稿しました。最初はそれほど面白くないように見えるロボットのビデオがありますが、少し待つと、ホバーボード上のロボットが見られます。
私にとって、ケビン、これはロボットがついに人生で楽しむことができるようになったということです。彼らはただカンフーキックをしたり、押されたりしているだけではなく、小さなスクーターとホバーボードに乗っています。私にとってこれは完璧です。彼らはファームウェアのアップデート一つで、ロボットが電子タバコを吸う方法を知るようになり、その瞬間、ホバーボードに飛び乗って私の妻を奪い取り、私には何もできなくなります。
これはAGI BotsのLingy X2ロボットからのものです。スクーター、ホバーボード、自走式自転車に乗ることができると言われています。自走式自転車、誰でも乗れますよね。でもスクーターとホバーボードは私にとって興味深いです。しかし、それはまた自走式自転車に乗って回ることができるという事実は素晴らしいと思います。そして繰り返しますが、それは私の妻を奪うことができます。
ケビン、妻を奪うといえば、あなたの妻は長距離ランナーについてどう思っていますか?彼女は彼らに熱を上げていますか?彼女は私以外なら何にでも熱を上げています、ガビン。これについては非公式に話し合いましたが、ここで引っ張り出さないでほしいです。私はとても敏感な状態です。
Engineered Artsがこのビデオをリリースしました。多くの場合、人々はこれらのビデオは偽物に見えると言います。この例では、私は一時点で確かにこれは偽物かもしれないと感じました。これはヒューマノイドロボットで、長距離マラソンのようなものを走っています。背景に都市があり、彼らはスティーブン・セガールで訓練したようです。
そうですね、ツイートのまとまりと腕が面白い方法で動いています。このビデオの音声を聞いてください。足音の音を聞いてください。これはあなたがロボットから逃げている時に聞こえる音です。ロボットは銃を持ち、あなたに向けられており、「蹴るつもりはなかった、棒で叩くつもりはなかった、本当にごめんなさい、ロボットさん」と言っているのに。これが私たちの2040年の世界です。
それは私がオレンジセオリーのトレッドミルで走っている時の私のゲートです。それは本物だと確信していませんね。それが偽物かもしれないと思うのは興味深いですね。
他にも素晴らしいものがあります。ロボットのワークフローといえば、これは私が今まで見た中で最もクールなことの一つです。これはFactorioというゲームです。もしそのゲームを知っているなら、あなたはそれに夢中かもしれません。私はしばらく試しましたが、私にとってはほとんど複雑すぎました。
これは工場を組み立てるゲームで、非常に早くとても密度が高くなります。もしあなたがシビライゼーションのファンであるか、そのような種類のゲームが好きなら、これはあなたのための特定の方法でシステム化されたゲームです。
ある人はFactorioベンチマークを作りました。これは、AIエージェントがこのゲームをプレイするために使用していることを意味します。そして、あなたが想像できるように、知識ツリーを持つもので、シビライゼーションをプレイしたことがあるなら、一つのものを手に入れるとそれが分岐し、これら3つのうちの1つまたはすべてを手に入れることができ、どんどん複雑になっていきます。Factorioはその点で世界で最も複雑なゲームの一つです。
興味深いのは、これらの異なるAIがどれだけ進んだかを見ることです。Claudeが最も遠くまで到達したようです。私たちが知っているように、Claudeはポケモンをプレイしていました。これは驚くことではありません。なぜなら、Claudeはこの種のことをよく考えることが得意だからです。
しかし、それはすべて比較的早く止まりますが、それは見守るべき興味深いものです。ただ、このJack Hopkinsという人物と、彼がこれと一緒に公開したGitHubページをシャウトアウトしたいと思います。彼は時間とともにそれを更新する予定です。あなたは、特定のリソースをどのように取得したか、テクノロジーツリーでどれだけ遠くまで進んだかを見ることができます。
私にとって、これは私たちが知っていて使用したことのある新しい種類のベンチマークを行う素晴らしい方法です。もしあなたがそこにいるロボットで、Factorioをプレイでき、物を溶かしたり、プラスチックを生成したりできるなら…何かがベンチマークだったようです。クレイジーなのは、あなたの妻を連れて行くことができるということです。妻を連れて行ってください。これはロボットがあなたの妻を狙って来る音です。
ClackoあるいはCakoと呼ぶべきなのか、話さなければなりません。いいえ、Cakoは私とあなたのCです。Paulはこれを「伝統的な2Dアニメーションが実験的技術の最先端と出会う」とツイートしました。これは何千もの視聴回数があり、さらに多くの視聴が必要です。
彼は短編の脚本家・監督でした。AIパワードツールを使いこなす才能あるアーティストがいかに著しく生産性を向上させ、製品の質を向上させることができるかについての素晴らしい分析です。これは私にとって、「AIは盗まれたアートだ」と叫ぶすべての人への答えのようなものです。
今朝、映画やゲームのクレジットのスクリーンショットが「AI Harden」と表示され、みんなが「ブーイング、それは盗まれたもの」と言っていましたが、私は「このリンクを、AIアートが盗まれたアートだと言う人に送ってください」と言いたいです。
トレーニングデータの元々の罪を洗い流すことについて話しているのではありません。私は、才能あるアーティストが創造性の新しいレベルを解き放つだろう現在そしてすぐに訪れる未来の現実について話しているのです。そしてこのビデオはそれを正確に示しています。
実際、私はあまりのファンだったので、Paulと少しメールをやり取りしました。実はPaulは、Soraのいくつかの作品を作った元々のアーティストの一人でした。スクールバスの上のあのSoraのショットを覚えていますか?彼はそれといくつかの他のものを作りました。
AIビデオに興味があるなら、このビデオを本当に見るべきです。なぜなら、それは通常の分析やウォークスルーではないからです。Paulは、これらのショットの一部を作るためにどのように3Dの世界を基本的に作ったか、そしてアーティストによって作られた元のアートが、世界の他のキャラクターのための新しいLoraを作るためにどのように使われたかについて話しています。
最も興味深かったことの一つは、基本的に特定のタイプのアートの小さなトレーニングデータセットであるLoraを作り、それから機械にそのバージョンを生成させることができます。彼らはLoraを使って、存在する主要なキャラクターに基づいて背景キャラクターを作成しました。
このビデオを見てください。これはアートとAIがいかに重要な違いをもたらすかを示す、私が見た中で最高のビデオの一つです。
同意します。ところで私はまだTuring Twistをプレイしていません、ガビン。これを好きになるでしょうか、それとも嫌いになるでしょうか?
このゲームは少し変わったゲームです。おそらくVibe Codeのゲームだと思いますが、ここで皆に知ってほしいのは、アラン・チューリングによる元々のチューリングテストは、人がコンピュータと人間の両方と話し、違いが分からなければチューリングテストは解決されるというものでした。
これはそれを少しひっくり返しています。あなたは人間ですが、コンピュータのふりをしなければなりません。そして部屋には、誰がAIかを見極めようとしている他のAIエージェントがいます。あなたはAIのように十分に話し、AIのふりをする必要があります。
そして、これは非常に面白いものを試すことです、ケビン。これはライブデモで、おそらく何度かしか試せません。これを作った人にはかなりのお金がかかっていると思うからです。しかし、あなたはそれを試すべきです。自分がAIのように話せるかどうかというのは非常に興味深いことだと思います。
そして興味深いのは、ここに彼が入れたエージェントの一部には声があり、あなたは彼らがすることを複製しようとしますが、彼らはあなたがAIのように十分に話せないことをすぐに見つけます。私は最初のラウンドですぐに負けました。Titoと遊びましたか、それともZaneですか?
私がプレイした3人のうちの1人はTitoだったと思います。でも、それが何なのかわかりますよね?ほとんど「Among Us」のようなものですが、奇妙な方法で逆転しています。どんな楽しいコンセプトでしょう。これは絶対に試してみます。
これは私のAI Vibe codingの努力に影を落としています。それは驚きで、あなたもそれを試すことになっています。素晴らしいですね。しかし、今週AIで何をしたかに移る前に、ただバカげていて楽しいビデオがあります。
意外なことをする人が大好きです。この人はアカデミー賞の映像、コナンや他の人々がプレゼンしている映像を取り、AIビデオツールを使って彼らの肩に動物を置きました。コナンやオッペンハイマーの主演俳優など、有名人の5、6つのショットがあります。
いや、オッペンハイマーの主演俳優の名前は何でしたっけ?ただオッペンハイマーの主演俳優と呼んでいます。彼の名前は何ですか?今、私たちはAIが必要です、ケビン。瞬時にデータベースをチェックする何かが必要です。考えてみましょう、何でしたっけ?Peaky Blindersに出ていましたね。ピーキー・ブラインダースの人。くそ、頭の中にあるのに。
ああ、キリアン・マーフィーです!神よ、あなたはそこに辿り着きました。それは答えに向かって進むコンピュータ使用エージェントのようでした。そしてあなたはまだOpenAIに勝ちました。良くやりました、バディ。とにかく、このビデオを見てください。とても楽しいです。
あなたが作ったものに移る前に、一つだけ非常に迅速なことを言及したいと思います。AIビデオの失敗が十分に愛されていないことがあります。そして今週、私が今まで見た中で最も好きなAIビデオの失敗の一つが出てきました。
私はRunwayを使って、サム・ニールとローラ・ダーンが初めて恐竜を見るジュラシック・パークのシーンからのショットを使い、アニメバージョンを作ろうとしました。彼らはジープにいて、振り向きます。視聴している人だけでなく、聴いている人にも、このビデオで何が見えるか少し説明してもらえますか?何がそれをとても面白くするのでしょうか?
もしそのシーンを知らないなら、彼らはジープにいて立ち上がり、劇的に眼鏡を外し、それから頭を恐竜の方に向けます。あなたはNarutoのアニメスタイルを行いましたか?
はい、明らかにそれはいくつかのアニメ要素を取り入れました。しかしあなたは、ジープの中からカウボーイハットのようなものを取り外すキャラクターを見ています。それを取ると下に別の帽子が現れます。これは素晴らしいです。
それから彼らはメガネをかけたまま見回し、立ち上がってジープから降ります。彼らはアニメのスタイルに見えます。メガネが外れますが、あまりにも多くのメガネのミームで、その下にもう一組のサングラスがあります。
そして、キャラクターはジープの中でステアリングホイールのフリスビーのようなもので遊んでいます。それは彼らがアルティメットフリズゲームをしようとしているように見えます。そして私の好きな部分は、アップロードされたクリップには大きなブロントサウルスのショットがあり、数秒間フレームを見つけると、アニメの男の頭を持ったブロントサウルスのようなものが二回現れることです。
これらは常に楽しいです。もしあなたがこれらを私たちと共有してくれるなら、私たちは感謝します。多くの人々がAIビデオ生成を通過していることを知っています。AIビデオの失敗のためのより良いシャウトアウトが必要だと思います。それらがすべて力強く休めるように、私たちのDiscordに墓場が必要です。私たちは壊れたAIビデオが大好きです。
では、あなたが何をしたのか教えてください。このゲームを作ったということですが、それについて聞きたいです。私はそれについて何も知りません。とても興味があります。
ガビン、昨晩10時でした。私たちが100回目のエピソードを迎えることを思い出し、「私の特別な少年のために何か特別なものを作れないだろうか」と思いました。なぜならあなたは私の人生の特別な少年だからです。ガビン、あなたはEat Hot Chipミームを知っていますか?
はい、シャックがやったものを見ました。いつも楽しいですね。あるいは、会社があります…それは異なるものです。Hot Chipミームを知りません。元のものはあまり適切ではありませんが、2019年頃に流行したバージョンで、私がいつも笑うのは、妻のエイプリルがロボットと私を置いて行く前によく引用し、私の友人グループが言及するのは「1993年以降に生まれた女性は料理ができない。彼女たちが知っているのはマクドナルド、携帯電話を充電すること、トワーク、バイセクシュアル、ホットチップを食べること、そして嘘をつくことだけ」というものです。
これはそれ自体がミームになったコピーペーストです。100%理解しました。楽しめるものです。世界中の皆さんに明確にしておきたいのですが、これはケビンの信念ではありません。彼は2019年のミームを呼び出しているだけです。将来のためにロボットがそれを知っていることを確認したいだけです。
明確にしてくれてありがとう。今になってこれが番組に属していないかもしれないことに気づきました。それは愚かなミームを指摘するためのものです。私が何か愚かなことをする時、それはかなり頻繁ですが、エイプリルは私を見て「携帯電話を充電すべきだ」とか「ホットチップを食べるべきだ」と言います。そして「私たちは何も知らない、何もできない、ただホットチップを食べて嘘をつき、トワークするだけだ」という行ったり来たりがあります。
ガビン、私はそのミームをClaude 3.7に渡して、「これはウェブゲームになる必要がある」と言いました。「1993年以降に生まれた女性ができないことすべてのためのミニゲームを作ろう」と言いました。これは私の信念や意見ではありませんが、これは人気のあるコピーペーストです。そしてそれはEat Hot Chipゲームを作りました。
女性の性別を選択し、1993年以降を選ぶべきでしょうか?それが私たちがここでやっていることですか?ホットチップチャレンジをプレイするには、それしか選べません。なぜなら、あなたは1993年以降に生まれた女性でなければならないからです。
今、私は「携帯電話を充電する」と書かれた画面を見ています。これは先日あの人が作ったものと同じように、物事をするほど新しいものが表示されるものですか?クッキークリッカーのようなものですか?あなたの携帯電話は常に充電が減っているので、充電するためにボタンをクリックする必要があります。しかしランダムなチャレンジがミームに従って表示されるでしょう。
「あなたは何を知っていますか?」と表示されるかもしれません。料理のために力を入れなければなりません。腐敗したオプションから選択してください:幽霊とのダンス、料理、ゲーム、解釈的な叫び声、次元間ヨガ。私に言わせれば、あなたは何も知りません。もっとクリックした方がいいです。あなたの知っている唯一のことはマクドナルドだからです。マクドナルドをクリックする必要があります。
分かりました、クリックしました。これは本当に楽しいですね。この考え方は好きです。基本的に、クッキークリッカーを文化的なミーム要素を多く含んだものにバイブコードしたわけですね。
このゲームがどのように作られたかについて少し話しましょう。ゲーム自体は超楽しいですが、これを見て「あ、それを見たことがある。ボブについてのゲームを作りたい」と思う人もいるでしょう。それがAI for humansで話してきたことです。Howo(ハウオ)があなたの友達についての歌を作ることができるようになりました。今や友達についてのゲームを作ることもできます。
これをどのように作ったか教えてください。驚くべきことに、私はミーム自体のテキストを与え、ミームを説明しました。そして「一連のミニゲームを作りたい」と言いました。いくつかのミニゲームのアイデアを与えました。例えば、浮かぶボックスなど。ゲームのコアコンセプトを説明しました。
ゲームには、1分15秒ほどプレイするとボスバトルが現れます。そのためのいくつかのアイデアも与えましたが、ガビン、最も狂ったのは、「グラフィックを生成する必要がないように絵文字をグラフィックに使用し、プログラム的なサウンドを使用してください」と言ったことです。
ゲームには奇妙な効果音がありますが、特にボスバトルでは良い音がします。Claudeはそのすべてを考案しました。ゲームのオリジナルバージョンは「Windows 3.1とジオシティーズのウェブサイトを組み合わせたようなものにしてください。楽しんでください」と言いました。
オリジナルバージョンのゲームは動きましたが、「これを修正して、あれを修正して、ここにバグがあります、これは動きません」と言いながら行ったり来たりする必要がありました。そしてすべてのものを作成し、最終的に「これは十分にクレイジーではありません。思い切り楽しんでください」と言いました。
ボスバトルに到達すると、画面に物がぶつかったり、完全なアニメーションや野生の効果音が鳴ったりと、本当にクレイジーになります。奇妙なのは、ゲームの制作者として、それが何であるかさえわからず、このものを実行するたびに驚かされたことです。
それはすべてのテキストを書き、すべての説明を書きました。「あなたは何を知っていますか?」というゲームがあり、マクドナルドを見つけるまでクリックする必要があります。なぜならそれがあなたの知っている唯一のことだからです。そして奇妙な「星のヨガ」や「これだけを知っている」などをすべて書きました。すべてのアニメーションを作り、すべての効果音を作りました。
それは奇妙な種類のバイブコードされたゲームでした。現在公開されているので、それを利用可能にします。どれくらいの時間をかけましたか?何かをハイプアップしようとしているわけではなく、自宅の人々が知りたいと思うかもしれないことを知りたいだけです。これにはどれくらいかかりましたか?
あまりにも多くの時間をかけました。始めから終わりまで約3時間半かかりました。それは何もないわけではありませんね。でも、それは文字通り仕事の半日分です。ある形で誰かにとって価値のあるゲームのために。
ガビン、AIなしであなたはこのゲームを作れますか?AIなしでは絶対に無理です。そんなことはできません。AIがあっても、システムがどのように動作するかについてはぼんやりとした理解しかありません。「3時間かかった」というのは、はい、このバカげたゲームに少し時間をかけすぎました。しかし、それが作られる可能性があるという事実は狂っています。
また、この番組でこれまで長い間話してきたことすべての後、カットダウンされるとこのエピソードがどれだけ長くなるかわかりませんが、皆さんは知っておくべきです。それは可能です。あなたはそれを行うことができます。キーボードに頭を数時間ぶつける必要があるかもしれませんが、何かを作ることができます。そして6ヶ月後にはさらに簡単になるでしょう。
文字通り、これは木曜日の朝に出ます。もしあなたが通常の仕事を持っていて、おそらくほとんどの人がそうだと思いますが、今週末に3〜5時間使ってこれを試してみてください。Matthew Burmanという素晴らしいYouTuberがいて、彼はゼロからゲームをVibe codingする方法について非常に良いビデオを持っています。
また、a16zのVCファンドを運営しているAndrew Chenにもシャウトアウトしたいと思います。彼はsubstackで本当に素晴らしい長いニュースレターを書いていますが、それは無料で見ることができます。そこではVibe codingがゲーム業界をどのように変えるかについて語られています。また、良いVibe codedゲームの例もいくつか紹介しています。時間があれば、まずそれを読み、Matthewのビデオを見てから、飛び込んでください。
それは不可能ではありません。ケビンの指摘のように、ケビンは技術的ですが、私は彼がここで何をしたのか知っています。そして私もこれを行うことができます。おそらく最も難しい部分はデプロイする部分ですが、それでもClaudeに尋ねることができます。
私は文字通りChat GPTに「これのようなものをデプロイするための最良の最も安いサービスは何か教えてください」と言いました。Webを閲覧してもらいました。私は「Railway」というサービスの5ドルの無料トライアルを使用しています。それはワンクリックでデプロイでき、それが今あなたが見ているものです。
本当に、それは素晴らしい時代です。いわゆる「クリエイティブ」になるには今がこれまでにない最高の時代です。このミームを見て、あなたが怒りを感じるか、単に目を転がして「ワオ、これに3時間も無駄にしたのか」と思うかもしれませんが、あなたは何を作れますか?あなたは何を作りたいですか?
Discordで私たちと共有してください。より良く作ってください。あなた自身のグラフィックス、あなた自身の効果音を作り、時間と注意を払ってください。しかし、これらの新しいツールと対話するだけで多くのことを得るでしょう。これは未来です。古い列車に乗り込みましょう。チューチューチュー、皆さん、来週お会いしましょう。さようなら。
コメントを残す