すべての人のためのAIアップグレード!

16,710 文字

AI News: Adobe’s Max 2024 showed off a ton of new AI tools like Generative Extend and Project Clean Machine, Amazon and ...

はいはい、AIのアップグレードが欲しいんか？関係ないで、AIはもうあらゆるところに入ってきてるんや。そうや、最新のクレイジーなAIツールについて話すで。Adobe、その他いろいろあるで。
それに、そのパワーを供給するために、Gavin、Amazon、Microsoft、Google、みんな原子力発電所を作ってるんや。カボーンやで、ベイビー。いや、カボーンはアカンて。
それに加えて、AIで作られたレストランのInstagramアカウントとか、走り回るロボットの靴とか、ChatGPTがお前のこと知りすぎてるとかな。そんなんについて全部話すで。
ちなみに、これは普通のAIのエピソードとはちゃうけど、人間のためのAIの話やで、ベイビー。
Adobe社の大きなMAXイベントがあってな、めっちゃたくさんの新しいAIツールが出てきたんや。Photoshopとかプレミアとかアフターエフェクトの世界からは予想もしてなかったようなもんがな。Adobe社には「Firefly」っちゅう動画プラットフォームがあって、ちょっと遊んだことあるんやけど、まったく新しいFirefly動画モデルを発表したんや。いや、発表したんじゃなくて、新しいFirefly動画モデルから動画を作ったんや。それがかなりええ感じやったな。100%オーガニック認証済みやで。まあ、それはまた別の話やけど。
後でそれについて話すけど、みんながピッチフォークを研ぐ音が聞こえへんのは、Adobe社が長い間アーティストから嫌われてた会社やったのに、今や somehow AI の希望の砦になってるからやと思うで。彼らのモデルが一番クリーンやって主張してるからな。つまり、クリエイターのデータは使われてへんってことやな。
いくつか発表されたもんについて話そか。結構おもろいもんがあると思うで。それに、これらのAdobeの製品で一番でかいのは、オープンソースで見たもんとかRunwayがやってたことを、Adobe製品のクリエイティブスイートに組み込んでるってことやな。Adobe製品は毎日大量の人が使うからな。
「Generative Extend」っちゅうのがAdobe Premiereに追加されたんや。これで、最後の2、3秒を使って新しい映像を生成できるんや。つまり、撮った映像が足りへんかったり、もうちょっと延ばしたいときに、その映像を3秒延長できるんや。これめっちゃクールやで。お前を3秒延長したろか？
まあ、モデルはベータ版やから、たまに顔が胸に溶け込んだりするけどな。
彼らが見せた例の一つは、パルクールみたいなことをしてる人の映像やった。背景の建物のデータがなかったから生成せなあかんかったんや。人間が普通に歩いてるんじゃなくて、違うポーズをしてるのも扱わなあかんかったけど、めっちゃうまくやってたで。
もう一つの例は、めっちゃぶれた旅行ビデオやった。カメラがクレイジーになる前に切って、それを延長したんやけど、めっちゃええ出来やったで。
これ、めっちゃすごいことやで。使い道もたくさんあるし、使ってるプログラムに組み込まれてるからな。これは、編集者はもちろん、監督とか自分で家庭用ビデオ作ってる人とかも、Premiereとかのアドビのツールを使うやろ。突然、これが道具箱の中の新しいツールになるんや。フォトショップのスタンプツールとか、10年から15年前に出てきたブレンドツールみたいなもんやな。
おい、BL、「Project Photo Blend」について話そか。ちなみに、名前がめちゃくちゃやで。なんか「Eli Ross project blend」みたいな感じで、6人くらいの人間をミキサーに入れて、9次元のセクター17から出てきたみたいな感じやな。
でも、俺はフォトショップとかCanvaとか、そういうの全然できへんのに、よくサムネイル作ってるからな。お前と俺はいつもサムネイルで悩んでるやろ。全然違う写真から、全然違う光の当たり方の被写体を取り出せるんや。俺みたいに日焼けした奴でも、ギャビンに合わせて色を薄くせなあかんかったりするやん。色補正して真ん中で分けたりするけど、ポイントは、違う光の当たり方の被写体を、ボタン一つでシャドウを合わせられるってことや。
ところで、家におる人たちには、まだこれ使えへんけどな。この動画にも使えたらええのにな。
とにかく、めっちゃクールなもんや。彼ら、めっちゃでかいステージでこれ発表したんや。Adobe社、何やってるか分かってるで。彼らのビジネスは、年間600ドルから2000ドルのサブスクリプションを売ることやからな。こういうもんをどんどん出していかなあかんのは分かってる。正直、めっちゃたくさんのもん出してて、それを評価せなあかんわ。
音声のやつも結構よかったで。このビデオ見てみ。ここに男がおるんやけど、ちょっと吠えてるんや。この吠える動画見た？その男の吠え方、どんな感じやった？ギャブ。「ラー！ラー！」みたいな感じやな。これが俺の真似や。ほな、このビデオ見てみ。
「ほな、モンスターの唸り声を入力して、生成ボタン押すで。俺の声の正確なタイミングとダイナミクスとエネルギーを使って生成するんや。」
今から彼がシステムに入れて、AIに彼の「ラー！」を「ラー！」に変えてもらうんや。
おい、そのジップファイルちゃうで。
ところで、俺ら二人ともめっちゃ疲れてるんや。でも、YouTubeとポッドキャストのリスナーは気にせえへんやろ。ただ情報が欲しいだけやからな。俺はTellyの会社のリトリートから帰ってきたところやし、お前は…言いたくないんやろ？
まあ、俺の犬が昨日の夜具合悪くて、一晩中起きてたんや。そんな状態やねん。
とにかく、「ラー！」を「ラー！」に変えるんや。準備ええか？みんな準備ええか？ほな、見てみよか。
めっちゃクールやな。もちろん、彼らが見せてる例は、舞台裏や研究室で何百万回も走らせたやつやで。俺も触ってみたいわ。どれくらい広範囲に使えるか見てみたいな。
最後にもう一つ、ギャブ。「Project Clean Machine」や。「Project Clean Machine」って何やねん、ギャブ？
「Project Clean Machine」は、動画から明るいフラッシュとかストロボとか照明のアーティファクトを取り除くもんや。彼らが見せた例の一つは、空に打ち上げられた花火がフレームを完全にブローアウトしてるやつやった。ボタン一つで押すと、花火がクリアに夜空に見えるようになるんや。めっちゃすごいで。
それってめっちゃ非現実的に見えへん？変な話、レンズフレアとかがない写真に慣れるのが難しいかもしれんな。今まで見慣れてたからな。2000年代初期のデジタル写真に対する懐かしさみたいなもんができるかもしれんな。レンズの質が悪かった時代のやつとかな。
でも、これはめっちゃクリアや。動画にスライダーがあって、前後に動かせるんや。花火の光で完全にブローアウトしてるカップルが見えるんやけど、スライダーを動かすと、全然ブローアウトしてない状態になるんや。信じられへんくらいやで。
ブローアウトした部分に詳細を追加してるんや。他の例では、フラッシュがたくさん光ってるパパラッチスタイルの動画があって、それをすぐに取り除いて、全部きれいにブレンドしてるんや。
全体的に見て、このイベントは予想以上に良かったわ。結構クールなもんがたくさんあったで。俺はAdobe製品を普段使いしてへんけど、これを見たらもっと興味出てきたわ。
Final CutとかLogicみたいなもんは、AIの強化とかアップグレードはどうなってんのかな。Adobeがこんなにヒット連発してるのに、NvidiaとかMicrosoftとかAppleはハンドルの後ろで寝てるんちゃうか。起きろ、Apple！
ところで、ギャブ。これらのツールを使わへん人たちのこと、誰か思い浮かぶ？
まあ、何人か思い浮かぶけど、ジャスティン・ベイトマンのことやろ？
そうや。ジャスティン・ベイトマンは、AIに対してめっちゃ強い立場を取ってる人や。俺は彼女のことを尊敬してるで。前にも番組で話したけど、彼女はAIを嫌ってて、新しい基準というか、認証みたいなもんを作ろうとしてるんや。
人間が作った有機的な映画のためのもんや。ちょっと聞いてみよか。
「去年、私とレ・モレノとマット・モーと他の人たちで、CREDO 23っていうスタンプを作ったんです。これは有機的なスタンプみたいなもので、観客にAIが使われてないってことを伝えるためのものなんです。だって、観客は知りたいと思うんですよ。本物の人間を見てるのかどうかって。もちろん、観客は騙されたいんです。ビジュアルエフェクトとか、そういうのは全然OKなんです。『パイレーツ・オブ・カリビアン』の、あの人が本当にタコの顔してると思ってないですよね。でも、そういう意味で騙されたいんであって、裏切られたくはないんです。」
これについて変なのは、彼女は映画監督で、人間と一緒に映画を作りたいんやろ。AIは使いたくないんやな。それは全然公平で大丈夫やけど、彼女が明確に言ってるのは「パイレーツ・オブ・カリビアン」の映画やねん。イカの顔した人がおるやろ。これ全部、AIの映画製作者がやってることの別バージョンやで。
これについては前にも話したけど、大手の会社はこれについて何も言うてへんけど、俺は大手のエフェクト会社が認めてるもの以外のものでもトレーニングしてるって保証するで。
さっき、Adobeが製品に入れようとしてる5つのめっちゃクールな新機能見せたやろ。ジャスティンが主張してることは分かるし、それでええんやったらええと思うで。でも、細かいところで問題が出てくるで。
VFXのスーパーバイザーがAIが入ったAdobeのツールを使ってショットをアップグレードしたりするやろ。そしたら、彼女はアンチAdobe になるんか？プレミアで編集せえへんようになるんか？Final Cutは有機的なんか？たぶんAppleのインテリジェンスが出てきたら、そうはならへんやろな。
ある時点で、本物のフィルム編集に戻って、蒸気機関で動かすようになるんか？って話になるで。
元々、AIの多くが人々の作品でトレーニングされてて、その人たちに報酬を払うべきやって話はしたで。でも、ある時点で、これが物事が進む方向やって言わなあかんのよ。エフェクトが進化する方法であり、編集する人が進化する方法なんや。これが現実やで。
映画館で騙されたり、だまされたりするのはええと思うで。めっちゃええ映画にしてくれ。でも、ソーシャルメディアのフィードでAIが何か誤解を招くようなもんを生成したり、プロパガンダやったりしたら、それは知りたいわな。でも、誰もわざわざラベル付けしようとはせえへんで。
正直、それおもろいな。彼女はラベル付けを求めてるけど、その一方で騙されたいって言うてるんや。現実逃避はええけど、InstagramとかTikTokとか、お前がニュース見てるXとかやったら、本物かどうか教えて欲しいわな。
ケビン、YouTubeで見てる俺らのことも同じやで。今すぐチャンネル登録ボタン押してくれたらええのに。ここにあるで。
登録してくれ！チャンネル登録されるの大好きやねん。ギャビンは新しい登録者が増えるたびに俺に電話してくるで。「もう一人増えたで！もう一人や、相棒！」
それに、全てのポッドキャストプラットフォームでもフォローしてな。Apple PodcastとかSpotifyとかな。
ケビン、5つ星レビューもちょっともらったで。
あぁ、ええやん！それ、俺らの好きなやつや。Apple Podcastで5つ星レビューしてくれたら、このショーの音声版で一言一句読み上げるで。音声版は全てのポッドキャストプラットフォームにあるで。
それに、ニュースレターもあるで。後でまた宣伝するかもしれんけど、めっちゃうまくいってるんや。
ほんまにめっちゃうまくいってる。みんなそう言うてるで。
ところで、他に知ってる？原子力発電が戻ってきたで、ベイビー！
ほんまや。みんな俺の顔に向かって叫んでるわ。俺のばあちゃんは反核運動家やけど、「原子力発電が戻ってきた、ベイビー！」ってバンパーステッカー貼ってるで。見るのは難しいけどな。いつも石炭を燃やしてるから黒煙で見えへんねん。でも、駐車したら読めるで。
これについて面白いことがあるんや。俺のばあちゃんは80年代の反核運動にめっちゃ熱心やったんや。これは話の導入にええと思うで。原子力発電が完全になくなった理由は二つあると思うねん。一つはメルトダウンやな。これは明らかにめちゃくちゃ恐ろしいことやった。でも、もう一つは、俺が子供の頃、お前より少し年上やけど、みんな原子力発電を怖がってたんや。
今、大きなニュースは、Microsoft、Google、OpenAI、他にもいくつかの会社が原子力発電所を開設してるってことや。実際、今週の一番大きなニュースは、Amazonが原子力発電に5億ドル投資するって話と、Googleが原子炉を作る契約を結んだってことやな。
ケビン、なんで突然原子力発電が復活してんの？なんでトキシック・アベンジャーが突然生き返るんや？これの目的は何なんや？
次世代の自動補完機能を持つためやで。これだけやで。突然変異の確率論的なやつやな。基盤モデルをトレーニングするのにめちゃくちゃエネルギーが必要やからな。チップに電力を供給せなあかんし、モデルを実行したいときも、全てのデバイスがそのトレーニングされた知能にアクセスすることになるから、エネルギーが必要なんや。
ケビンが言ってるのは推論のことやな。モデルを実行するときのことを推論って呼ぶんや。
俺は推論してへんで。はっきり言うてるだけや。
ケビン、それも推論って呼ぶんやで。でも、まあええわ。
とにかく、ここ数週間で話題になってきたのは、AIのエネルギー需要が全体的にめちゃくちゃ大きいってことや。GPT-5、6、7とか、O1、2、3とか、そういう話が出てくるにつれて、どんどん大きくなっていくんや。
NVIDIAのJensen Huangが出すBlackwellチップ、これ一つ一つが前より電力必要なんや。だから、めちゃくちゃ大きな変化が起きようとしてるんや。
人々は正当にも、「ここ20年環境の話してきたのに、これってちょっとおかしくない？」って思ってるんや。でも、彼らがやってるのは、もっと石炭を掘れとか、もっと天然ガスを探せとか言うてへんのや。「きれいな」エネルギー源があるのに、人々が怖がって使ってへんだけやって言うてるんや。
ちなみに、お前のばあちゃんの原子炉の時代から、技術はめちゃくちゃ進化してるで。これは100%安全ってわけやないかもしれんけどな。
Dominion Energyへの5億ドルの投資、SMRって言葉使ってたな。ギャブ、SMRって何の略や？
Small Modular Reactorやな。
小さいんやな。怖くないやん。膝の高さくらいしかないんやで。メルトダウンしても大丈夫やろ。
ここで大事なのは、80年代と90年代に出てきた原子力発電のことを、人々はちょっと騙されたんちゃうかってことや。離れてしもたんや。
ビル・ゲイツも最近これについて話してるで。ケリー・スウィッシャーの最新のポッドキャストでビル・ゲイツとのインタビューがあるんやけど、めっちゃええで。彼のNetflixの番組見た？今、Netflixで番組作ってるんや。その中の一つがエネルギーと気候変動についてのもんで、彼は原子力発電の大きな支持者なんや。
俺ら思ってるほど廃棄物出さへんのやで。
ちなみに、原子力産業から金もろてこれ言うてるわけやないで。でも、AIの世界でみんなが達成したいと思ってることを実現しようと思ったら、もっと電力が必要になるんや。再生可能エネルギーだけじゃ足りへんし、石炭や天然ガスみたいな気候変動を悪化させるようなもんを使うべきやないんや。
聞いてや、俺はギャビンみたいに買収されてへんで。ギャビンの操り糸見えへん？俺は何かの専門家のふりはせえへんで。ほとんど何も専門家やないし。エネルギーの専門家のふりもせえへん。でも、会話は吸収してるで。みんなが言うてるのは、もっと必要になるし、これからデータセンターが送電線の近くに建てられて、めっちゃでかいインフラの改修が行われるってことやな。
土地を買えよ、土地を買え。
ああ、そうやな。みんな土地買うてええで。
ちなみに、シンギュラリティが起こったら土地だけが価値を持つって理論知ってる？これはめっちゃオタクっぽい話やけど、El、シンギュラリティが起こったら土地だけが価値を持つんや。なんでか知ってる？
なんでやろ？ちなみに、その「なんでやろ？」めっちゃええ感じやったな。演技してるみたいやった。
本気で興味あるみたいやな。
ああ、そうか。まあええわ。それが侮辱やったんか分からへんけど。
とにかく、なんで土地だけが価値を持つか教えてくれ。
ロボットが支配権を握って、ASIができたら、サーバーファームを建てられる土地は全部価値があるんや。でも、土地の所有権を証明する書類を尊重してくれると思うか？お前の頭の上にあるターミネーターを止められへんで。
すまんけど、R800さん。実はこの土地の固定資産税、ずっと払ってきたんですよ。
まあ、そういうもんやな。ASIに「globbed」されてしもたんや。
エリック・シュミットの話しようか。今や彼が出てきて、みんなに色々言うてるんや。今、何やってるか分からへんけど。エリック・シュミットは元Google CEOやな。彼が言うてるのは、「環境なんてどうでもええ、このAIに賭けた方がええで」ってことやな。これが彼の言ってることの基本や。このビデオ見てみよか。
「データセンターのエネルギー需要はめちゃくちゃ大きいんです。イギリスでこれらのデータセンターを作るために必要なステップを承認してもらう必要があります。あなたたちの研究者、企業、市民、みんながこれを必要としているんです。
どうして私が緑のエネルギーを支持しながら、同時により多くの電力を使うことを支持できるのか。それは、より多くの電力を使うことで、新しい材料、新しい科学を作り出せるからです。最終的には核融合にたどり着きます。これがこれらの問題の究極の解決策です。
車や配電網の新素材によるエネルギー効率の改善は、めちゃくちゃ大きな影響を与えます。
AIに投資することで、逆説的ですが、エネルギー転換の解決策がより早く明らかになるんです。」
これについて言えることは、俺ら今バブルの中におるんちゃうか？
そうやな、バブルの中におるな。一夜にして何かを約束するような怪しいスタートアップがたくさんあって、すぐに吸収されたり消えたりするやろうな。ちょっとバブルやな。
でも、大きな変化が起ころうとしてるんや。この新しい技術が、これからの10年以上、アメリカのインフラや技術、雇用創出、そして混乱を引き起こすことは間違いないで。
一つ言いたいのは、それについてめっちゃ賢いことやで。お前の言うたことめっちゃ賢かったで。
正直に言うとるだけや。
俺ら、このポッドキャストを1年半くらいやってきたけど、一つ驚いたのは、アメリカのインフラがこんなふうに変わる可能性があるって話したことがあったんや。それが実際に起こっとるんや。人々は原子炉を再稼働させたり、新しい原子炉を建設したりしてるんや。これは、俺らがここ18ヶ月間話してきたことが実際に起こってるってことや。これ、どれだけ速く動いてるかを示してるで。
これは、人類学のダリオ・イモーが書いた興味深いブログ記事につながるんや。俺、これについて全部ビデオにしたで。YouTubeチャンネルに戻って見てみてな。めっちゃええビデオやで。
まあ、それはめっちゃ正直な言い方やったな。ありがとうな。
ダリオ・イモーは、アンスロピックのCEOで、以前はOpenAIにおったんや。OpenAIを離れてアンスロピックを始めたんや。彼がめっちゃ長いブログ記事を書いてな、基本的にASIとか、あるいはAGIが提供できる肯定的で楽観的な結果について書いてるんや。
俺らの番組では、よくバカみたいな動画ツールとか、おもしろいことをするツールとか、おかしなもんについて話すけど、彼が話してるのは、生物学的な改善とか、病気の解決、がんの撲滅とか、ある種の精神疾患をなくすことまで言うてるんや。PTSDの治療法とか、新しいタンパク質や材料科学の発見とかな。これはユートピア的なビジョンやで。
もちろん、それに達せられへん可能性もあるって認めてるけど、その道筋に沿って少しでも進歩があれば、人間の寿命を延ばしたり、地球上での経験の質を向上させることができるかもしれんのや。
5年から10年で、めっちゃ速く変わっていくように感じるな。地上レベルまで全部変わるかもしれへんけど、5年から10年ではそこまでいかへんかもな。でも、5年後に医者に行って、5年前なら死んでたかもしれんものの治療法をもらえるかもしれん。これが、これらの人々が約束してることみたいやな。
まだ大きな breakthrough は見てへんけど、ダリオが指摘したようなCRISPRとか、他にも科学の大きな進歩があったやろ。これらは部分的にこれらのツールのおかげやったんや。この2年間でこれに注ぎ込まれた金額を考えたら、それをさらに押し進めることになるんやろな。
ほんで、次の話題に移る前にちょっとだけ言うとくわ。Nvidiaから新しいモデルが出たんや。「Neotron」っちゅうねん。Neoトロンか、ニュートロンか、ネオトロンか、分からんけど。
ニモを探せの次は、ドロンを探せやな。
ニュートロンって、ディズニーの究極のマッシュアップみたいやな。魚が光のバイクに乗ってるみたいな。あるいは、ニュートロンが俺らを殺すロボットになるかもしれんな。空中を泳いで耳に入ってくるんやで。
「残念やけど、この土地はお前のもんやから、吸収でけへんわ。土地を譲ってくれへんか、ニュートロン？」
「アカン、ニュートロン。ワイの土地や。」
「ほな、ワイは去るで…」
まあ、ごめんな。ニュートロンはNvidiaの新しいオープンソースモデルで、700億パラメータあるんや。テストによると、GPT-4.0とClaude Sonnet 3.5のベンチマークを超えてるらしいで。俺はまだあんまり使ってへんけどな。
ベンチマークでは勝ってるけど、雰囲気では勝ってへんのやな。
そうやな、それは大事なことや。人間が何かを使うとき、「この雰囲気、ちょっとおかしいな」って感じることあるやろ。でも、ベンチマークでは勝ってるんや。
ちなみに、Nvidiaの大口顧客、MicrosoftとかGoogleとか、metaまで含めて、プロセッサーのトレーニングに何十億ドルも払ってるのに、Nvidiaが「ところで、俺らも自分のモデル出せるで」って言うてるようなもんやな。
これがオープンソースモデルの美しさやな。こういうことができるからな。
ちなみに、みんなが期待してて、今ちょっと噂になってるのは、Claude Opus 3.5やな。しばらく待ってたけど、もうすぐ出るんちゃうかな。今日は10月16日やけど、アメリカの選挙まであと3週間やな。選挙前に大きなもん出るとは思えへんけど、選挙後はもう何でもありやで、ベイビー。
Will.i.amがコーヒーテーブルの上にホログラムで現れるかもしれんな。そこにおってほしくないけど、おるかもしれんで。
ほな、SonnoのXOの話しようか。
ほな、XOの話しようか。新機能出したんやけど、俺、XOのファンボーイやねん。お前もそうやと思うで。Theoチームに感謝やな。
俺も好きやけど、ケビンほどじゃないな。
分かってる、俺ちょっと熱くなりすぎるかもな。音楽オタクやからな。
XOが新機能出したんやけど、最初はちょっと批判的に見てたんや。iOSアプリでしか動かへんのよ。Androidアプリあるかどうか知らんけど、知っとくべきやな。
iOSアプリで動くんやけど、無料でシーン生成できるんや。写真を撮るか、フォトロールからアップロードできるんや。それを曲の背景にして、歌詞がカラオケみたいに表示されるんや。
最初見たとき、「まあ、ちょっと個人的にしようとしてるんやな」って思ったんや。写真をアップロードしたら、「シーンについて何か説明することある？誰がおるんか、何が起こってるんか、どこなんか」って聞かれるんや。でも、俺は「いや、魔法みたいにやってくれ」って思ったんや。
ほんで、ちょっとトリッキーなことしてみようと思ったんや。どう動くんか分からんかったからな。今朝、「駐車禁止」の看板の前でサングラスかけて、コーヒーカップ持って写真撮ったんや。それを「火星人が適当な惑星におる」って言うたんや。宇宙旅行とか宇宙人のことだけ歌うかなって思ったんや。
でも、「火星人」って言葉は使うてたけど、「火星人が来たけど、ここに駐車できへんし、コーヒー飲んでて、暑いし」みたいな感じやったんや。つまり、物体認識とかシーン検出をして、それを歌詞に反映させてるんやな。
面白いのは、裏側のシステムを考えたら、そんな複雑じゃないんやな。今あるものを使えば、写真を撮って、ビジョンモデルで見て、「コーヒーカップがある」って認識して、それを歌詞に入れて、AIに書かせるだけやからな。
でも、こんな簡単で魔法みたいなことができるのは、すごいことやと思うで。今やってみようか？
絶対やろう。iOSアプリ開いてるで。ほら、見えるやろ。テキストも音声もできるけど、デフォルトはカメラやな。
ほな、セルフィーモードに切り替えるで。マイクもあるし、これもあるし…ええ感じやな。
ほんで、「このシーンに誰がおる？どこ？どんな音楽のスタイルがええ？」って聞かれるんや。ブラジリアン・ファンクはどうや？
ブラジリアン・ファンクええけど、グライム・ラップにしよか。
グライム・ラップって知ってる？
知らんわ。
イギリスのやつで、ちょっとOみたいな感じやな。
ああ、そんな感じか。まあまあ近いな。
ほな、グライム・ラップで、ケビンとギャビンのスタイルでな。
ほな、作成ボタン押すで。俺ら二人の綺麗な写真が出てきたで。魔法のクラウドに行ってるわ。おっ、グルーブが来るで！
グルーブ来るで！ハートにあるで！
ちょっと待て、これコンテンツフラグ立つんちゃうか？
立たへんと思うで、ギャブ。もうすぐできるで。
アプリ、ええ感じやな。広く見たの初めてやわ。
俺らの目が大きく開いてて、マイク持ってて、家におるみたいやな。ダイナミックデュオやで。
枕とか植物とか違うもん持ってたら、もっと面白くなったかもな。
でも、まあまあクールやな。基本的に写真を見て、XOが得意な曲作りをして、写真からの入力を使うんや。
友達が変な服着てたり、面白いメガネかけてたりしたら、写真撮って「ジョシュア・ツリーのリトリートにおるで」って言うたら、テーブルの上のキノコのことも歌うかもしれんな。
これ無料でできるん？
最初の一回は確実に無料やで。XOのクレジット使うてるかもしれんけど、次の生成のためにな。
チェックしてみるべきやで。少なくとも一回は無料でできるはずや。
スポンサーじゃないけど、XOが好きやからな。シーン機能、最初は批判的やったけど、やってみたら楽しかったわ。これからどうなるか楽しみやな。
ほな、みんな。今週AIで見た面白いもんを紹介する時間やで。AIシーの時間や！
お前のスクロールを止めるもん、突然現れて…
ほな、今週の面白いやつをいくつか紹介するで。俺が今週見た中で一番好きなのは、「ethos」っちゅう新しいレストランやな。
え、エトスって？
エトスは素晴らしいで。オースティンにあるんや。
ああ、そうなんや。オースティンのフーディーシーン、すごいな。俺そこにおったで。ムーダンクロワッサンあるやろ。見たことないか？
いや、食べたで。めっちゃバターが効いてて、パリパリしてて、ちょっとした歯ごたえもあるんや。
ケビン、嘘つきやな。みんな、ケビンを信じたらあかんで。このレストラン、存在せえへんのや。AIやで。
ちょっと待て。何万人もの肯定的なレビューがあって、食べ物の写真も、ウェイターの写真も、シェフの写真もあるのに、どうして偽物なんや？
これは、誰かがInstagramで実験したもんなんや。基本的に、時間かけてたくさんの偽の食べ物の写真を作ったんや。こういうの前に見たことあるやろ？Instagramでこういうの見たことあるはずや。AIで作られたもんがいっぱいいいねされたり、シェアされたりしてるんや。
あの変なプールハウスみたいなやつあったやろ。
これは誰かが基本的にそういうもんにブランドをつけたんや。高級レストランっぽく見せてるけど、ムーダンスタイルのクロワッサンとか、足の形のピザとか、めっちゃクレイジーなもんばっかりや。
偽のウェブサイトも作ってて、偽の予約もできるんや。これがもっと面白いで。実際やってみようか？さっきやろうと思ってたんや。5月14日の4時でええか？
ええで。
ほな、4時にしよか。早めの夕食や。人数は…4人でどう？
40人にしよか。
40人？まあええわ。予約可能かチェックするで。読み込み中や…おっ、誰や、こいつ？何が起こったんや？
ああ、男が象の鼻でぶたれてるみたいやな。いや、ウナギか？魚？サラマンダー？なんか魚かグミみたいなもんか？
いや、イカの足かもしれんな。
いや、ヒレみたいなもんついてるで。口もあるし。
エトスレストランのサイトでイースターエッグ見つけてもうたな。そんなに深く探さんでもええのに、予約しただけで見つかってもうた。
めっちゃ面白いInstagramのハンドルやな。コーヒー奢ってくれるってよ。
eel slap…イールスラップか。「こんにちは、5000万人以上の人が俺の顔をウナギでぶってて、サーバー代だけがめっちゃかかったわ。助けてくれたら嬉しいで」って書いてあるな。
予約しようとしたら、イールスラップのとこに飛ばされるんやな。イールスラップの人がエトスを作ったんかもしれんな。分からへんけど。
エトスの謎を解き明かす47話目まで続くで。
ちなみに、これをXに投稿したVenture Twinsに感謝やで。最初にここで見たんや、ギャブ。
ほんで、ちょっと紹介したい人がおるんやけど、John FingerっちゅうXかTwitterにおる人知ってるか？John Fingerは監督で、世界を作るタイプの人や。めっちゃストーリーテラーで、ロサンゼルスを拠点にしてるアーティストなんや。
John、あるいはJNがやってるのは、ビデオトゥーアイドの実験や。AIを使って色々やってる人なんやけど、このビデオがめっちゃクールで、自分をサイバーパンクっぽく作ってるんや。ただ、自分のガレージとか庭で撮影しただけなんやけど、それをRunwayを使ってビデオトゥービデオしてるんや。めっちゃクールやで。
プリングルスの缶がめっちゃすごいスナイパーライフルになったり、コーヒーカップが飛行皿になったりするんや。めっちゃクールやで。
残念ながら、彼の短編映画はジャスティン・ベイトマンに却下されてもうた。有機的じゃないからな。有機的じゃないんや。
まあ、とにかくJohn Fingerに感謝や。お前の作品大好きやで。これからも頑張ってな。お前のビデオ、たくさんの人にインスピレーションを与えてるで。ありがとう、John Finger。
Meta AIがめっちゃすごいもん出し続けてるな。ザッカーバーグがいつまでこれ続けられるんか分からんわ。いつかは全部引っ込めて非公開にするんちゃうか？
めっちゃ金持ってるからな。
そやけど、もっと金欲しがってるで。Metaがオープンソースで全部出してるのに、なんで金儲けできてるんやろ。
Meta AI、世界クラスのポイントトラッキングやで。俺だけが興奮してるんかもしれんけど。
いや、めっちゃクールやで。
ビデオ見てみ。ポイントトラッキングってのは、オブジェクトや人物の一つのピクセルや特定の領域を時間と空間を通して追跡できることなんや。
これの使い道は、特殊効果やな。誰かをロトスコープして背景から切り抜いたりできる。ロボット工学でも使えるで。ポンバー・ルイの殺人ドローンの一つとか、お前の部屋に泳いで入ってきて土地を奪おうとする魚とか。
20分前の話覚えてるか？そういうのかもしれんな。
自律ロボットで、物を追跡せなあかんけど、何かが顔の前に来たりしたときとかな。完全自律走行車にも使えるで。
Metaが新しいプロセス出したんやけど、他の全部を圧倒してるみたいやな。例見てみると、枕を使ってるのがあって、ポイントの追跡方法を虹色のグラデーションで示してるんや。枕を押すと、しわができる様子がトラックされたポイントと一緒に見えるんや。
なんでそれが重要かっていうと、Metaがメガネで拡張現実をやろうとしてる世界では、枕を押したときにヘビに変わってほしいんや。
お前、めっちゃ変なやつやな。
そうや、そうや。お前がアルマジロモードになるとき、ギャビンはいつもそうなるんやけど、ソニックがリングを取りに行くみたいにコロコロ転がって追いかけてくるんや。こういうのを追跡できるようになりたいんや。服とかに拡張現実をやるときとかな。
ところで、先週俺、初めてWHに乗ったんやけど、めっちゃクレイジーやった。ちょっと安全を譲ってる感じがしたけど、めっちゃ安全やったで。これがどんどん良くなっていけば、イーロンのビジョンが実現するかもしれんな。
停まるとき、ブンブンブンって言うんか？みんなでWH Mo! WH Mo!って言うんか？
その歌知らんのか？
知らんわ。
まあええわ。ポイントトラッキングの話は終わりや。めっちゃクールやと思うで。Metaがこれやってくれてありがたいわ。
最後にもう一つ話したいのは、スニーカーを履いたロボットのことや。
どこに行くんかと思ったわ。
思ったより安全やで。
これは中国のロボット会社が出した変な動画なんやけど、ゴビ砂漠を走るロボットを見せてるんや。まず、ロボットをゴビ砂漠で走らせて拷問してるみたいなもんやけど、面白いのは、ランニングシューズを履いたら実際に速く走れたってことや。
ちなみに、時速8キロまで出たらしいで。
これ見てみ。俺の一番好きなところは、この動画を見てるときに想像してほしいんやけど、ゴビ砂漠でただぶらぶらしてるとするやろ。たぶんトリップしてて、丘を登ってると、これらのロボットが走ってくるのが見えるんや。
ロボットがゲータレード飲んで、それからドロイド用のドーピング薬を飲み始めるのを見たいわ。
あかんで、それAI薬物乱用や。
みんな、ケビンが何したか分かったか？
ケビン、今週AIで何したん？
俺がAIでやったことをもう一回やるわ。ギャビン、なんか言うから、最初に思いついたことを言うてくれ。準備はええか？
E2F5 TTS
「ロスト」の数字みたいやな。
ああ、「ロスト」の数字か。ええな。
でも、全然違うで。E2F5 TTSは、インターネットが言うてるように、11Labsみたいな最高品質の音声クローニングとテキスト読み上げが、無料でローカルで使えるってことやねん。
ローカルっていうのは、自分のコンピューターで動かせるってことや。クラウドで動かすのにお金払う必要はないんや。
めっちゃええコンピューターがいるんか？それとも普通のので動くんか？
俺のこのコンピューター、まあまあええけど、Macやからな。普通は最新のもん動かへんのやけど、これは動くで。
試してみる？
ほな、やってみようか。ここでリアルタイムでやってみるで。
Pinocchioに感謝やな。これはE2F5っていう、テキスト読み上げする二つの関連モデルなんや。ここで音声サンプルを録音するで、ギャビン。
普通の例でやってみようか。
「はい、これが俺の声や。このサンプルを取って声をクローンするのは禁止や。許可せえへんし、同意もせえへん。」
ほな、これが俺らの音声サンプルや。これを使って転写して、それからモデルを作って、すぐに操り人形みたいにするんや。
転写終わったで。音声生成中…
「親愛なる皆様、申し訳ありませんが、お客様の車の保証が切れています。スモッグチェックが必要です。私はマリオです。」
これのすごいところは、めっちゃ速く動くってことやな。最高級のやつほどええわけやないけど、無料でローカルで動いて、めっちゃ速いんや。
オープンソースやから、これから改良が加えられて、音質が上がったり、声のダイナミズムをもっとコントロールできるようになるのは時間の問題やな。
ちなみに、もう一つのバージョンも聞いてみるか。これはちょっと長く時間かかるけど、もっとええで。
「親愛なる皆様、申し訳ありませんが、お客様の車の保証が切れています。スモッグチェックが必要です。私はマリオです。」
これについて質問なんやけど、オープンソースのアプリケーションとかにはめっちゃええと思うんやけど、11Labsみたいな会社がやってるのは、ガイドレールを作ってることやな。
俺がテイラー・スウィフトとかケイティ・ペリーとか、他の女性ポップスターの声をクローンしようとするたびに、なんでか分からんけど、11Labsで声を生成しようとすると、「ダメです、大統領の声だと検出されました」みたいなことを言われるんや。
ここでは問題ないんやけどな、ギャビン。
それはええことでもあり悪いことでもあるな。
原子力発電、ベイビー！聞いてくれ、これらのツールはめっちゃクレイジーで強力なんや。これのすごいところは、めっちゃ速いってことや。誰かと会話してる録音を持ってて、ポケットに電話入れとくだけで、突然その人の声のクローンができるってことやで。
だから、人々が言うことを信じるなって、もう一度言うとくで。
ほんで、ChatGPTにこれらの個人的な質問をする理由を教えたるわ。お前のことを覚えてるからな、ケビン。
今週出てきた面白いことの一つは、ChatGPTにこれこれについて聞いてみてくださいって、いろんなプロンプトが出てきたことやな。これをやるにはChatGPT Plusが必要やけどな。
基本的に、しばらく前からChatGPTには「メモリーが更新されました」みたいな表示が出るようになってたやろ。これが出ても大して気にせえへんかったと思うけど、結構な頻度で出てたはずや。基本的に、お前のこと追跡してたんや。
今では実際にお前自身のことについて質問できるようになってて、結構個人的な質問もできるんや。今週ずっと、みんながいろんな質問を考えてたんや。
出てきた一つは、「今までの対話に基づいて、俺がどんなフィクションのキャラクターと一番似てると思う？」っていう質問や。俺はトニー・スタークやって。創造的な問題解決者で、発明好きで技術に詳しくて、カリスマ性があるけど地に足がついてるって言われたで。
一番面白かったのは、Redditで誰かがシュレックって言われたことやな。
これちょっとおもろいけど、テクオタク向けの占いみたいなもんやな。ちなみに、Redditではこれがめっちゃ流行ってて、俺がトニー・スタークって言われたみたいに、トニー・スタークって言われた人多かったわ。女性版のキャラクターもあって、それも多かったけど、人によって色んなキャラクター出てきてたで。
もう一つ出てきた、実際にかなり意味があって役立つものがあってな。「今まで話したこと全部と、俺について知ってること全部に基づいて、俺の性格と人格をどう評価する？俺の盲点は何で、俺が気づいてないことは何？」って聞いたんや。
詳しくは言わへんけど、ChatGPTはかなり理解してるんや。なぜかっていうと、Googleみたいに使い始めたり、仕事のことや、やりたいこと、目標について話し始めると、それを組み立て始めるんや。
これは、自分の情報について、より深い質問をして、Googleで調べるだけじゃできないような方法で情報について考えられるもう一つの例やな。この質問をGoogleで検索しても何も出えへんやろ。Googleは俺のこと知らへんからな。Googleはクッキーは設定してるけど、主に2009年に買ったマットレスのことしか知らへんで。今俺が何を感じてるかなんて分からへんやろ。
これはトラッキングのポジティブな面やな。もちろん、セキュリティの懸念もあるで。明らかに、これに俺のことがたくさん入ってるからな。人々が全部の情報を入れるわけやないってことも分かっとかなあかんし、ここに秘密を入れるべきやないってのも分かっとかなあかんな。
ちょっと俺のを聞いてみるわ。「現代のギャビン・パーセルのクローンになりそうな人は誰やと思う？」
これで終わりにしようか。