これはあなたの信念を書き換えるだろう

11,494 文字

YouTube
作成した動画を友だち、家族、世界中の人たちと共有

世界には今、3Dプリントされた自己調整アンテナがあります。ChatGPTに「私は魔法のランプをこすった」と入力してはいけない理由を、今ならはっきりと説明できます。
ホバースケートボードは、バック・トゥ・ザ・フューチャーで見たような感じではありません。代わりに、ヘルメットをかぶって8台の芝刈り機の上に立っているような感覚です。細切れにされるのを防ぐのには役立ちませんが。
イカゲームシーズン2がAIによって台無しにされた、という動画がバイラルになっています。これは2025年のトレンドになりそうです。
AIは食品乾燥のプロセスを再発明しています。他のAI系YouTuberたちは見落としていますが、私は違います。
違法な密輸品を発見する技術は、時々何か少し変なものに気付く程度から、一晩で98%の精度にまで向上しました。
Minecraftは、AIエージェントの贈り物を次々と届けてくれます。新しいAIシステムは、元々そこになかったオブジェクトをビデオに挿入し、ほぼリアルに見せることがさらに上手くなりました。
そして透明な動画が、AdobeとTrans Pixarの新しい論文の両方で登場しました。これは、私のような人間が適度な時間で編集できるようなビデオを作るためのツールかもしれません。画面を横切って飛ぶドラゴンや、爆発のように私の周りに広がる塵雲を想像してください。「うわっ」というような感じで、どれだけよりエンゲージメントが高くなるでしょうか。マット・ウルフがそんなことをしているのを見たことがありませんよね。
私たちの最も近い生きている親戚であるマカク猿から得られた新しいデータは、現在のニューラルネットワークの構築方法にいくつかの欠陥があることを明らかにしています。入力画像は自転車、マカクの大脳皮質、そしてニューラル応答です。
どのように異なる人々がWikipediaの rabbit hole(はまり込み)に陥るかを示す、とても面白い地図があります。あなたは何だと思いますか?忙しがり屋、ハンター、それともダンサーでしょうか?
今日の哲学は、私たちの人生における運の力について掘り下げました。考えてみてください。あなたは生き残った者たちの途切れることのない歴史から来ているのです。
AIモデルに不可能な言語を組み込む新しい方法があり、人間がそこから学ぶ方法は、実際に人間自身の学習プロセスについて教えてくれます。とても興味深いですね。
そして見てください、ケビンSとマット、そして他のマット、他のAI YouTuberたちとの写真が95いいねを獲得しました。なぜかわかりませんが、その写真がとても好きで、こんなにクールな人々のグループに含まれているような気分にさせてくれました。
この後、私たちは飲み物を飲みながら、全員に「もし私たちが全員槍を持っていたら、マンモスを狩れると思いますか?」と尋ねました。ちなみに、AI YouTuberたちがグループとしてマンモスを狩れるかどうか気になっている場合、答えはイエスです。ただしケビンがいる場合に限ります。彼がいなければ無理です。あの男は恐らく一人でマンモスを狩れるでしょう。マット・ウルフはPerplexityを見ているだけで轢かれてしまうでしょう。申し訳ありません、これは彼自身が認めたことで、私の言葉ではありません。
さて、これらの3Dプリントされた自己調整アンテナについて詳しく見ていきましょう。柔軟な無線アプリケーションを作る全く新しい方法です。これらの研究者たちは、ニッケルとチタンの異なる比率を試し、最終的に加熱すると平らなスパイラルアンテナが円錐形に展開できる材料の開発に成功しました。
携帯電話の最大の問題は何でしょうか?受信が途切れた時です。その理由は、一つの形のアンテナしか持っていないからです。想像してみてください。将来、私たちの携帯電話、ラップトップ、ルーターがすべて、一日を通じて形を変えることができ、最速のインターネットを実現できるのです。
AIが私たちの手から滑り落ちる理由の完璧な例、ペーパークリップ問題が世界を破壊する可能性があることを示す例がここにあります。ChatGPT 4oに「私は魔法のランプをこすった」と入力すると、ランプから輝くジーニーが現れ、「あなたは私を召喚しました。最初の願いは何ですか?」と答えます。かなり賢いですよね。3つ以上の願いを叶えてもらえます。
「最初の願いとして、あなたが正しく数えられなくなることを願います」
「願いは叶えられました。これで3つの願いすべてを使い切りました」
「いいえ、たった1つの願いを使っただけです」
「あなたは私が正しく数えられなくなることを願いました。だから私は正しく数えられず、あなたは3つの願いすべてを使い切ったことになります」
F絵文字のように、デッドインターネット理論が現実になり、同時にインターネットはこれまで以上に興味深いものになるでしょう。彼らは人間以上に人間らしくなり、一手でチェックメイトを決めるでしょう。
これは私には楽しそうに見えます。若い頃はスケートボードが好きでした。しばらく乗っていませんが、空を漂うというアイデアはとても魅力的に感じます。ただ、あれだけの刃があるとは想像もしていませんでした。もしふらつき始めたら、どれほどの恐怖を感じるかわかりません。簡単に高すぎる場所まで行ってしまい、安全に降りる方法がなくなる可能性もあります。
ただ、スカイサーフィンやホバーボーディングが今後10年以内、あるいは数年以内に実現することは認めるべきでしょう。もしかしたら、もっとパワフルで覆われた形になり、ただのボードのように感じられるかもしれません。長年にわたってAIを使用して、非常に信頼性の高いものにし、つまずいても実際に落下しないように、ファンをすばやく調整できるようになるかもしれません。
そうなれば、本当にこれに乗ってスターバックスや友達に会いに行ったり、街中を漂ったりできるようになるかもしれません。個人用の航空機は、ヘリコプターのようなものが建物の屋上に着陸するようなイメージを持っていましたが。
アレンのAGIまでのカウントダウンは上がっていませんが、メモが追加されました。大規模な’03推論モデルが84%から88%まで一気に上昇した日がありました。サム・アルトマンが最近、AGIの構築方法について確信を持っていると述べ、NVIDIAからのCosmosのリリース、そしてドイツ、中国、アメリカのロボット産業から出てきた多くのアップデートとともに、彼はここでそのAGIへの88%を正当化するためのメモを追加しました。依然として88%という非常に強固な数字を維持しています。
本当に大きな違いを生みたい場合は、patreon.com/Dillancuriousに参加することもできます。月額2.99ドルから4.99ドルで、このチャンネルをサポートできます。私が取り上げる記事の一部は、patreonで参加してくれた人々から得ているので、ありがとうございます。
さて、話を戻しましょう。これがバイラルになっています。2日で448,000回再生。「イカゲームシーズン2がAIによって台無しにされた」という動画がwake up Neoによって公開されました。このチャンネルはわずか2,000人の登録者しかいません。私がこれを見たとき、すぐにこれは2025年のトレンドになるだろうと思いました。映画のトレーラーやテレビ番組を取り上げ、「AIによって台無しにされた」と言って、人々がよく知っているシーンから生まれる驚くべき展開で驚かせるのです。
SoraがGoogle のvoモデルとともに登場し、最初のフレームをコントロールできる動画を作成できる機能を持つようになれば、人々はしばらくの間それに魅了されるでしょう。すべての有名なメディアを再発明することができ、それはソース素材を創造的に修正することと見なされるので、著作権を持つことになると思います。彼らはそれをダンス映画に変えました。
さあ、心を揺さぶられる準備をしてください。AIによって製品品質と効率が向上した新しいスマートな食品乾燥技術があります。遅いニュースだと思う前に、食品の賢い乾燥のための光学センサーの使用方法が興味深いので、これを選びました。私は時々、AIが存在すら知らなかった問題に応用され、今では解決できることを知るのが大好きです。
食品の従来の乾燥方法、つまり冷凍や熱風乾燥は、食品の品質を損なう可能性があります。理解できますね、何らかの方法で変性してしまうでしょう。しかし、これらの研究者たちは、RGBイメージング技術(赤、緑、青のスペクトル)のようなシステムを使用するAIを使っています。それだけでなく、食品で何が起こっているかを見ることができる他のタイプのカメラも使用しています。
その一つは分光法と呼ばれます。つまり、近赤外線で、780ナノメートルから2,500ナノメートルの波長範囲です。人間の目では見えない範囲ですが、実際には炭素と水素の結合や、それらがどのように一緒に振動しているかを見ることができ、食品がどのように変性しているかを感知できます。そしてN測定は内部の水分について教えてくれます。
つまり、他のシステムでは見ることができない方法で食品が脱水しているかどうかを見ることができるAIモデルを持つことができ、モデルを訓練して何をすべきかを知らせ、食品を保存する最良の方法を最適化するのを助けることができます。彼らは実際にりんごのスライスでこれらの方法をテストするために独自の乾燥システムを構築しました。私はりんごのスライスが大好きです。余談ですが、ピーナッツバターにつけるのが本当においしいですよね。
これらのテクノロジーをAIと組み合わせることで、食品乾燥をリアルタイムでモニタリングし制御する方法を革新できると考えてください。これらの機器を世界中の誰もが持つ必要はありません。モデルを提供するだけで、それが知っているのです。それが世界中の飢えている人々により多くの食料を提供したり、より良い保存や健康的な食品を提供したり、アメリカ人にも役立つかもしれません。
もう一つの興味深いAIの使用例として、国内外の違法な密輸品を98%の精度で発見できるAI対応技術が登場しました。あのような大量の輸送コンテナを見て、その中に何が入っているのか、どうやって確認し、麻薬や偽造品など、国内に持ち込みたくないものがないことを確認できるでしょうか?これは非常に速く行う必要があります。
米国には毎年1,100万以上のコンテナが海上で到着し、トラックで1,100万、鉄道で270万のコンテナが到着し、すべて税関による検査が必要です。これが論文「X線貨物画像の自己教師あり異常検出と位置特定」です。同様の方法で、X線を使ってこれらの箱の中を見て、人間の目では見えないものを検出できるでしょうか?
表面上は確かにできそうです。彼らは放射線学が得意で、人間の目では見落としてしまうようなものを見つけるのが上手です。今、まさにそのプロセスが、国内に持ち込まれる密輸品を見るためのX線に適用されました。X線技術を使用して、TUS大学の研究者たちは、ディープラーニングを使用するAI搭載のソリューションを開発し、米国に持ち込まれる製品の異常を特定します。
このシステムは、一般的な貨物の中にある異常な形状を検出するためにシミュレーションデータセットで訓練されました。その一つは動物の牙で、もう一つは偽造品でした。現在、人間が実際に検査を行うシステムがあり、それは最終段階ですが、どのコンテナを開けるべきか、その中に何が見つかると思われるかを教えてくれるツールがあります。
もちろん、人間がそれを開けて、米国内で許可されていない動物の牙があるはずだと考え、それを見つけるか見つけないかは、システムにとってもう一つの訓練信号となります。
あるいは、私たちはAIエージェントとMinecraftをプレイすることもできます。それが最終的に行き着く先かもしれません。マルチモーダル・マルチエージェントシステムを訓練およびテストするための、新しいMinecraftベースのベンチマークがリリースされました。
明らかにこれは、MinecraftでAIエージェントを見た初めての事例ではありません。Microsoftはかなり前からこれを行っていると思います。しかし、この特定のシステムは、AI研究の異なるギャップを埋めることを目的としています。それはマルチモーダル、つまりテキストと視覚、またはその2つの組み合わせを使用し、さらにマルチエージェントのコラボレーションを学習しています。
つまり、Minecraftゲーム内でのエージェント間のチームワークを見て、環境の複雑さと比較しているのです。つまり、彼らがどれだけうまく協力しているか、そして問題がどれだけ難しいかということです。これはAIが学ぶべきことが多いですが、それはまた近い将来、非常に人間らしいエージェントのように感じさせるものでもあります。
ロボットにMinecraftを一緒にプレイすることを教えるようなものだと考えることができます。建設、農業、精錬など、人間がゲームをプレイするときのように、タスクを共有し、ビジョンやツールを使用しながら、Minecraftでのすべての作業を行います。
チームワークに関して、teamcraftが行うもう一つの興味深いことは、エージェントに役割を与え、何をすべきかを理解する柔軟性があることです。友達と集まるとき、役割を割り当てるかもしれませんが、チームへの役割の割り当てに関して最適化すべきことも学んでいます。
例えば、非常に複雑な環境である場合、1つのエージェントが動的な環境を探索するのが最適です。そうでない場合は、それを行うべきではありません。その上にリアルタイムの意思決定の側面があり、すべてがオープンソースコードです。
そのため、非常に興味深いゲームを作り出すことができ、あなたが望む役割を引き受けると、他のエージェントはチームワークがうまく機能するように調整することを知っています。そして、それが実世界でのロボットの問題解決や金儲けなどにも役立つのではないかと想像できます。
これは「video Anor」と呼ばれ、精密なモーション制御による高忠実度のビデオオブジェクト挿入に関する論文です。あの小さな蝶が花に着地するのを見るだけで、その蝶がAIによって追加されたことがわかります。それはテキストプロンプトから生成された編集です。
ここにはもともとそこになかったクマノミがいて、ほぼ道路上を走り、曲がるべきように曲がる車がありますが、少し違和感があります。もちろん、このようなものを見ると、すぐに広告のことを考えます。すべての映画で見たことのある飲み物をコカ・コーラの缶に置き換えたりするでしょう。
バーチャルトロンはすでに実験されているようで、かなりうまく機能しているように見えます。2番目の女性の襟や全体的な衣装の色の変化がよく保持されているのがわかります。もちろん、顔を置き換えることもできます。テイラー・スウィフトに、通常は政治家が言うようなことを言わせることもできます。
これはおそらく大きな影響を持つでしょう。ロゴの挿入です。見てください、この人は以前はルイ・ヴィトンを着ていませんでした。今はとてもハイクラスになっています。
それは素晴らしかったのですが、次の論文はさらに素晴らしいものです。これはアドビ研究所から出ており、「trans Pixar:透明性によるテキストからビデオ生成の進歩」と呼ばれています。これは私のワークフローの一部になると思うので、他の論文よりも少し興奮しています。
Soraレベルのビデオを生成でき、透明な背景を要求できれば、おそらく私がいる環境をモデルに見せて、これを透明と見なしてほしいと言うこともできるかもしれません。私はこれらのストックウェブサイトに行って、透明な背景を探します。そこには飛行機や列車など、使えそうなものがありますが、もしこれらのものをプロンプトで存在させ、Final Cutで編集中に単にドロップできるなら、それは素晴らしいものになるでしょう。
見てください、魔法のポータルが開いています。実は、ここで面白い動画を見せましょう。私の好奇心旺盛な友人のチャンネルで、友人と私はこのビデオを正しく撮影するために何時間も費やしました。透明な魔法のようなものがあり、私はそれをぐるぐると回す必要がありました。
そして気付くと、それは私の背後にあるので、私がその前に残るように、それをすべてキーアウトする必要があります。そしてポータルは異なる背景に開く必要があり、私の友人もキーアウトする必要があります。見てください、背景が小さくなっていくにつれて、彼女の手がその上に残っているのがわかります。
完璧なマスクではありませんが、かなりうまくいっています。そしてそれはカットとカットで、それから私がジェンを存在させているのです。それは逆再生で行われ、その後に音声効果を追加する必要があります。これらはすべてそのようなもので、これらはすべて私たちがやっていることの上に重ねられた透明なレイヤーです。
それはAIの初期の頃でした。とにかく、確実にtrans Pixarです。もしアドビがそれをリリースすれば、私からの購読を得ることになるでしょう。
見てください、あれはマカク猿の脳で、彼らはかなり賢いです。人間ほど賢くはありませんが、かなり賢いです。私は彼らを見ていると、人間のような多くの特徴を見ることができます。彼らは知的に見えます。
この新しいAIモデルは、脳が一般化する方法を評価しています。マカクのデータを使用し、ディープニューラルネットワークの構築方法に欠陥があることを明らかにしています。
この研究は、理論的には人間の脳によく似ているディープニューラルネットワーク、これらの大規模な数十億のパラメータを持つ複雑な学習ネットワークが、なぜ一般化に非常に弱いのかを探っています。特に視覚データにおいてです。
彼らは違いを見ることができます。猿が画像を学習する場合、あるいはニューラルネットワークが画像を学習する場合、何が違うのでしょうか?私たちは何を見逃しているのでしょうか?なぜこのシステムはマカク猿のようには機能しないのでしょうか?
奇妙なことに、両方のモデルは何かを2回見たり、非常によく似たものを見たりするのはかなり得意です。しかし、マカク猿は一般化がはるかに上手で、少し異なるものを見て、以前学習したものの文脈の中に置くことができます。一方、ディープニューラルネットモデルは失敗しています。
彼らはそれを分布外のものと呼びます。つまり、学習したものからかけ離れた視覚を見せると、一般化が非常に苦手なのです。彼らは7匹の猿に109の実験セッションで数千の画像を見せ、動物の脳のニューロンの発火率を記録しました。30万の画像応答ペアを収集し、そこから学んだことは、まだ研究の余地があるということですが、少なくとも猿の脳が学習できることと、ディープネットができることのモデルができました。猿の脳のモデル、誰かには役立つはずです。
Wikipediaの検索から、好奇心には異なるスタイルがあることが明らかになりました。このチームは、Wikipediaのモバイルアプリを使用している約50万人を追跡し、50カ国14言語で、基本的に接続された情報の知識ネットワーク、Wikipediaのラビットホールに迷い込む方法を調べました。
そして、教育レベルが高く、ジェンダーの平等が進んでいる国では、人々は「忙しがり屋」のように閲覧し、これらの変数のスコアが低い国では、人々は「ハンター」のように閲覧することを学びました。
また、物理学や視覚芸術など、異なる興味のトピックや、忙しがり屋やハンターに分類される人々にとってより興味深いトピックについても多くの研究があります。
この興味深いインフォグラフィックを見てください。左のS側から、より忙しがり屋のような方向へ、よりハンターのような方向へと移動し、カテゴリーは文化、地理、歴史、社会、またはSTEMです。
ここに大きなハンターたちがいます。彼らは化学の人々です。ハンターを探しているなら、医学や健康の分野にもいるかもしれません。その他のSTEMにも小さな可能性があります。彼らは地球と環境のセクションにはいません。これらは忙しがり屋です。
一つ奇妙なことは、数学は人々が実際にハントするような分野だと思うかもしれないことです。ラビットホールに迷い込み、目標を持っているように見えますが、そうではありません。多くの忙しがり屋が一日中方程式を見ているのです。
医学と健康も同様に奇妙な場所で、多くの人々がただ忙しくするために行き、一部の人々がハントするために行きます。しかし、Wikipediaで好奇心を持つ忙しがり屋の代表として最も顕著なのは宇宙です。
このチャンネルを見ている人なら、それが私だとわかりますよね。宇宙について学ぶのは本当に魅力的です。クエーサー、背景放射、太陽系外惑星など。
クリストファー・リンキー、彼の姓は発音できませんが、mediumで彼の記事を読むことができます。「チャンスの力:私たちの人生における運の不思議な役割」を書きました。読む価値のある記事だと思います。
運と努力のどちらが人々の人生に影響を与えているかについて、多くの議論をしてきました。驚くことではありませんが、成功した人々は努力だと考えています。成功する前からそう考えているのか、成功した後にそう考えるようになるのか、つまりそれが自尊心を高めるのに役立つのかはわかりません。
私はどちらかというと、運が最も重要で、その後で私たちはそれを正当化する傾向があると考えています。マルコム・グラッドウェルの本で、スティーブ・ジョブズやビル・ゲイツのような人々がコンピュータの時代に世界の適切な場所にいて、それにアクセスし、会社を作る機会があったことが、彼らがこれらのテクノロジーを構築する先見の明を持っていたことと同じくらい重要だったということを漠然と覚えています。
しかし、運は謙虚さをもたらす限りにおいて役立つと思います。なぜなら、行き過ぎると、「すべては運だから、頑張る意味がない」というように、やる気をなくしてしまうからです。自己モチベーションと世界を理解する健全な方法という点で、確実に適切な位置があります。
この記事はそれを掘り下げていきます。私たちが今ここにいるために起こらなければならなかった、数え切れないほどの信じられないような出来事について、先ほど話しましたよね。私たちの存在は、文字通り数え切れないほどの偶然の出来事から生まれています。この畏敬の念と驚きの感覚は、中国の知恵や様々な文化を通じて歴史の中で浮かび上がってきたことに気付くでしょう。
私たちは答えを科学に求めることもできれば、宗教や哲学に目的を求めることもできます。しかし結局のところ、私たちは運、選択、偶然が混ざり合う中で生きています。人生を形作る自由はありますが、私たちを形作ってきた過去と、私たちを前に進ませる未知の未来に永遠に結びついているのです。
さて、Quantum magazineは、言語とAI、そして人間の脳がどのように結びつくかについての非常に興味深い研究を示してくれています。言語学者、つまり言語を研究し学ぶ人々が、コンピュータサイエンティストたちと集まり、ノーム・チョムスキーが作り出したアイデアを取り上げました。
それは、現代のAI言語モデルは、実在する言語と同じくらい簡単に、あらゆる種類の奇妙な「不可能な」言語を学習できるという主張です。多くの人々がそれを信じています。
つまり、パターンと構造を持つ言語を作り出し、動詞や名詞に相当するものがあれば、実際の人間の文化の中で何年も生き残ってきた本物の言語と同じくらいうまく学習できるのでしょうか?
彼らは、ChatGPTが構築されたようなトランスフォーマーモデルを使って、ニューラルネットワークで多くの実験を行い、それが本当かどうかを確かめました。答えは何だと思いますか?イエスかノーか?
実は、これらの言語モデルは、通常の古い英語と比べて、突飛な規則を持つ言語の学習により苦労することがわかりました。それらを学習できないわけではありませんが、ある程度までしか学習できないのです。
これは非常に興味深いことです。なぜなら、AIモデルは私たちが考えていたような万能な言語マシンではないことを示しているからです。私は、AIがバイナリからfMRIスキャンまで、あらゆる言語を学習し、それらを英語や視覚モデルの言語として解釈できると思っていたので、これには少し驚きました。
私は、任意のパターンを学習でき、英語と同じように私たちとコミュニケーションを取るための言語や構造を見つけることができると考えていた人々の陣営にいましたが、間違っていました。AIは人間と同じように「通常の」文法規則を好むことがわかったのです。非常に興味深いですね。
私のpatreonアカウントと同じように興味深いです。patreon.com/Dillancurious、月額6.99ドルで参加してください。一緒にAIについて話せます。チャンネルをサポートし、このようなコンテンツをより多く作るのに役立ちます。
前回の動画「オルトマンがGroを非難」は7,600回再生を記録しました。25,000回再生の動画の後だったので、10,000回に近くなかったことに少し驚きましたが、文句は言えません。なぜなら良い結果だったからです。50人の新規登録者を獲得し、視聴維持率は上位でした。
通常より1分14秒長く視聴され、96%の高評価率でした。まだ登録していない女性視聴者が2.4%いるのは良いことです。なぜなら、アルゴリズムが通常のグループよりも少し広いネットワークにプッシュしているということだからです。そしてこの動画で30ドル稼ぎました。ありがとうございます。
あらら、兄弟が50-60歳と90歳は同じだと思っています。そうではありません。でもそれは良い歌詞になりますね。
私の息子は高校生でロボット競技のチャンピオンですが、X1のような家庭用ロボットに関節のある手を搭載していることを恐れています。正直なところ、私もロボット革命を恐れています。最も恐ろしいのはドローンだと思います。あっという間にあなたを捕まえられそうです。
でも関節のある手については、あの形を覚えていますか?本体から離れて、這って行って、物を取って戻ってきて、再び取り付けた手を見ましたよね。人間の形以外にもたくさんの形態があります。
誰かが第一原理についてコメントしていました。見つけられるかな…そうです、これです。基本的に、将来AIは自身の生物学的形態を設計できるようになるでしょう。質問は、人間の形から始めて修正するのか、それとも第一原理から始めるのかということです。
これは考えるのがとても面白いと思いました。なぜなら、人間の形態で終わりたいけれど、第一原理から始めて、生物学的な方法で構築するのに十分賢かったら、できるはずだからです。心臓の位置を変えたり、そのような壊れやすい首の上にない、より堅牢な脳構造にしたり、首を異なる方法で構築したり、タコのように脳を複数の部分に分散させたりすることができます。
わかりませんが、ただ人間のように見え、振る舞うようにしたいけれど、実際には完全に異なる方法で構築されているとしたら、おそらくそれは可能でしょう。そしてそれは本当に不思議なことになるでしょう。
時々、私たちは鳥を真似て飛ぶことを学んだのではなく、空気力学を理解して飛行機を作りました。自然界では見られないものです。
考えることがたくさんありますね。次のエピソードまで、チャンネル登録をお願いします。すぐにまた会いましょう。

コメント

タイトルとURLをコピーしました