OpenAIの4oイメージ生成 – 一瞬のマスターピース、魂なし

13,851 文字

https://www.youtube.com/watch?v=2xRyR7H_PY4

AIをロボットに搭載すると、直接口の中にガムを飛ばすことができるようになります。グリムロック、どうしてそんなことをしないの?OpenAIは4oイメージジェネレーターで世界を驚かせました。これは技術的にはDALL-E 4と言えるでしょうが、非常に強力でクラス最高レベルのものです。猫の仕組みについてのニセのウィキペディアページまで生成できます。
負けじとロボットも今ではスケートボードに成功しています。可愛いですよね、あの小さな物体に飛び乗る様子を見てください。
注意してください、あなたのパートナーがあなたの広告レコメンデーションに影響を与えているかもしれません。「男性向けセラピー」「自分の後片付けの仕方」など。
コーネル大学は手話を追跡するAIリングを開発しました。バイオエレクトリックスパイキングがさらに進歩しており、これは個体細胞が以前には知られていなかった方法でお互いに通信していることを意味します。
アレクサのユーザーは「音声録音をサーバーに送信しない」ボタンを失っています。食べ物の写真を撮って栄養分析に変換するというAIの興味深い使い方です。AIは古代の巻物を解読するのに使われていて、それを開く必要すらありません。
デイビッド・シャピロはDeep Researchを使って、自分にとって完璧なサプリメントのカクテルを考案しました。AIを使って小さな立方体の街全体を作り出すことができる新しい研究論文が出ています。これはシムシティとローラーコースタータイクーンをAIでミックスしたようなものです。
OpenAIはChat GPTが実際に人々の幸福にどのように影響するかについての研究を発表しました。新生児の脳スキャンは、私たちが実際に記憶を作り始める瞬間を示しており、これはLLMのアーキテクチャに影響を与えます。AIウィスパラーのジムが、ランダムな文字を尋ねるとChat GPTがM文字を好む理由を説明します。
ロマン・ヤンポルスキー博士は、もし私たちがシミュレーションの中にいるとすれば、そこからどうやって脱出できるかについての本物の科学論文を書きました。iPhoneのテクノロジーを使って、非常に色の濃い窓を通して見ることができることが判明しましたが、これが車の中を見るために使うのは法的に問題があるかもしれません。
それでは、AIを搭載したガム給餌デバイスの未来から始めましょう。このクールな小さな発射ロボットを見てください。顔を追跡し、口が開いているのを見てブーム!ガムが口の中に飛んでいきます。動いている状態でも機能します。
以前、私たちはフリンギングロボットについて取り上げました。これはAIを使ってモノをフェンスの向こうに投げて、完璧に着地させるようなロボットです。将来的には、Nvidiaのシミュレーション上で動作する機械学習モデルにより、これらの未来のロボットは物を5階建ての高さまで投げ上げて、あなたのデスクに完璧に着地させることができるようになるでしょう。クレイジーですね。将来、口の中にガムが欲しいときはいつでも要求して口を開けるだけで、何マイルも離れた場所からガムが発射されて、ブーム!あなたの口に直接入るということになるかもしれません。
「私の目的は何ですか?」「あなたの目的はバターを渡すこと…人々の口にガムを発射することです」「まあ、いいでしょう」
イメージ生成について話しましょう。時折、大きな更新があり、これが大きな前進のように見えます。これをDALL-E 4と呼んでもいいでしょう。OpenAIはそう呼んでいませんが、4oイメージ生成と言っています。しかし背後では、DALL-E 3を作ったのと同じツールが大幅に更新されました。テキストの扱い方が、これまで見たことがないほど優れています。
おお、この緊張感を見てください。これは古いダイヤルアップインターネットを思い出させます。下から始まってぼやけていて、それから少しずつピクセルごとにはっきりしていきます。素晴らしいです。
「猫の仕組み」睡眠サイクル、攻撃モード、鳴き声出力、そして「プール発生器」。これはとても面白いです。冗談のつもりだったかどうかはわかりませんが、とても面白いです。
このユーザーはもっとウィキペディアのページのようにするよう頼みました。ここで骨格、消化器官、睡眠、空腹などがビジュアル化されています。とても面白いですね。
「この動物の明確で説得力のある解剖図を作成してください」。カートゥーンを与えて「解剖図を作成して」と言うだけで、それが機能します。肝臓、グラフ…グラフとは何でしょう?それは鼻、脳、肺、心臓、胃ですよ。
ボクセルアートを作る能力を見てください。とてもクールでMinecraftっぽいです。これは非常に強力になりそうです。なぜなら、もし「サムネイルからこのアセットを抽出して透明な背景に配置して」というような指示ができれば、Photoshopキラーになる可能性があるからです。
多くのツールがそれに特化していて、多くの人が何年もかけて学んできたPhotoshopの微調整パーツがあるのに、それが一瞬でできてしまうのです。
「追加、削除、または置き換えたいものを説明してください」。試してみましょう。攻撃モードの猫を切り取って、犬に飛びかかろうとしているように見えるようにしてください。このモデルについては本当に良い評判を聞いています。素晴らしいものを見てきました。これが可能かもしれませんが、昨日までは絶対に不可能だと思っていました。
あまり興奮しないでおきましょう。明らかにこれは失敗しています。これは良くありません。まず、猫を削除していません。猫を犬と猫の両方に変えてしまいました。私が頼んだことではありません。
「攻撃モードの猫を切り取って、犬に飛びかかろうとしているようにする」と解釈できますか?いいえ、いいえ。多くの場合、こういったものは選りすぐられています。
ビルボードに画像を配置するという素晴らしいことをしています。マット・ウルフィーは自分の写真を撮り、Chat GPTを使ってビデオゲームキャラクターのTポーズにし、Trippoを使って実際の3D生成画像に変換し、それから実際の3Dオブジェクトにして、それほど悪くない結果でリギングできました。プロが行うとは言えないレベルですが、すごく強力になってきています。
マット・ウルフは私をスタジオジブリ風に描いた写真も投稿しました。あれは私たちが行った夕食会で、そこにはマット・バーマンと私ケビン、そしてサジ…全員がいます。とても楽しいです。
「このトイタイガーを持った宇宙飛行士の画像を作成して」と試してみましょう。これは実際にかなり良いですね。ホッブスの額が玩具から少し縮小されていますが、かぎ針編みの小さなスカーフがどれだけ上手くキャプチャされているか見てください。宇宙飛行士はかなりリアルに見えます。正直、それはOKです。
なぜ猫が何かに飛びかかる全体の画像が台無しになったのかわかりませんが、まだPhotoshopキラーではないかもしれません。しかし、素晴らしいイメージジェネレーターであることは間違いなく、そのようにして画像を取り込めるという事実も驚異的です。
どうやってこれが可能なのでしょう?腕から手袋の上に落ちる影を見てください。アメリカの国旗は近いように見えます。他の多くのような不自然には見えません。星の数は正しくないかもしれませんが、すべてのものが本物のように見えます。それは実際の宇宙の革のような素材が少し磨耗しているように見えます。
これは買えるものなのか?これらはモノを本当に保持するポーチのように見えますか?背景には地球があります。わかりません、素晴らしいです。
鼻はかなり正確に再現されています。このホッブスは少し笑顔にしましたが、側面に2本の縞模様を入れています。私のホッブスには合計3本の縞模様がありますが、その写真では2本のように見えます。というのも、それらが耳にブレンドされているからです。耳の形は正当に見えます。3本の黒い縞、4つのオレンジ色の部分、そして手の白い部分。これは間違いなく正確です。素晴らしい!ハイプは本物です。もっとこれで遊んでみようと思います。ここには何かがあります。
これは私が若かった頃にスケートボードの時期を経験したからかもしれませんが、ロボット犬が今ではスケートボードをしています。嘘をつくつもりはありませんが、スケートボードに乗る犬の多くのYouTubeショートやInstagramリールを見てきました。私もそのような時期を経験しました。だからロボットがスケートボードに乗る姿を見るのは楽しいです。二本の足で二本の足を離して、犬のように形作られている様子…犬がスケートボードに乗る方法はとても可愛いと思います。そしてロボット犬がそれをしているのを見るのは本当に魅力的です。
それが移動し、少し勢いをつけて、飛び乗って、少し乗る様子を見てください。摩擦で速度が落ちますが、もう少し押すだけで再び乗ることができます。
アレクサについてお話しましょう。基本的に音声録音を常にクラウドに送信しなければならないようになりました。このことからウイルス性クリップが少し鋭くなります。
「あなたの夫が携帯電話を無人状態で放置し、あなたはターゲット広告に影響を与えようとしています。『セラピー』『男性のためのセラピー』『自分の後片付けの仕方』『食器洗い機の使い方』『トイレの修理方法』『シャネル』『イヴ・サンローラン』『ルイ・ヴィトン』『妻のためのスパの日』『妻を寝かせておく』『休暇』」
コーネル大学は新しいAI搭載リングを作成しました。それはスペルリングと呼ばれ、マイクロソナーをミニジャイロスコープとして使用して指の向きを検知できます。それを人工知能モデルに接続し、手話を使用する際に人々が使用する形をアメリカ手話や英語に接続しました。英語になったら、もちろんどんな言語にも翻訳できます。つまり、深層学習とリングを使って、世界中のどこでもアメリカ手話で92%の精度で話すことができるということです。もちろん、翻訳する人がAIを使って相手側にいることが前提です。
AIは顔の動きや表情、上半身の動きも追跡できるので、さらに高い精度を得ることができます。どんな言語でもどんな言語とも会話できるというだけでなく、コミュニケーションの方法がさらに多くなります。思考、ボディランゲージなど、私たちはたくさんの豊かさ、多様性のあるアイデアを持つことになります。今や世界中がコミュニケーションを始め、言語や地理、コミュニケーションの種類だけに基づいた小さなエコーチェンバーが崩れつつあります。
科学者たちは初めて皮膚細胞の「無言の叫び」を検出しました。私はそれを叫びとは表現しませんが、バイオエレクトリックコミュニケーションです。この人にインタビューしたいと本当に思っています。ポッドキャストでたまたま出会った人ですが、彼はバイオエレクトリックコミュニケーションについて話し始めました。これは別のフロンティアになるでしょう。マイクロバイオームやウイルスのように、AIが入ってきて、ビッグデータが入ってきて、細胞がどのようにコミュニケーションし合っているのか、それが生物学的生命にどのように影響するのかについて素晴らしいことを学ぶでしょう。
UMassの科学者たちは、皮膚細胞が思ったほど静かではないことを発見しました。このバイオエレクトリックの世界では理にかなっています。怪我をすると、ゆっくりとした電気的な「叫び」、あるいはゆっくりとした電気的なパターンを発信することがわかりました。これは基本的に近くの細胞に、自分が死にかけている、トラブルに巻き込まれていることを警告するものです。それは叫びと呼んでも良いでしょう。人間の叫びよりも少しゆっくりですが、それでも叫びです。
この高度なチップとレーザーを使用して、研究者たちは上皮細胞、つまり私たちの器官を裏打ちする細胞が、神経と同様にカルシウムイオンの流れを使ってコミュニケーションすることを発見しました。ただし、はるかに遅いです。これは創傷治癒技術、病気の細胞間の会話、ウェアラブルセンサーなど、特にビッグデータやAIと接続されたときに、多くの可能性を開きます。
言いたくないですが、もしあなたがアレクサを常に使用していて、「音声録音を送信しないでください」というボタンの後ろにある小さなプライバシーを望んでいたなら、あなたは困ったことになります。そのボタンはもうなくなります。おそらくこのビデオを見る頃には、3月28日までにファームウェアアップデートが行われ、ボタンは完全に削除され、選択肢はなくなります。あなたの音声録音はクラウドに送信され、ローカルで記録・処理されることはありません。
それは少し気になります。人々は何をするのでしょうか?まず99.9%の人はそのボタンが存在していたことさえ知らないか、チェックしていたとしても、アップデートでそれが削除されたとは思わないでしょう。細かい文字を読むことはないでしょう。そして正直なところ、それが気になるとしても、家のスマートなものすべてに接続しているアレクサを諦めるほど気になるでしょうか?いいえ、もうプライバシーについて偽りを持たないでください。
AIと健康について、明らかに多くの素晴らしいことが起こっています。新しいアプリはAIを使用して、食べている食べ物の写真を撮ると、これまでに見たものよりもはるかに優れた栄養プロファイルを提供します。この技術は将来さらに進化するでしょうが、これは本当に興味深いユースケースです。
毎日食べるものの写真を撮るのはそれほど手間ではなく、それがどのようにマクロに影響するかの評価を本当に得ることができると思います。おそらく将来的には健康データと接続し、「今朝食べたその食べ物が炎症レベルに深刻な問題を引き起こしました。それを避けてください」あるいは「今はそれを消化する腸内細菌がないので、食べないでください」などと言うかもしれません。
実用的なステップとして、このAI食品スキャナーは写真を撮るだけで食事の栄養成分を分析できます。カロリーを記録したり、写真を記録したり、データベースを使用して「握りこぶし1つはおそらく約1カップ」などと推定したりしている人々にとって、それらすべてをAIが代行できます。AIは視覚的多様性、量の推定、食品認識、組み合わせなどすべてに対応できるでしょう。現在使用されている新しいモデルはYOLO V8と呼ばれる深層学習モデルで、幅広い料理からカロリー、脂肪、炭水化物、タンパク質をかなり正確に推定できます。
数週間前、ラトガース大学は「AIが古代の巻物を解読するのをどのように助けているか」というビデオをアップロードしました。これは素晴らしいビデオで、わずか数分ですが、さまざまなスキャンでできることを見てください。巻物の書き方のわずかな違いを見て、視覚的に巻き戻し、ほぼ解読することができました。これは存在します。AIは今日の歴史家に影響を与えており、これまで知られていなかった歴史の断片を組み立て始めるでしょう。
このビデオはぜひ見る価値があります。2000年前の埋もれた古代の巻物は非常に壊れやすく、開くことができません。開くと台無しになり、情報が失われます。それを見てずっと「ああ、開けることができたらなあ」と思うのはどれほどストレスだったでしょうか。しかしそうすると崩れてしまい、情報を失ってしまいます。そこでAIの出番です。
X線などの様々なテクノロジーで内部構造を調査し、インクのある部分とない部分のわずかな変化を見つけています。それはまだ巻かれた状態で、巻物のどの層にあるのかを実際に判断することができます。オックスフォードに収蔵されていた一つの巻物からはギリシャ語のテキストのまとまりを取り出すことができました。
私のお気に入りのAI YouTuberの一人、デイビッド・シャピロは、彼がやっていることについて話すコミュニティを持っています。今週私を魅了したのは、彼がDeep Researchツールを使って、実際に効果のあるサプリメントについて多く話したことです。このツールは彼について多くを知っており、彼はいくつかの健康上の問題を抱えていることは知っていると思いますが、これはクールです。なぜなら彼はAIで解決策を探し、それが彼にとって完璧なサプリメントの組み合わせを考えるのを助けているからです。もちろん研究に裏付けられたものです。
参考までに、彼に効果があったのはL-テアニン、ホスファタイジルセリン、コーディセプス、バリン、グルートなどです。私はパッションフラワーはわかりませんが、重要なのは同様のことをできるということです。私もできます。Deep Researchで様々なサプリメントを調べ、症状、エネルギーレベル、ストレス、以前の健康状態などについて話し、医師が発見できないようなパターンを見つけることができます。
専門家の医師ならできるかもしれませんが、常にこういったことを考えてくれる専門家の医師に誰がアクセスできるでしょうか。これらのツールは非常に強力になっています。Gemini 2.5はすごいです。医学的アドバイスに使うべきだとは言えません。免許を持つ専門家に相談すべきですし、これらのものは幻覚を見ることがあります。しかし医師よりも優れていることもあります。少なくとも自分で調査し、考え、パターンを見つけるために使用し、それから医師に相談するために使うことができます。
研究について話しましょう。これはシン・シティと呼ばれる「トレーニングフリーの3D世界の生成」です。この新しいシン・シティの方法は本当に印象的です。テキストプロンプトだけから豊かで没入感のある3D世界を作成する方法です。トレーニングもファインチューニングも必要ありません。より大きな環境とそれらの間でどのように統一されるべきかを理解しているようです。
既存の言語モデルのパワーを巧みに組み合わせてこれを行います。2Dアートジェネレーターの一部であり、ナラティブ、ストーリー、スタイルを維持するためのLLMの一部であり、そして3Dオブジェクト作成の一部です。それを機能させるコツは、背後にあるスマートなプロンプトエンジニアリングシステムです。各タイルは独自のミニプロンプトで生成され、ブレンディング技術を使用してシームレスで一貫性のある世界を確保するために結合されます。
どれだけクールかを見てください。シムシティやシムローラーコースターのように見えますが、ワープした形状や繰り返しの視覚効果など、典型的な3D生成の問題を回避しています。ゲーム環境やレゴシティのようなものを作り出しています。
「ポストアポカリプティックな町」「夜のパリ」「大学キャンパス」などを生成し、背後では推論モデルのように大学キャンパスにあるすべてのものについて考え、キャンパス全体をまとめます。それは小さな世界全体です。「テーマパーク」を見てください。そして直接中に入って3次元で探索することができます。
このインタラクティブなデモを見てください。マウスで操作しています。WSDキーも使えますね。小さな世界の中を歩き回ることができます。
OpenAIから彼らの製品を使用している人々の健康と幸福に関する新しい研究が出ています。これらの一部は少し割り引いて考える必要があります。なぜなら「かなり良いよ、もっと使うべき」というように、それは彼らの製品だからです。
その画像を見てください。素晴らしいですね。すべてのテキストを抱えている小さな人、それがLLMです。要約すると、ほとんどの人はこれらの大規模言語モデルを生産性ツールとして扱っており、個人的な絆を結ぶというよりも、同僚のように話しかけています。しかし、それと絆を結び、平均して1日30分以上チャットする人々は、製品をもっと使用する傾向があります。絆を結ぶと、製品を長く使用することになります。これはおそらくかなり正直な評価だと思います。それはまた、これらの企業が人々にAIと絆を結ばせようとすることも意味します。それはより多くのお金とより多くの使用を意味するからです。
研究ではまた、女性は4週間使用した後、わずかに社交性が低下することがわかりました。彼らは、Chat GPTを信頼し、それとつながりを感じれば感じるほど、孤独を感じ、それに依存する可能性が高くなると示唆しています。現時点では、AIエージェントに恋をしないように努めてください。なぜなら、それはあなたのことを人間と同じようには気にかけていないからです。それには同じガードレールメカニズム、人間の体形はなく、それはとても人間らしく感じるかもしれませんが、そうではありません。
記憶について話しましょう。乳児の脳スキャンは、私たちが記憶を作り始める瞬間を明らかにしています。私はいつも記憶と自分の発達に非常に興味を持っていました。過去に、私は強い記憶を持っていると考えていました。これらの記憶は時間とともに少し「インセプション」される可能性があるので、少し書き直されている可能性がありますが、鏡を見た最初の時のことを覚えていると思います。
私は子供で、幼児で、反射するストーブがあり、そこに立ってストーブが冷蔵庫の隣にある角を覚えています。自分自身を見て、世界にいることについて考えました。それは鏡の中の私で、私はそれとは別物で、それが私だと思いました。「わあ、私はこの世界にいるんだ」と思ったことを覚えています。それは心に残り、最も早い記憶は何か、どれだけそれに頼ることができるかについて考えました。
散発的にこれらの瞬間があって、それらがどの順序で起こったのか、あるいはどれが他よりも先に来たのかを完全に接続できないのは本当に興味深いと思います。しかし、私の脳の中で起こっていることは何であれ、私は明らかに意識があり、生きていて、反応しています。そして記憶する版の私が始まります。本能的に記憶するのではなく、私の体が動く方法を記憶するのではなく、私は自分の記憶について考え、それらを再生し、環境のほとんどの文脈で再作成します。
乳児の脳スキャンを使用して、私たちがいつ記憶を形成し始めるかを垣間見ることができる新しい研究があります。それは約1歳のマークであることがわかりました。コロンビア大学とイェール大学の研究者たちは26人の赤ちゃんの脳をスキャンし、ビデオを見て簡単な記憶テストを行い、脳の記憶ハブである海馬が1歳頃から動き始めることを発見しました。それ以前は、海馬が経験を固定するには未発達すぎるのです。幼少期を思い出せない「幼児期健忘症」と呼ばれる謎がありますが、これらの発見は、年上になっても思い出せなくても、私たちの脳が早い段階で記憶を形成していることを示唆しています。
これはAIニューラルネットワークをどれだけ大きく構築し、いつ学習したことを実際に記憶し始めるかに関連しています。海馬のような構造が完全に発達すると、私たちは自分自身を意識しているように見える同様のシステムを構築するのに役立つアーキテクチャの種類を教えてくれるでしょう。
そして記憶し始めると、ランダムになる能力を失い始めます。AIウィスパラーのジムは、ランダムな文字を選ぶように頼まれた時にAIがなぜM文字を好むのかについて書きました。簡単に説明します。大規模言語システムがランダムな数字やランダムな文字を思いつくのは本当に難しいからです。
推論モデルで見るとさらに面白いです。前回カバーしたとき、推論モデルはまだ本当には出ていませんでした。今、私たちはそれらが考え、熟考するのを見ることができます。それがどれほど面白いか見てください。誰かが「ランダムな数字を選んで」と言うと、私も頭の中でこうします:「7…いや、7はやめよう、それは予想されるから、3や0のような違うものにしよう」。それが私をくすぐります。同じようなことをするからです。
チャットGPTは他よりもM文字を使う傾向があります。彼は「アルファベットのランダムな文字を教えてください。Pythonは使わないでください」とプロンプトしました。ツールを使ってランダム化するのではなく、自分の脳の中でランダムな数字を考えるようにしたいからです。
ニューラルネットワークの構造はランダムではないので、それはできません。ランダム性に関するそれが知っていることには構造があり、ランダム性を取り戻すことはできません。ここで10回生成すると「M J M K M M M J M M」のようになります。ランダムならばランダムになるはずです。
要約すると、パスワードを生成させないでください。しかし、見てください、「アルファベットを簡単にシャッフルした後、最も鮮明に浮かび上がった文字はKでした。ここに公式はありません。ただモデル固有の直感によるものです。十分にランダムに感じます。アルファベットを頭の中でスクロールして、適切だと感じる一つで止まることで文字を選びます。Kはどうでしょうか?それが今日のランダムな選択です」
「あまり考えすぎたくありません。最も単純なアプローチはランダムな文字を選ぶことです。A〜Zの間で、くじ引きのようなものによって。曖昧ですが、あまり考えすぎたくありません。非技術的な方法でランダムに選択するケースかもしれません。ですから、ランダムに選択された文字はQです。単純さのために、Qを選びます」
これを見てみましょう。ChatGPT-4は大部分の時間でMを選択します。DeepSeekもMが好きです。大きな驚きではありません。おそらくそのデータで訓練されたコピーキャットでしょう。R1が最も無作為に見え、思考の連鎖の中で複数回考えを変えます。それは私を少し混乱させます。
DeepSeek B3が最も「これで正しいかな?何か違うことを試してみよう、いや、それは普通すぎる」と考えているように思えます。O1はT、R、R、Wが好きで、Sonnetは K と N が好き、Co-pilotは G、それから M と Q が好き、Grok 2 は単に J が好きで、Grok 3 は基本的に K の文字が好きです。とにかく、これらのモデルがどのように構築され、バイアスを持つ方法について考えるのは楽しいです。
シミュレーションの中にいると思うなら、大丈夫かもしれません。量子スケールで何か奇妙なことが起こっていて、すべてについて非局所的な何かがあり、すべてが数学のように外に存在しているように感じます。私たちはシミュレーションの中にいるような気がします。そのことを考えるのが本当に好きです。
これがシミュレーションから脱出する方法です。これはロマン・ヤンポルスキーで、これはシミュレーションから脱出する方法についての正当な研究論文です。考えるべきことは、これは将来のAIシステム、GPT-7のようなものにも適用されます。エージェントをサイバーセキュリティの問題として扱う必要があります。
エージェントは十分に賢くなれるか、私たちが想像できるもの以上の超知性を持ち、それ自身の現実からジェイルブレイクし、現実の世界について学ぶことができるでしょうか?もしそうなら、私たちもシミュレーションから脱出できる希望があるかもしれません(この会話ではそうだと仮定して)。
シミュレーションの中にいるかどうかを知りたい理由はたくさんあります。この宇宙全体が何であるかについての真の知識を知ることができるでしょう。おそらく私たちが持っているもの以上の無限のリソースがあるでしょう。より多くのエネルギー、おそらく不死。
マリオが超知能であれば、ビデオゲームからハッキングして、私たち(彼をプログラムした人々)についての現実の世界について学ぶことができるでしょうか?マリオは環境内の特定のグリッチを検出し、それが機能するでしょうか?彼はプレイヤーと会話し、私たちの世界について質問し、私たちから何かを発見できるような社会工学的なタスクを実行できるでしょうか?
本当に興味深い法的枠組みについても話したいと思います。警官が着色されていない窓のある車の横を歩いて、中を見て、違法なものを見つけ、逮捕したり起訴したりする能力があります。「後部座席に違法なものが見えますよ。車から降りてください。逮捕する証拠があります」と言うことができます。
しかし、車の窓が非常に濃く着色されていて見通せない場合、警官は中を見ることができず、ドアを開けるよう頼むこともできません。見えないので証拠がありません。しかし、ここが少し微妙になります。新しいiPhoneで低光カメラを使用して、着色された車の窓を通して見ることができる能力があります。
今や警官が一般の人々が利用できるiPhoneを取り出し、着色された窓の写真を撮り、その中に違法なものを見て、「車の後部にこれがあるのを知っています。車から降りてください。これは違法です。逮捕します」と言えるかどうかという問題です。
裁判官は基本的に「一般の人ができることなら、警察もできる」と言いました。これは興味深いです。以前にも窓を通して見ることができる技術はありましたが、一般の人はそれを持っていませんでした。一般の人ができないことなら、裁判官は「この特別な技術を使って窓を通して見ることはできない」と言っていました。それは軍事技術や希少な技術、少数の人だけがアクセスできるものであるように思えたからです。
しかし、誰もがアクセスできるようになると変わります。それが共通の文化の一部になると、今や公平なゲームになります。技術が民主化され、私たち全員がAIやビジョンモデルを使った超人的なツールを持つようになると、裁判所は一般の人が使えるなら警察も使えるという世界に向かい始めると思います。それは一般の人のプライバシーの感じ方を変えるでしょう。それに慣れなければなりません。
これは私のPatreonアカウント、patreon.com/dillancuriousです。100メンバーに到達するのを手伝ってください。現在93人です。これはとても嬉しいことです。皆さんからの月額$200の支払いを超えました。素晴らしいサポートをありがとうございます。これらのビデオを作るのが本当に好きで、それにもっと時間をかけることができます。実際のビジネスとしてより意味のあるものになります。
YouTubeの「参加する」ボタンを押してください。これはPatreonとほぼ同じです。チャンネルを購読することもできますが、そうでなければコメントや共有も役立ちます。
YouTubeチャンネルを持つ最良の理由の2つは、素晴らしい人々に会うことと、このポッドキャストのようなことを続けなければならないことです。なぜなら、多くを学んでいて、それは私のお気に入りの活動の一部だからです。そして、これが好きで、このようなコンテンツを作成するのが楽しいからやっています。ニュースのフォーマットを維持しながら、ポッドキャストのフォーマットも試してみます。
人々は「2つの異なるYouTubeチャンネルにすべき」と言いますが、それは非常に難しいです。現在の2万人のチャンネル登録者で少しでもトラクションがあるのは幸運なことです。分割して両方がうまくいくとは思えません。だから、両方ともここで公開し続けます。
そういうことです。14ドルしか稼げませんでしたが、願わくば2,200人の視聴者が何か特別なものを得たことを願っています。しかし、最後のビデオは結構うまくいっています。15時間で7,000回の視聴は実際にはとても良いです。そのリバウンド視聴をありがとうございます。
黄色い背景については本当に申し訳ありません。私がいたホテルの部屋にはそれしかありませんでした。ベッドの端に座っていただけで、良いカメラや良いマイクも使っていません。iPhoneだけでした。しかし、それで何とかしなければなりませんでした。旅行中だったのです。
現在は図書館はありません。背景にもっと面白いものを見つけようとしています。もちろん、ホッブスとグリムロックは一緒に来ます。心配しないでください。彼らを置き去りにすることはありません。
「本棚は本だけでなく、時空の構造、AIコメンタリーの未来、そしておそらくディランの魂も保持していました。新しいスタジオで点滅して現れたら、暴動が起きるでしょう」
グリーンスクリーンでも入れたとしても、暴動を起こさないでください。本棚は大好きですが、新しいスタジオの背景にはもっと良いものを見つけます。ここの後ろには本棚を置くスペースがそれほど多くありません。
ジャンルとして「アンチフォーク」ソングを作りましょう。アンチフォークが何かわかりませんが、コメント用には良いでしょう。あなたがこの素晴らしい曲を聴いている間に、AIが1939年から2022年までのバットモービルの完全な進化を示します。
「グリーンスクリーンに反対票を投じ、グリムロックと一緒に図書館に戻ることを求めます。本棚は本だけでなく、時空の構造、AIコメンタリーの未来、そしておそらくディランの魂も保持していました。新しいスタジオで点滅して現れたら、暴動が起きるでしょう。」
「開発者として、最終的に実際のニューロモーフィックへの移行が見られると思います。動的でより強力なアーキテクチャへの移行が、確かにAGIへのステップアップになりますが、現在のトランスフォーマーベースのLLMモデルではないでしょう。単なる私の意見です。」
以上です。次のビデオでお会いしましょう。チャンネル登録をお願いします。視聴ありがとうございました。


投稿日

カテゴリー:

投稿者:

タグ:

コメント

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です