AIニュース: テック大手企業が年末のAI競争で激突

16,543 文字

今年これまでで最も激しいAIニュース週間でした。ロンドンでのミーティングのために出張中だった私は、今やっと全ての情報に追いつこうとしています。頭がクラクラしていますが、重要な情報は全て把握できたと思います。
今週は非常に多くのニュースがあり、1本の動画では収まりきれないほどでした。Future toolsのニュースページをチェックしていただければ、今週のAI業界の出来事が全て掲載されています。膨大な量なので、皆さんが最も興味を持ちそうな内容に絞って紹介したいと思います。
まず、AI業界で最も話題になっているのは、OpenAIの12日間の発表です。12月4日、サム・アルトマンはXで「明日の午前10時(太平洋時間)から、OpenAIの12日間を開始します。平日ごとにローンチやデモのライブ配信を行います。大きな発表もあれば、クリスマスプレゼント的な小さな発表もあります。素晴らしいものをお届けできると思います。メリークリスマス」と投稿しました。
12日間の全てが終わったら、改めて詳しい分析の動画を作る予定ですが、現時点で最初の2つの発表内容が明らかになっています。1つ目はChat GPT Proで、月額200ドルの新プランです。しかし、この200ドルプランよりも大きなニュースは、OpenAI 0.1の正式リリースです。12月5日以前は0.1プレビューモデルにしかアクセスできませんでしたが、今回0.1の完全版と新しい0.1 Proモードが公開されました。
ベンチマークチャートを見ると、数学の分野で0.1 Proモードは、これまで利用可能だった0.1プレビューを大きく上回る性能を示しています。競技プログラミングでは、新しい0.1モデルはほぼ互角の性能ですが、既存の0.1プレビューと比較すると、PhD レベルの科学的質問でわずかに優れた性能を発揮しています。
私もAIには目がないので、さっそく登録して0.1 Proモードにアクセスしました。来週、より詳しい検証動画を公開する予定です。
もし200ドルを払って0.1の新モデルにアクセスするのは気が進まないという方も、ご心配なく。200ドルプランは0.1 Proモード用で、先ほどのグラフで見た通り、新しい0.1は依然として非常に優れています。サム・アルトマンもXで「念のため明確にしておくと、0.1は月額20ドルのPlusプランで利用可能です。新しいProプランは最も難しい問題でさらに深く考えることができますが、ほとんどのユーザーは20ドル/月のPlusプランの0.1で満足できるはずです」と述べています。
つまり、ほとんどの方は、20ドル/月のPlusプランを利用していれば、0.1プレビューモデルの代わりに、この0.1モデルにアクセスできるようになったということです。推論能力が以前より大幅に向上していますので、ぜひ試してみてください。
ご了承いただきたいのですが、昨夜遅くロンドンから帰国したばかりで、まだ十分なテストはできていません。アップグレードはしましたが、まだ使用していません。もう少し試用して、どの程度の性能なのかをフォローアップ動画で詳しくお伝えする予定です。
2日目の発表も既に明らかになっています。この動画を録画している12月6日に、OpenAIの強化学習による微調整研究プログラムが発表されました。これは主に開発者や機械学習エンジニア向けの発表で、特定のニッチなタスクのためにモデルを微調整できるように設計されています。
基本的に、GPTモデルに特定のニッチなタスクを実行させたい場合、個別に強化学習を行うことができます。私の理解では、特定のニッチなタスクを要求し、その実行結果に対してフィードバックを与えることで、モデルはそのフィードバックに基づいて改善し、そのニッチなタスクの性能を向上させていくことができます。
これは申請制となっており、申請ページへのリンクは説明欄に記載しておきます。利用対象者は研究機関、大学、企業となっています。私も試してみたいので申請する予定ですが、アクセス権を得られるかどうかは50-50といったところでしょう。
OpenAIの12日間の発表については、来週以降の動画でさらに詳しく解説していきます。週末は発表がないようなので、来週と再来週の平日にそれぞれ新しい発表があるはずです。多くの人が、ついにSoraへのアクセスが解禁されるのではないかと予測しています。OpenAIの従業員からいくつかの手がかりやヒントが出ているので、おそらく12日目に、1日目の新0.1モデルと対になるような形で、最後にSoraを発表するのではないかと思われます。しかし、実際どうなるかは様子を見ていきましょう。
OpenAIに関連して、今週はいくつか小さな発表もありました。手短に紹介させていただきます。Tom’s GuideとPCGamer、TechRadarなど、この企業が所有する複数のメディアのコンテンツを使用する契約を結びました。
また、これが唯一の新しいパートナーシップというわけではありません。Andilとのパートナーシップも発表され、米国のAIリーダーシップを推進し、米国と同盟国の軍を保護することを目指しています。Andilは、Oculusの創設者であるパーマー・ラッキーが設立した企業で、Palerに似た防衛技術企業です。このパートナーシップは、無人ドーンやその他の空中デバイスからの攻撃から米国と同盟国の軍事要員を保護する防衛システムの改善を目指すとされています。つまり、一部のAndurilの防衛技術にOpenAIのLLMが組み込まれるようです。
また今週は、OpenAIが初のマーケティング責任者を雇用したことも明らかになりました。Coinbaseから招聘しています。つまり、OpenAIからより多くのマーケティング活動が展開されることになるでしょう。現在のところ、マーケティングはXでの投稿とプレスリリースが中心でしたが、今後はCMやインフルエンサーキャンペーン、他の大手テック企業が行っているような様々なマーケティング活動が展開されるかもしれません。
OpenAIのニュースは簡単に進めましたが、これは追加のフォローアップを予定しているためです。OpenAIだけでなく、今週は他の企業からも多くの重要な発表がありました。
Googleからは大量の発表がありました。最も話題になっているのは、Spotifyに関するものです。今年のSpotify Wrapでは、AIポッドキャストが含まれていました。Notebook LMが今年の視聴習慣を全て取り込み、ポッドキャストを作成したのです。
また、新しいGeminiモデルも発表されました。AIニュースの動画を作るたびに新しいGeminiモデルがリリースされているような感じですが、Chat Botアリーナを見ると、12月6日にリリースされた現行のGeminiモデルは再びリーダーボードのトップに立っています。
このリーダーボードには新しい0.1モデルは含まれていないようです。以前アクセス可能だった0.1プレビューモデルはここにありますが、今週リリースされた最新モデルはこのリーダーボードには載っていません。しかし、Googleのgeminiモデルを使用する場合、現時点で最高のモデルとなっているようです。私も徐々にGoogleのGeminiモデルを使用する機会が増えてきています。今後の動画でその話をする予定です。
Googleはまた、新しいP-Gemma 2モデルも公開しました。これは画像を理解し、文脈に応じた詳細なキャプションを生成できるビジョン言語モデルです。これらのGemmaモデルの優れている点は、Googleのオープンソースモデルであることです。実際にこれらのモデルをダウンロードしてローカルで実行し、反復や構築が可能です。また、Hugging FaceやKaggleでも利用可能です。
しかし、これはGoogleが今週発表したことのほんの一部に過ぎません。また、Gencastも発表されました。これは天候を予測し、極端な気象条件のリスクを予測できるものです。実際の天候の15日前から天気予報を予測することができます。人々が天候状況をより早く把握できればできるほど、ハリケーンや台風といった気象現象に対してより良い準備ができるようになります。これは研究分野として非常にエキサイティングで、文字通り世界を変える可能性があります。
また、GoogleはPixelフォンに関連するAIの新機能も発表しました。かなりの数があるので手短に紹介していきます。新しい保存情報機能により、スマートフォンでGeminiがあなたをどのように支援するかをカスタマイズできます。実際にあなたに関する情報を記憶するので、同じことを繰り返し伝える必要がありません。
より多くのアプリを使用できるようになり、Geminiアシスタントに頼むだけでアプリを実行できます。また、基本的に電話に出ることもできます。例えば、荷物が配達される時、この機能を使用して配達員のはい・いいえの質問に応答したり、関連する追加質問をしたりすることができます。全て簡単なプロンプトを通じて行われ、配達員にはAIの声が聞こえることになります。あなたはメッセージで応答するだけで、実際に電話に出る必要はありません。会話が終わると、その会話の内容をライブトランスクリプトで確認することができます。
スマートフォンのスクリーンショットを自動的に整理することもできるようになり、これは私にとってとても役立つ機能になりそうです。私はたくさんのスクリーンショットを撮りますから。また、新しい表現豊かなキャプション機能もあります。このスクリーンショットで見られるように、誰かがより表現豊かになると大文字で表示されます。例えば、「オリジナルから3まで、彼らは彼を短く止めるだろう、そして3への正しい、彼らは彼を短く止めるだろう」という部分が、歓声と拍手とともに全て大文字で表示され、キャプションの中で起こっている興奮がより文脈的に理解できるようになっています。
PixelとAndroid内でロールアウトされている新機能は他にもたくさんあります。この動画で触れなかった他の機能へのリンクは、説明欄に記載しておきます。
Vertex AIの顧客であれば、Googleの新しいVooとImagin 3モデルを実際に使用できるようになりました。これまでVooにアクセスできたかどうかわかりませんが、私自身はアクセスできませんでした。しかし、Vertexの顧客であれば、GoogleのAIビデオジェネレーターを使用できるようになりました。これはGoogleによるSoraへの回答であり、他の様々なビデオモデルへの対応です。かなり優れた性能を示しています。
将来的には、SoraとVoo、Pika、Runway、その他の様々なAIビデオモデルを比較する動画を作る必要があるでしょう。現在、多くのモデルが存在し、どれも非常に優れた性能を示しています。
今週のGoogleからの最も興味深いニュースは、新しいGenie 2モデルです。これは大規模な基盤的世界モデルです。これは何を意味するのでしょうか？AIによって生成されたプレイ可能な世界を作ることができるのです。このロボットが動くたびに、フレームごとにAIによって生成されています。セールボートが動き回り、カメラが動き回るたびに、全てがリアルタイムで生成されています。
さらに、記憶も保持しています。他の世界モデルでは、前に進んで振り返ると場面が変わってしまうことがありましたが、このモデルは以前どこにいたかをしっかりと把握しているようです。他の例も見てみましょう。画面上では少し小さいですが、森の中の人型ロボット、古代エジプトの人型ロボット、紫色の惑星上のロボットの一人称視点、ロフトアパートメントのロボットの一人称の一人称視点など、いくつかの動画は本当にクールです。例えば、川の上を走るスピードボートや、トレイルを歩く一人称視点を見てください。先ほど述べたように、長期的な記憶を持っているため、既に見た内容を実際に記憶しています。
これら全てをプロンプトから生成できるのです。望むシーンをプロンプトで指示すると、その中を実際に動き回れる空間を作り出します。
陳腐な言い方かもしれませんが、これは始まりに過ぎません。将来のゲームについて考えてみてください。5年後には、ゲームが全てこのように生成される可能性があります。このモデルは実際にNPCを作り出し、それらと対話することもできます。これは本当に驚くべきことです。
現実的な物理法則、煙、重力なども実装されています。この車がこの崖から落ちようとしているのを見てください。実際に崖から落ちるのが分かります。重力を理解しているのです。これは本当に驚くべきことです。
懐中電灯を持って森の中を歩く人の例を見てください。トーチが歩いている場所を照らし、懐中電灯が指している方向を照らしているのが分かります。リアルな反射も表現できます。本当に素晴らしいです。
これは現時点では研究段階のデモンストレーションに過ぎず、まだアクセスはできないようです。しかし、アクセスが可能になり次第、私も試してみて、その性能を徹底的に検証する予定です。
私の友人であるベラバル・サドゥのポストを紹介させてください。彼はこう言っています：「ゲームの世界のための2Dコンセプトアートを作り、ボタンを押すだけで突然インタラクティブな3D世界の中を歩き回れるようになる、それがGenie 2の能力です。ドアを開けたり、ジャンプしたり、泳いだりといったあらゆる行動の結果をシミュレートできます。」
彼は続けて「これは2つの点で有望です。ゲーム開発者にとっては、コンセプトアートから直接インタラクティブな体験の急速なプロトタイピングが可能になります。AI研究にとっては、AIエージェントのトレーニングとテストのための無限に多様な3D環境を提供します。」と述べています。
実は今週、World Labsからも同様のものが発表されました。1枚の写真をアップロードするだけで、同様に移動可能な世界を生成し、UALメモリを使用できます。World Labsのウェブサイトを見ると、他の例も確認できます。AIが生成した画像が、実際にナビゲート可能な世界になるのです。
デモも少し使用できます。WASDキーを使用でき、このデモ内で移動することができます。実際にキーを使って移動し、マウスをクリックすると周りを見回すことができます。このように見回すと、石畳の階段と後ろに木々があるのが分かります。また前を向くと、井戸はまだそこにあり、後ろを向くと同じシーンが見えます。つまり、以前見たものの記憶を保持しているのです。
移動できる範囲はかなり小さく、物に近づくと「範囲外」と表示されます。他にもいくつかのデモがテストできます。これはハイキングトレイルのようなものですが、範囲外になる前に少し移動できます。繰り返しになりますが、これは最も基本的な段階に過ぎません。
他にもたくさんのデモがありますが、サプライズを台無しにしたくないので、worlds.ai/blogに行って自分で試してみてください。たくさんのデモを試すことができ、完全に無料です。本当にクールなので、ぜひチェックしてみてください。
今日の動画は、Build Your Store AIがスポンサーです。これは、すぐに販売可能な商品を含むウェブサイトを持つオンラインビジネスを、最小限の初期投資で数分以内に作成できるプラットフォームです。
従来、オンラインビジネスを始めるには多くのセットアップ作業と技術的な知識が必要でした。Build Your Store AIは、ストア作成、商品選択、注文履行サービスを自動化することで、このプロセスを簡素化することを目指しています。
使い方は以下の通りです。まずBuild Your Store AIプラットフォームに登録し、ニッチを選択します。その後、最初の3ヶ月は1ドルで始められるShopifyアカウントを設定します。Build Your Store アプリをインストールすると、AIシステムがカスタマイズされたShopifyストアを作成します。
プラットフォームには、選択したニッチから事前に選ばれた成功商品が含まれています。これにより、ストアの構築や商品リサーチに時間を費やすことなく、すぐにマーケティングと販売に集中できます。
また、ストアビルダーはAutodsと統合されており、事前に選択された商品の調達と注文履行を処理します。この自動化により、在庫管理や配送といったオンラインストア運営の技術的・物流的側面が自動的に処理されます。
セットアップ全体はわずか数分で完了し、Build Your Store AIプラットフォームを試すのに費用はかかりません。副業を始めたい方でも、本格的なeコマースビジネスを構築したい方でも、Build Your Store AIは合理化された低リスクな始め方を提供します。説明欄のリンクをクリックして、無料のAI構築オンラインストアを手に入れてください。
今週はGrockもAIニュースに加わりました。以前はXの有料会員だけがGrockチャットボットを使用できましたが、今では有料サブスクリプションは不要になりました。Xアカウントさえあれば、Grockを使って遊べるようになりました。
デスクトップの私のアカウントを見ると、Grockオプションが表示されているのが分かります。私は有料メンバーなのでGrockオプションを持っていましたが、無料のXメンバーの方も今ではGrockにアクセスできるはずです。
正直なところ、Grockの最もクールな機能の1つは画像生成機能です。Flux 1.1 Proを使用していると思われ、現在最高の画像生成器の1つです。画像の生成を試してみてください。かなりクールですよ。
また、Xは今後AIの世界でより多くのものを見せてくれるでしょう。彼らはAIへの野心を実現するために、追加で10億ドルの資金を調達したばかりです。
もちろん、他のAI企業が大きな発表をする中、Metaも黙っているわけにはいきません。彼らも新しいLlamaモデルを公開しました。今年初めのMeta Connectで、Llama 3.1を発表しましたが、今や既にLlama 3.3をリリースしています。
このベンチマークテストを見ると、コーディングと数学の分野で大幅な改善が見られます。そして、使用コストは全く同じままです。
Microsoftはプレビューで新しいCopilot Vision機能をロールアウトしました。Windowsのプレビューバージョンが必要ですが、Copilotは実際にコンピュータで何が起こっているかを見て、文脈を理解し、コンピュータで起こっていることに基づいて質問に答えることができます。
これは少し前に紹介された機能ですが、今回実際にアクセスが可能になりました。このデモ動画では、ある人が醜いクリスマスセーターを探していて、コンピュータと実際にチャットしており、Copilotがどのセーターを買うべきかアドバイスを提供しています。基本的に、画面で何が起こっているかを見ながら、コンピュータと会話をしているのです。
この動画には音楽が入っているので、音声は再生しませんでしたが、基本的にそういうことが起こっています。Copilotは画面で何が起こっているかを見て、ユーザーはそれと会話をしているのです。
また、Microsoftは今週、Phpicaという新しいモデルもロールアウトしました。これは小規模言語モデルで、コンピュータでローカルに実行できるように設計されています。つまり、データをクラウドに送信する必要がありません。
これは特に、WordやOutlookでクリックして実行する書き換えや要約機能、そして開発者が利用するためのデバイス上で最適化された小規模言語モデルを実行することを目的としています。
Amazonも今週、いくつかの発表を行いました。その中には、Novaと呼ばれる新世代の基盤モデルも含まれています。Amazonはanthropicに投資し、パートナーシップを結んでおり、近い将来、AlexaやAmazonのテクノロジーの多くでanthropicを目にすることになりそうです。
しかし、彼らは独自のAIモデルを開発することで、ある程度のリスクヘッジも行っています。リリースされたモデル群を見てみましょう：
Amazon Nova Micro: 最低レイテンシーの応答を非常に低コストで提供するテキストのみのモデル
Nova Light: 画像、動画、テキスト入力に対して超高速な低コストのマルチモーダルモデル
Nova Pro: 精度、速度、コストを組み合わせた高性能なマルチモーダルモデル
Nova Premier: Amazonのマルチモーダルモデルの中で最も高性能で、複雑な推論とカスタムモデルの蒸留に使用。2025年第1四半期に利用可能
Nova Canvas: 最先端の画像生成モデル
Nova Real: 最先端のビデオ生成モデル
つまり、Amazonは、OpenAIやGoogle、その他の企業から見られるような種類のモデルを全て作成しているようです。
ウェブサイトには、「Dolly forward」というプロンプトで海の画像の例が掲載されており、ビデオが前に進み、波が一貫して打ち寄せ続けるのが分かります。また、画像生成モデルを示すものと思われるパスタ都市の広告コンセプトも紹介されています。これはビデオではなく画像で、画像をズームインしているだけのようです。これがビデオ生成モデルですが、これが新しいAmazonモデルで生成できるようなものです。
また、Amazon Connectも発表されました。これは顧客サービスを強化するための新しい生成AIモデルです。これは、Amazonで商品を販売している場合、販売している商品の顧客サービスを支援するAIモデルを持つことができるようです。
先ほど触れたように、AmazonとAnthropicは協力関係にありますが、今週、両社がスーパーコンピュータを共同で構築しようとしていることが明らかになりました。
最後にAmazonのニュースとして、Luma AIもAmazonとパートナーシップを結びました。Lumaのビデオおよびイメージ生成モデルをAmazon Bedrockに提供する予定です。
彼らは「これには、クリエイティブでインテリジェントな画像生成の新基準を設定する全く新しいLuma PhotonとPhoton Flash、そして近日公開予定の超先進的なビデオ生成モデルRay 2が含まれます」と述べています。
これらのビデオ生成モデルはさらに良くなり、近い将来、新しいモデルを目にすることになるでしょう。実際にXに投稿された動画で、Amazon Bedrockで利用可能になる新しいLumaモデルの先行公開を見ることができます。
動画全体は1分30秒なので再生はしませんが、説明欄にリンクを貼っておきますので、彼らが公開した完全なデモ動画をご覧ください。超リアルというわけではありませんが、非常に印象的な見た目をしています。私はその美的センスが本当に好きです。
ビデオAIについて触れている間に、Huo AI（Minia Maxとしても知られる）も、Huo 12 V1 Liveを発表しました。これは静止アートを動的な傑作に変換するものです。
これは彼らの画像からビデオへの変換モデルで、滑らかさと鮮やかな動きで2Dイラストに命を吹き込むように設計されています。このモデルにより、キャラクターは今までにない方法で動き、話し、輝くことができます。安定性と微妙な表現のために最適化され、比類のない流動性と繊細さで幅広いアーティスティックスタイルをサポートします。
ここで再生されているデモで、このモデルが生成できる種類の動画を見ることができます。これらのモデルを試してみたい場合は、helluo.ai.videoで試すことができます。
中国のTencentも、Hon Videoという新しいAIビデオモデルをリリースしました。発音が間違っていたらすみません。このモデルはオープンソースで、自由に利用可能です。ダウンロードして反復、構築できます。おそらく検閲はほとんどないと思われます。まだ私自身は試していません。先週はずっとロンドンにいましたから。しかし、これは将来的に他のビデオモデルと比較してみる必要がある興味深いものです。
GitHubとHugging Faceで利用可能で、ウェブサイトから直接試すこともできます。ただし、登録には+86で始まる電話番号が必要なようです。しかし、技術的な知識があれば、GitHubやHugging Faceからダウンロードしてローカルで使用できるはずです。これは将来的に実験する必要があります。
Leonardo AIが、私が非常に楽しみにしていた機能をロールアウトしました。これは以前から聞いていましたが、話すことを許されていませんでした。しかし、この機能には本当に興奮しています。Flow Stateと呼ばれています。私はLeonardoのアドバイザーなので、それを考慮に入れてください。しかし、この機能は本当に素晴らしいと思います。
このFlow State機能は、アイデアを持ちつつ、AIがクリエイティブなコラボレーターとなることを目的としています。例えば、「月に向かって吠える狼」というプロンプトを与えると、最初の画像を生成し、8つの画像が生成されます。しかし、下部には「スクロールして更に生成」と表示されています。これらの画像が気に入らない場合、求めているものが得られなかった場合は、単にスクロールを続けると、私のために新しい画像を生成し続けます。
これは本当に驚くべきことです。好みのスタイルと見た目の画像が見つかるまでスクロールを続けることができます。そして、好みのスタイルの画像を見つけたら – 例えば、このスタイルが気に入ったとしても、その画像が完全に好みではない場合 – 「これに似たものを」をクリックすると、同様のものをたくさん生成します。
そしてまた、新しい画像を生成しながらスクロールを続けることができ、さらに近いものを見つけることができます。おっ、この金色のものはかっこよく見えますね。ライブラリに保存しましょう。これを使うかもしれません。でも、続けましょう。「これに似たものを」を選びましょう。
すると、それに似た画像をさらに生成し始めます。求める画像を得るために本当に良いプロンプトを考える必要はありません。美的に魅力的な画像を見つけるまでスクロールを続け、それを使うか、それに似たものを生成し、望む画像に絞り込むまでスクロールし続けることができます。
ここには他の設定もあります。求める雰囲気を調整したり、求める照明を調整したり、ショットタイプを調整したり、カラーテーマを調整したりできます。もちろん、様々な寸法もあります。
私にとって、これは画像のプロンプトを与える全く新しい方法です。コンセプトを与え、スクロールを続け、気に入ったものをクリックし、スクロールして気に入ったものをクリックし、求めている正確な画像に絞り込んでいくのです。これは本当にクールです。
マイクを持ってカメラを見つめるニュースキャスター – これは私のサムネイルによく使うプロンプトです。では、私のAIニュース動画の1つに完璧なサムネイルを作ってみましょう。
これらはあまり求めている美的センスではありませんね。これはタトゥーです。これはランダムにドナルド・トランプを生成しました。このような絵画のスタイルが本当に好きですね。これに似たものをやってみましょう。
クリックするとすぐに、雰囲気がコンセプトアートに、照明が輝くように設定されたのが分かります。そして今、このスタイルでより多くの生成を得ています。これは少しクールに見えますが、私の好みには少し暗すぎますね。このコミック調のスタイルが気に入りました。
このスタイルが本当に気に入りました。これに似たものをもっと生成しましょう。実は、過去にクリックしたものに戻って、その状態にジャンプすることもできます。この見た目が気に入りました。もし私の顔に似た顔と交換できれば、それはかなりクールかもしれません。では、これを保存しましょう。
これも良さそうですね。これも保存しましょう。この動画のサムネイルは、私たちが選んだ画像の1つかもしれませんね。これが新しいLeonardoのFlow Stateです。求める正確な画像を得るために何百もの異なるプロンプトを試す代わりに、単に飛び込んで、求めるものを得るまで続けることができ、代わりにLeonardoに反復させることができるため、私はこの機能の大ファンです。本当にクールな機能です。
では、AIオーディオについて話しましょう。11 Labsは先週、記事やPDFなどを与えるとポッドキャストを作成する新機能を発表しました。そして、新機能がロールアウトされ、今ではウェブアプリで直接できるようになりました。以前はモバイルアプリでしか利用できませんでしたが、今ではウェブアプリでも利用可能です。
以前は作成したポッドキャストをダウンロードすることができませんでしたが、今ではダウンロードができます。プロジェクト機能を使用することで、プロジェクトの下にGen FM、ポッドキャストの生成があるのが分かります。ここをクリックすると、複数の声の中から選択できます。
実際に、ポッドキャストのホストの1つを私の声にすることもできます。Notebook LMのような機能が好きな場合、これも同様のことができますが、実際の声をより細かくカスタマイズできます。
12月3日、彼らは会話型AIの導入を発表しました。これは、他の人が対話できる独自のAIチャットボットを作成し、自分の知識で訓練できる機能です。しかし、これについては数週間前の動画で話しましたので、発表のタイミングが少し混乱しました。
数週間前にXで発表されましたが、最近になってブログ投稿でより公開されたのだと思います。この会話型AIについてより詳しく知りたい場合は、直近の2つのAIニュース動画のいずれかで取り上げています。
また、11 Labsから最近インタビューした人がNext Waveポッドキャストに登場する予定です。11 Labsが何をしているのかより深く知りたい場合は、Next Waveポッドキャストを購読してください。そのエピソードはまもなく配信される予定です。
Hume AI – 会話の声のツールを作ることで知られる企業で、声のトーンを実際に理解できます。怒っているときや幸せなときを判断できます。話している際の微妙なニュアンスを聞き取って、あなたがどう感じているかを理解しようとします – 彼らは新しい音声コントロールを導入しました。
このツールは、10の声の次元 – 性別、自己主張、浮力、自信、熱意、鼻音、リラックス度、滑らかさ、湿度、緊張度 – を開発者が制御できるようにします。プロンプトベースのアプローチとは異なり、音声制御はこれらの次元に沿って連続的な調整を可能にし、セッション間で音声の変更を再現可能にします。
これはベータ版としてリリースされ、開発者が試すことができます。まだ私自身は試していませんが、時間ができ次第試してみる予定です。今日の動画はより発表を紹介することが目的でしたが、今後数週間で、これらのツールすべてを試して、個々のツールについての動画を作る予定です。
この動画を購読していれば、多くのツールについてより深く掘り下げた内容を今後の動画で見ることができます。ご心配なく。
Perplexityは、パブリッシャープログラムに新しいメンバーを追加しました。基本的に、Perplexityが彼らのコンテンツを表示した場合、これらのソースは支払いを受けることになります。
Ad Week、Blavity、DP Review、Gear Patrol、The Independent、Lee Enterprises、Los Angeles Times、Media Lab、Mexico News Daily、M Kabo、Infon、Noid、Newsp、Prisa Media、RTL Germany Brand Stern and NTV、World History Encyclopediaが追加されたことが分かります。
AI業界では、イーロン・マスクとOpenAIの間でさらなるドラマが展開されています。イーロン・マスクは今週、OpenAIが営利企業に移行することを阻止するための差し止め命令を申請しました。
イーロン・マスクは、OpenAIが投資家にOpenAIのライバルであるxAIへの投資を思いとどまらせ、MicrosoftとのOpenAIの繋がりを通じて競争上機密性の高い情報を不当に入手し、OpenAIのガバナンス構造を営利目的に転換し、知的財産を含む重要な資産を移転させ、被告が重要な金融的利害を持つ組織とOpenAIが取引を行うようにしたと主張しています。
また、OpenAI設立初期のサム・アルトマンとイーロン・マスクの間のメールも公開されました。これらを読むための最良のソースは、InstagramのChat GPT Tricksでした。説明欄にリンクを記載しておきます。
これらのメールすべてを紹介することはしませんが、かなりの量があります。2015年にさかのぼり、サムがイーロン・マスクに次のように書いています：「人類がAIを開発することを止めることが可能かどうかについて多く考えてきました。答えはほぼ確実にノーだと思います。もし必ず起こることなら、Googleではなく他の誰かが最初に行うことが良いように思います。
YCがAIのためのマンハッタン計画を始めることが良いかどうかについて、何か考えはありますか？トップ50人の多くに参加してもらえると思います。そして、非営利を通じて技術を世界のものにできますが、うまくいけば働く人々はスタートアップのような報酬を得られます。もちろん、すべての規制に積極的に従い、支持します。」
イーロン・マスクは「会話する価値はありそうだ」と返信しました。
その後のメッセージは、2027年のイリヤ・セスとサム・アルトマン、イーロン・マスクの間のやり取りに飛び、OpenAIの将来と営利か非営利かという点について意見の相違が生じ始めます。
かなりのメールがありますので、ここでは一つ一つ紹介はしませんが、読みたい方は、InstagramのChat GPT Tricksアカウントですべてのメールを読むことをお勧めします。
ドナルド・トランプは、新しいAIおよび暗号通貨担当のデビッド・サックスを発表しました。トランプによると、この重要な役割で、デビッドはアメリカの競争力の未来にとって重要な2つの分野である人工知能と暗号通貨の政策を導くことになります。
デビッドは、オンラインの言論の自由を守り、ビッグテックのバイアスと検閲から遠ざけることに焦点を当てます。また、暗号通貨業界が求めている明確性を持つ法的枠組みを作り、米国で業界が繁栄できるように取り組みます。
サックスは投資家で、All-Inポッドキャストの共同ホストの一人です。少し自慢になりますが、彼は私のTwitterをフォローしているので、私のツイートが将来的に米国の政策に影響を与える可能性もありますね。
非常に評判の悪かったHumane AI Pinを作ったHumane社は、実際にオペレーティングシステムをリリースし、車や他のデバイスなどで使用されることを期待しています。
彼らは、なぜか企業ロゴがぼかされた状態で、実際に人がHumaneと車の中で話している様子のデモ動画を公開しました。あなたの代わりにアクションを起こすことができるというアイデアで、例えば運転中にホテルを予約してほしいと伝えると、あなたの代わりにそのような作業を行うことができます。
また、人が車から外に出て、PINを使用して会話を続け、その後自宅でぼかされたデバイスを使用して、PINを持っていなくても会話を継続する様子も紹介されています。モバイルアプリ内でも使用できることを示しました。
これで、AI PINの販売だけでなく、既存の様々なデバイスに統合できる、あなたの代わりにアクションを起こすことができるこのオペレーティングシステムへとピボットしているように見えます。
最後にいつものようにロボットの話で締めくくりましょう。Clone Roboticsのウェブサイトを見つけました。彼らは、これまでで最も人間らしく見えるアンドロイドを新たに公開しています。
これはまだコンセプトのように見えます。実際のプロトタイプの写真や動画はまだ見ていませんが、骨格と筋肉を持ち、基本的にウエストワールドのような本物の人間の創造になるという、このクールなビジュアルを示しています。期待と不気味さを感じさせるものですね。
以上が今日お伝えすることです。繰り返しになりますが、今週は今年で最も忙しいAIニュース週間の1つでした。私はその大半をロンドンで過ごしていたので、出張中になんとか追いつこうとしていました。
発表が多すぎて、1時間以上の動画にならずに全てを紹介することはできませんでした。Future Tools.newsをチェックしてください。今週起こったことを全てこのウェブサイトにリストアップしてありますので、簡単にアップデートを確認することができます。
また、通常の金曜日のニュース動画よりもツールのデモをかなり少なくしました。これは単に、まだ十分に試す機会がなかったためです。来週は、今週起こったことの個々の側面に深く踏み込んだ動画をいくつか公開する予定です。
また来週は、これらの企業からさらに多くの発表があり、話題にすることが増えるでしょう。昨年12月にはAIニュースが少し減速しましたので、今年も同じようになると思っていましたが、今年の12月はこれまでで最大のAIニュース月間となっています。
これは、物事が減速するかもしれないと私が言うときは、通常間違っているということを証明しています。申し訳ありません。しかし、引き続きニュースを報告し、楽しみ、試し、お伝えし続けていきます。
来週は、これらのものをより深く掘り下げた内容を期待してください。これらの多くを自分で使用する方法についてのチュートリアルも含まれます。たくさんのエキサイティングな動画を計画しています。
幸いなことに、12月の残りの期間は出張の予定がないので、現在AI業界で起こっているこれらのクールなことすべてについて、学び、使い、教えることに集中できます。
非常にエキサイティングな時期です。私と同じくらい興奮していただければ嬉しいです。私はこれらすべてに関わっていきたいと思います。さらに多くのことを皆さんと共有できることを楽しみにしています。
繰り返しになりますが、Future Tools.ioをチェックしてください。ニュースに加えて、私が出会った最新のAIツールも共有しています。また、無料のニュースレターもあります。
無料のニュースレターに登録すると、AI Income Databaseをお送りします。これはAIツールを使用してお金を稼ぐ方法をまとめたクールなデータベースです。ニュースレターに参加することで無料で入手できます。
もちろん、最も重要なニュースと最もクールなツールを、私が見つけ次第、直接あなたのインボックスにお届けします。これは全てFuture Tools.ioで提供しています。
本日も私とオタク的な会話にお付き合いいただき、ありがとうございました。本当に感謝しています。また次の動画でお会いできることを願っています。
改めて視聴いただき、そしてBuild Your StoreとAutoDSにこの動画のスポンサーとなっていただき、ありがとうございました。それでは、さようなら。