
電車の中で窓から雪山を見ている女性を試してみましょう。悪くないですね。これはすでにとても印象的です。地下鉄の駅で携帯電話を使っているブロンドの女性を試してみましょう。冗談でしょう。これがAIだなんて。黒と白のシャツを着て、ヘッドセットをつけ、会話をしているように見える男性はどうでしょうか。いやいや、これがAIのはずがありません。ゲーマーインフルエンサーがヘッドホンをつけてライブ配信をしているのはどうでしょうか。ありえません。これがAIだなんてあり得ません。
すごい。今、本当に驚いています。また新しいビデオジェネレーターが登場したのですが、これは信じられないほどすごいです。これらのビデオの品質を見てください。これまで見たAIジェネレーターの中で最も自然で現実的な映像です。今日はこの新しいツールをレビューし、使い方をお見せします。
このツールはHotshotと呼ばれ、hotshot.aiからアクセスできます。リンクは説明欄に記載しています。右上の「Make your own」をクリックし、Googleアカウントでサインアップできます。サインインすると、現時点では1日に3回無料で生成できることに注目してください。ここにプロンプトを入力するだけです。現在、ビデオは5秒間で、1344×768のサイズです。フルHDではありませんが、かなり近いです。
下の例のビデオを見ると分かるように、Hotshotは人間のポートレートビデオの生成が非常に得意なようです。これらの動きがいかに現実的で自然かがわかります。では、同様の例を試してみましょう。うまくいくと分かっているプロンプトをいくつか紹介し、その後、より難しいプロンプトも試して、弱点を示します。
最初のプロンプトは「ショッピングモールで携帯電話を使っている韓国人女性」です。現在、生成ボタンしかないことに注意してください。Cingeやlumaのような他のビデオジェネレーターとは違い、最初のフレームや最後のフレームとして画像をアップロードしてビデオを生成することはできません。また、創造性の調整やプロンプトの遵守度、ビデオの長さ、アスペクト比、カメラの動きなどの設定もありません。Hotshotには現在そのような機能はなく、プロンプトを入力して生成をクリックするだけです。
この「プロンプトの強化」トグルは、基本的にAIを使ってプロンプトをより詳細にします。プロンプトが長く詳細であるほど、結果は良くなります。プロンプトが短い場合は通常これをオンにしますが、プロンプトがすでに長く詳細な場合はオフにします。では、生成をクリックして何が出てくるか見てみましょう。
生成には1〜2分かかりますが、このビデオが公開されてこのツールが世界に知られるころには、もっと時間がかかるかもしれません。しかし、現時点では生成は非常に速いです。
さて、結果が出ました。このビデオジェネレーターがいかに凄いかがすぐに分かります。これは100%リアルに見えます。本当に欠点を指摘できません。彼女の指は正確で、顔は完全にリアルです。動きがとてもナチュラルで現実的です。背景を歩いている人々も含めて、すべてがとてもリアルに見えます。本当に目立つ欠点を指摘できません。このツールは本当に驚異的です。
次のプロンプトは「ヘッドホンをつけてライブ配信をしているゲーマーインフルエンサー」です。これも人間とポートレート、上半身を含むプロンプトなので、うまくいくと分かっています。では、これができるか見てみましょう。
ここに生成結果が出ました。これは本当にリアルすぎて、欠点を指摘するのが難しいです。これがどれだけ自然で現実的に見えるか見てください。この男性はヘッドセットをつけ、人間のように話し、動いています。これがAI生成だと知らずにオンラインでこのビデオを見たら、99%の人が騙されるでしょう。このツールは、このタイプの生成に対して信じられないほど優れています。
人間のポートレートビデオを完璧に生成できることは分かりました。では、より難しいプロンプトをテストして、それらも生成できるか見てみましょう。最初のテストは、空中ドローンビデオを生成する能力をテストします。ちなみに、ここでTurbo Typeというクローム拡張機能を使っています。これを使うと、キーボードショートカットを設定できます。新しいビデオジェネレーターをテストするために頻繁に使うビデオプロンプトに対して、たくさんのキーボードショートカットを設定しているのが分かります。例えば、/V1と入力するだけで、自動的に完全なプロンプトが入力されます。
では、生成をクリックして何が出てくるか見てみましょう。結果が出ました。空中ドローンビューには見えません。もっと上からの視点を期待していましたが、右から左へのパンニングのように見えます。ドローンショットなら、山の上を飛んでいるように、まっすぐ前に進むべきです。この結果にはあまり感心しません。
ちなみに、これは同じプロンプトですが、Minimaxという別の新しいビデオジェネレーターを使っています。これも最近登場したばかりです。Minimaxがこれらの空中ドローンショットにどれほど優れているかがわかります。この品質が本当に気に入っています。ちなみに、Minimaxについて聞いたことがない場合は、前回のビデオで完全なレビューと使い方を紹介していますので、ご覧ください。これは非常に強力な新しいビデオジェネレーターです。
ここに2つを並べて比較しています。Hotshotの良い点は、ビデオにウォーターマークがないことです。一方、現在のトップジェネレーターであるRunway、Luma、Cling、Minxはすべてビデオにウォーターマークを付けています。もちろん、後処理で簡単に削除できますが、それは余計な手間です。
次は/V2と入力し、プロンプトは「砂漠でユニコーンに乗る宇宙飛行士」です。これはより難しいプロンプトです。おそらくこれはトレーニングデータにはなかったでしょう。砂漠でユニコーンに乗る宇宙飛行士の動画はほとんど、あるいは全く見たことがないはずです。では、これができるか見てみましょう。
ここに「砂漠でユニコーンに乗る宇宙飛行士」の結果が出ました。ビデオの始まりを見ると、馬がまっすぐに歩いていないで、滑るように動いているのがわかります。これは非常に目立つ欠点です。また、頭に角がないので、本当のユニコーンではありません。宇宙飛行士のヘルメットも、なんだか変です。宇宙飛行士のヘルメットというよりバイクのヘルメットのように見えます。彼のシャツのテキストは、コストコのロゴを思い出させます。どう思いますか?とにかく、馬の動きとプロンプトの全体的な遵守という点では、このビデオにはあまり感心しません。
これは同じプロンプトですが、Clingという別のビデオジェネレーターを使っています。動きがより現実的で自然なのがわかります。そして、これは同じプロンプトですが、Minimaxという別の新しいビデオジェネレーターを使っています。ここでも、宇宙飛行士とユニコーンがHotshotよりもずっと良く見えます。さらに、このユニコーンは実際に頭に角があります。ここに生成結果を並べて比較してみました。
次は、あなたのお気に入りのプロンプト「スパゲッティを食べるウィル・スミス」です。実際にウィル・スミスを生成できるか見てみましょう。他の多くのビデオジェネレーターは、実際にウィル・スミスを生成することができません。おそらくコンテンツポリシーか何かに関係していると思いますが、セレブリティや他の有名人を生成することができません。では、Hotshotがこれを実現できるか見てみましょう。
さて、ここにスパゲッティを食べるウィル・スミスがいます。確かに黒人男性を生成しましたが、これは明らかにウィル・スミスではありません。セレブリティや実在の人物を生成できないようなコンテンツポリシーのガードレールが設置されているようです。
これらのビデオジェネレーターのレビューの結論として、特定のジェネレーターは一つのことには優れていますが、他のことには適していないということです。例えば、食事のビデオを作りたい場合、Clingが絶対的な王者です。人々が食事をしているビデオの生成が非常に得意です。ウィル・スミスのようなセレブリティを生成したい場合、現時点で唯一良いのはMinimaxです。Minimaxはテキストからビデオでウィル・スミスを実際に生成することができます。これがMinimaxで生成したものです。
Hotshotに戻ると、人が食べているビデオの生成は得意ではありません。フォークが変形しており、パスタに一貫性がなく、口の動きが全く不正確で、これはウィル・スミスではありません。この点では0点をつけざるを得ません。
次は「シェフになるために学んでいるポメラニアンの子犬たち」です。これも非常に難しいプロンプトです。一匹の動物だけでなく、今度は複数の動物が一緒にいます。さらに、特定の犬種、ポメラニアンの子犬を指定しました。そして彼らはシェフになるために学んでいます。これは非常に異常なシチュエーションです。どんな結果が出るか見てみましょう。
ここに結果が出ました。1年前にこのビデオを見たら、本当に感動したでしょう。しかし今はもうそれほど感動しません。より良い生成を見てきたからです。確かに、これは3匹のポメラニアンの子犬のグループのように見えます。そして、彼らはシェフになるために学んでいるように見えます。しかし、彼らの動きは少し不自然に見えます。そして、キッチンテーブルの上にあるこれらのオブジェクト、例えばこの物が何なのか、あるいはこの赤いボウルの端にあるこれらの物が何なのかわかりません。これはAI生成であることを示す明らかな手がかりです。
品質はまだ非常に良いです。3匹のポメラニアンの子犬がシェフになるために学んでいる様子を生成することはできていますが、例えば、これはMinxで生成したものです。これがいかにリアルに見えるかがわかります。これは本当にポメラニアンの子犬のように見えます。そして彼らはシェフになるために学んでいます。このポメラニアンが生地の山をこねているのを見てください。これは本当にリアルに見えます。
ここに2つのジェネレーターを並べて比較しています。Hotshotもまだ非常に印象的ですが、この場合はMinimaxに軍配を上げざるを得ません。
スポンサーのAbacus AIが提供する素晴らしいツール、Chat LLMについてお話しします。これを使うと、最高のAIモデルを1つの統合されたプラットフォームで使用できます。これにはGPT-4、Claude 3.5 Sonnet、LLaMA 3.1、そして彼ら独自のSmogが含まれます。通常のチャットボットとして使用できるだけでなく、画像を生成することもできます。また、非常にクールなアーティファクト機能があり、コーディングや何かを構築している場合、アプリをサイドバイサイドで表示して操作できます。
PDFやドキュメントをここにドラッグ&ドロップして分析することもできます。これはレポートの生成やデータの分析に最適です。チャットインターフェース内で簡単にデータテーブルやチャートを作成できます。これは非常に便利です。また、便利な「人間化」ボタンがあり、出力を異なるトーンに変換し、AI検出を回避することができます。Slackや他のエンタープライズプラットフォームにシームレスに統合できるので、チームコラボレーションにも最適です。さらに、特定のタスクを自動化するカスタムエージェントを作成することもできます。これは、最高のAIモデルを1つのプラットフォームで使用できる非常に強力で多目的なツールです。説明欄のリンクから試してみてください。
さて、次の難しいプロンプトです。「TEDトークをしている女性。彼女の後ろには「TEDxAI search」というテキストが書かれた大きなネオンサインがあり、スポットライトスタイルの照明が当たっている」。これは人間が話しているのを生成するだけでなく、テキストを生成する能力もテストしています。背景に「TEDxAI search」というテキストが書かれた大きなネオンサインがなければなりません。これはすでにかなり詳細なプロンプトなので、「プロンプトの強化」オプションをオフにします。おそらくこれをさらに詳細にする必要はないでしょう。では、生成をクリックしてみましょう。
ここに結果が出ました。まず第一に、Hotshotは人が話しているビデオの生成に関しては本当に信じられないほど優れています。この女性の動きがいかにリアルかがわかります。これらの指の時間的な不一致を除けば、指をズームアウトして注意深く見ていなければ、これは本当にリアルに見えます。また、ある程度TEDxのロゴも生成できています。大きなネオンサインに「TEDxAI search」というテキストが書かれているように指定しましたが、それを生成することはできませんでした。背景に「AI search」は見えますが、それ以外にもランダムなテキストが追加されており、これが台無しにしています。この例から、ある程度テキストを生成できますが、プロンプトに忠実に従うのは得意ではないことがわかります。
繰り返しになりますが、Hotshotが得意なのは人間のポートレートや上半身のビデオを生成することです。他のすべては平凡な結果になります。これは同じプロンプトをMinimaxで生成したものです。Minimaxはテキストを完璧に生成しています。これは確かにTEDxのロゴで、「AI search」と書かれたネオンサインです。Minimaxはプロンプトに忠実に従うのが非常に得意だと分かりました。
次は、夜空のタイムラプスビデオを生成する能力をテストしています。多くの以前のビデオジェネレーターはこれらのタイムラプスビデオを正確に生成できませんでした。このジェネレーターがこれを実現できるか見てみましょう。
ここに結果が出ました。これは本当に正確とは言えません。タイムラプスでは星はこのようには見えません。長時間露光技術を使用すると達成できる軌跡を残していますが、その技術を使用しているのであれば、オーロラも軌跡を残すはずです。現在の見た目よりももっと露光されているはずです。これは100%正確ではありません。オーロラの動きは本物のように見えますが、背景に星を重ねると一貫性がなくなります。
これはMinimaxで生成したものです。これの方がずっと正確に見えます。星が空を動いているように見えます。Hotshotは夜空のタイムラプスビデオの生成が得意ではないようです。
次のプロンプトは、ディズニーピクサースタイルのビデオを生成する能力をテストしています。プロンプトは「ディズニーピクサーアニメーションスタイル。美しい輝く白いドレスを着たお姫様が、赤く光る目をした巨大なドラゴンから逃げている」です。このプロンプトはすでに非常に詳細なので、「プロンプトの強化」をオフにして生成をクリックします。
ここに結果が出ました。ある程度ディズニーピクサーアニメーションスタイルになっています。お姫様は美しい輝く白いドレスを着ていますが、巨大なドラゴンから逃げているのではなく、それに向かって走っています。ああ、お姫様、死んでしまいます。
これは非常に難しいプロンプトです。このプロンプトをMinimaxやClingでもテストしましたが、どちらもお姫様が実際にドラゴンから逃げているのを生成することはできませんでした。Minimaxでは、彼女はただドラゴンに対して垂直に走っているだけです。Clingでは、彼女はただ気楽に歩いているだけです。Hotshotに戻ると、これはさらに悪いです。彼女はドラゴンに向かって走っているので、即座に殺されてしまいます。
より激しい動きのあるビデオに関しては、Hotshotは得意ではありません。このディズニーピクサースタイルを本当に生成したい場合、今のところこれを実現できる唯一のビデオジェネレーターはMinimaxです。
次のプロンプトも、テキストを生成する能力をテストしています。プロンプトは「鮮やかなカラフルな煙で作られた「私のチャンネルに登録してください」というテキスト」です。これを実現できるか見てみましょう。
ここに結果が出ました。ある程度テキストを作っていますが、あまり上手くありません。「subscribe」は正しくスペルされていますが、他はすべて間違っています。余分なMや余分なNがあります。テキストの生成は得意ではありません。さらに、プロンプトでは「鮮やかなカラフルな煙で作られたテキスト」と指定しましたが、この煙でテキストを作ることができていません。残念ながら、これは失敗です。
ちなみに、これは非常に難しいプロンプトで、正確に生成できることを期待していませんでした。例えば、これは同じプロンプトをMinimaxで生成したものですが、これも正確に生成することはできませんでした。始めに余分な「sub」が追加されています。さらに、テキスト自体が煙で作られていません。どちらの場合も、私が指定したものを正確に生成することに失敗したと思います。
ただし、これらのジェネレーターを非常に難しいプロンプトでテストしているのは、その限界を示すためだということを覚えておいてください。普通の「話している男性」や「ビーチを歩いている女性」のようなものなら、両方のビデオジェネレーターが完璧に生成できるはずです。
次は、アニメを生成する能力をテストしてみましょう。プロンプトは「日本のアニメスタイル。シンプルな着物を着た少女が京都の街を歩いている」です。アニメの生成方法を知っているなら、これは比較的簡単に生成できるはずです。実現できるか見てみましょう。
ここに結果が出ました。これは本当にアニメとは言えません。むしろ3Dに近いです。そうですね、これは私が求めていたスタイルではありません。
繰り返しになりますが、これらのレビューの結論として、特定のビデオジェネレーターは特定のタスクに優れているということです。例えば、Hotshotは人物のリアルなポートレートの生成が非常に得意ですが、アニメに関してはHotshotを使わないでください。アニメさえ生成できていません。アニメに関しては、実際にはClingを使用するのが好みです。
これは同じプロンプトでClingを使って生成した例です。これは100%アニメのように見えます。欠点を指摘するのは難しいです。
次に、これらの商品CM風のビデオを生成できるか見てみましょう。これはeコマース企業などに役立つかもしれません。プロンプトは「金色のキャップと複雑な花の模様が刻まれた高級香水ボトル。柔らかい照明のグラデーション背景に置かれている。プロフェッショナルな商品CM」です。これもすでに非常に詳細なプロンプトなので、「プロンプトの強化」をオフにして生成をクリックします。
ここに結果が出ました。私が求めていた香水ボトルの外観とは正確には違いますが、プロンプトには従っています。金色のキャップと複雑な花の模様が刻まれた香水ボトルで、柔らかい照明のグラデーション背景に置かれています。悪くはありません。ただし、反射が少し変です。実生活ではこのように見えないと思います。これは目立つ欠点です。
これは同じプロンプトをMinimaxで生成したものです。これの方がずっとリアルに見え、プロンプトにもより忠実に従っています。これは確かに金色のキャップで、確かに花の模様が刻まれています。
そして、これはClingで生成したものです。これこそが私が求めていた香水ボトルの商品写真です。これは本当に良く見えます。
Hotshotに戻ると、これら2つのビデオジェネレーターに比べて劣っているのがわかります。私が求めていたものを本当に生成できていません。
最後のプロンプトです。手と指を生成する能力をテストしたいと思います。多くのビデオジェネレーターはこれをうまく生成できないことを知っています。プロンプトは「カフェで日記を書いている女性」です。ペンを持って日記に実際のテキストを書いている手を生成できるか見てみたいと思います。生成をクリックしましょう。
ここに結果が出ました。ペンを持って日記に書いている手を生成する能力を本当にテストしようとしましたが、それに失敗しているのがわかります。ここの始まりを見ると、彼女は両手で日記に書いているように見えます。これは奇妙です。さらに、各手に5本の指がありません。また、ペンを正しく持っていません。これは失敗です。これが本当にテストしようとしていた部分です。手を生成できるかどうかです。
しかし、日記を書いている女性のポートレートは完璧に生成しています。繰り返しになりますが、Hotshotは人間のポートレートビデオの生成が非常に得意です。
これでHotshotのレビューは終わりです。この分野では物事が非常に速く動いています。こんなに早く新しいビデオジェネレーターが登場するとは予想していませんでしたが、ここに新しい選択肢が登場しました。このビデオで示したように、Hotshotは人間のポートレートや上半身のビデオを生成するのに最適なジェネレーターです。このようなシーンを生成したい場合、100%Hotshotが使用するべきツールです。
しかし、多くの難しいプロンプトもテストしましたが、それらのほとんどを生成することはできませんでした。より激しい動きのあるシーンや動物の生成、ピクサースタイルのアニメーションの生成に関しては、Minimaxの方がずっと優れているようです。
そして、アニメや人が食べているビデオの生成に関しては、Clingが間違いなく最良の選択肢です。無料トライアルを望まず、財布の中身をすべて使い果たしたい場合は、Runway Gen 3も良い選択肢です。
少なくとも現時点では、ビデオ生成の分野には明確な勝者はいません。各ジェネレーターが特定のことに優れています。プロフェッショナルな品質の短編映画を様々なシーンを含めて生成したい場合、おそらくこれらのビデオジェネレーターのいくつかを一緒に使用する必要があるでしょう。
とにかく、これがHotshotについてのビデオの要約です。コメント欄で教えてください。Hotshotを使ってみて、どんな面白いものを生成しましたか?他にどんなことが得意だと思いますか?何が得意ではないと思いますか?そして、他のビデオジェネレーターと比べてどう思いますか?コメント欄で教えてください。
いつも通り、トップのAIニュースとツールを探して皆さんと共有しますので、このビデオを楽しんでいただけたなら、いいね、シェア、登録をお願いします。そして、次のコンテンツをお楽しみに。
また、AIの世界では毎週本当にたくさんのことが起こっているので、YouTubeチャンネルですべてをカバーすることは不可能です。AIで起こっていることすべてを本当に把握するために、私の無料週刊ニュースレターに登録することをお勧めします。リンクは説明欄にあります。
視聴ありがとうございました。次の動画でお会いしましょう。
コメント