
7,860 文字
私の大好きなAIビデオジェネレーターの1つであるHigh L Minimaxが、非常に便利でパワフルな機能をリリースしました。TTVディレクターと呼ばれる新しいモデルで、まるでその場面の監督やカメラマンのように、ビデオのカメラの動きをコントロールすることができます。このビデオでは、その使い方をお見せし、何ができて何ができないのかを把握していただけるよう、機能を検証していきたいと思います。
早速始めましょう。使い方はとても簡単です。無料でログインまたはサインアップして、ビデオタブでクリエイトをクリックするだけです。この新しいディレクターモデルは現在、このテキストトゥービデオタブの下にあり、ここで新しいディレクターモデルを選択することができます。
とても簡単に始められるので、今すぐ試してみましょう。「荒々しいフィールドメディックが、キャンプファイヤーの近くでキャンバスバッグのジッパーを開け、カメラは彼の暗い森への一瞬の視線を捉える」というプロンプトから始めてみましょう。
そしてここで、カメラの動きを選択することができます。ここにはたくさんの例があります。左回転は、基本的に左に回転するオービットショットのようなものです。右回転はその反対で、右に回転するオービットショットです。上向きチルトは、まさに上向きにチルトすることで、下向きチルトは下向きにチルトすることです。
そしてこれら2つは非常によく見かける動きです。左歩行は、人や物が左に移動する際にトラッキングするようなもので、右歩行は人や物が右に移動する際にトラッキングするものです。この例で見ることができます。
そして、ステージレフトは、広角からスタートして、左側の何かにパンしてズームインしていくようなものです。ステージライトはその反対で、やはり広角からスタートして、右側にパンしてズームインしていきます。そしてシーニックショットは、その名の通り、風景のBロールタイプの映像に使用します。
これらはいくつかのシネマティックショットですが、後ほどいくつかの例をお見せします。また、フリーセレクションのオプションもあります。これは、異なるショットの組み合わせを自由に選択できる機能です。
トラックは、カメラを左にスライドさせるような動きで、トラックライトはカメラを右にスライドさせる動きです。これはパンレフトとは異なることに注意してください。パンレフトを選択すると、カメラは同じ位置に留まったまま、カメラを左に向けるだけです。パンライトは右に向けるだけです。
そしてここでプッシュインは、ズームインのようなものですが、カメラ全体を内側に動かします。プルアウトはカメラ全体を外側に動かします。これはズームインやズームアウトとは少し異なります。ズームインは、カメラは静止したままレンズのズームを回転させてズームインするようなもので、ズームアウトはカメラレンズのズームを回転させてズームアウトします。
そしてここでチルトアップは、まさにカメラを上向きにチルトさせることで、チルトダウンはカメラを下向きにチルトさせることです。そしてここにペデスタルアップがあります。これはカメラを上に動かすもので、このカウボーイのシーンのように、映画の多くのシーンでよく見られるカメラの動きです。ペデスタルダウンはカメラを下に動かすものです。
そしてここにシェイクがあります。これは基本的にカメラの動きをより揺れるように設定するものです。トラッキングショットは、基本的に人が動き回る際にその人を追跡するもので、キャラクターはビデオの特定の位置に固定されたままになります。スタティックショットはカメラが全く動かないことを意味します。
これらが現在使用できるすべてのオプションです。このフリーセレクションオプションを選択した場合、1つのビデオ生成に最大3つまでこれらを組み合わせることができます。
では、今すぐ試してみましょう。このメディックのところでカメラを下向きにチルトさせ、彼が暗い森を見つめる際に彼の顔にズームインしてみましょう。まず、開始時にここをクリックしてカメラの動きを挿入し、チルトダウンを挿入します。ここでチルトダウンが挿入されているのが分かります。そして、ここで彼の顔にズームインを始めたいので、ズームインを選択します。
ご覧のように、この生成全体を通して2つの異なるカメラの動きを挿入しました。生成をクリックして、どうなるか見てみましょう。
これが結果です。確かに最初に下向きにチルトして、キャンプファイヤーの近くでキャンバスバッグのジッパーを開けるメディックを映し出し、その後、暗い森を見つめる彼の顔にズームインしています。これは完璧です。このツールがどれほど便利かお分かりいただけたと思います。これにより、シーンのカメラの動きを完全にコントロールすることができます。
比較のために、同じプロンプトを使用して、通常のテキストトゥービデオモデルも試してみましょう。チルトダウンとズームインのキーワードは残したままですが、このソムデルは実際にはディレクターモードほど上手くカメラの動きを捉えないと思います。生成をクリックして、どうなるか見てみましょう。
これが結果です。実際にこれも悪くはありませんが、本当にチルトダウンしているわけではなく、むしろ開始時に少し上向きにチルトしているのが分かります。まあ、彼の顔に少しズームインしているようには見えるので、その点は評価できますが、ディレクターモードと通常のHailuoモデルを比較すると、ディレクターモードの方がはるかにシネマティックで、特にカメラの動きに関してプロンプトにより忠実に従っていることが分かります。確かに下向きにチルトし、その後、森への彼の視線を捉えるためにズームインしています。
ちなみに、これが別の強力な競合であるCingとどう比較されるのか気になるかもしれません。Cingのテキストトゥービデオで何ができるのかもお見せしましょう。同じプロンプトをここに貼り付けます。
Cingはカメラの動きをコントロールするためのいくつかのオプションを提供していますが、これはこのカメラムーブメントセクションにあります。しかし、これは1.5モデルや最新の1.6モデルでは使用できず、最も古いCing 1.0でのみ使用可能です。これは最高の品質ではありません。ここでカメラの動きを選択すると、これらのオプションからしか選択できず、1つしか選択できません。チルトダウンしてから彼の顔にズームインすることはできません。
例えばズームを選択しても、フレームのどこにズームインするかを実際に選択することはできません。ここでズームインまたはズームアウトを選択できますが、常にフレームの中心にズームすることになり、これは私がズームインしたい場所ではないかもしれません。
これが1つのオプションです。もう1つのオプションはイメージトゥービデオで、ここでフレームを選択すると、初期フレームをアップロードすることができます。キャンプファイヤーの近くでキャンバスバッグのジッパーを開ける荒々しいフィールドメディックの画像を生成しました。これはイデオグラムを使用して生成し、ビデオの開始フレームとして使用するためにここにアップロードしました。
そして興味深いことに、ここでは1.0モデルでは使用できませんが、1.5では使用可能です。つまり、イメージトゥービデオを使用する場合、このカメラムーブメント機能はCling 1.5で機能しますが、やはり1つのシーンで複数のカメラの動きを組み合わせることはできません。
ズームを選択して、最大までズームインしてみましょう。理想的には彼の顔にズームインしたいのですが、これを動かすことはできないようです。このまま生成してみましょう。
これがClingから得られた結果です。確かにこの人物にズームインしていますが、Hailuoの新しいディレクターモデルと比較すると、これは全く柔軟性に欠けます。
これはCling 1.5でしたが、もう1つ試してみたいのは、単純なテキストトゥービデオ機能を使用することです。Cingの最新モデル1.6 Proを使用して、チルトダウンやズームインなどのキーワードを理解できるかどうか見てみましょう。生成をクリックして、どうなるか見てみましょう。
これがClingから得られた結果です。チルトダウンもしていませんし、彼の顔にズームインもしていません。プロンプトで指定したカメラの動きを無視しているようです。
比較のために、3つのビデオを並べてみましょう。左上がHailuoの新しいディレクターモデル、右がHailuoの通常のテキストトゥービデオモデル、そして下がCingの最新のテキストトゥービデオモデルです。Hailuoディレクターが、プロンプトで指定したカメラの動きを取り入れて理解できる唯一のモデルであることが分かります。確かに下向きにチルトし、その後彼の顔にズームインしています。本当に印象的です。
次に、Hailuoに戻って、他のクールな例をお見せしましょう。ここでプロンプトは「ロングコートを着た探偵が、薄暗い街灯の下、雨に濡れた通りを歩いている。カメラは、玄関口から見つめる誰かのかすかなシルエットを映し出す」です。
この男が通りを歩いているところをトラッキングし、その後、カメラを右に回転させて、玄関口から見つめているこの人物を映し出したいと思います。まず、この新しいディレクターモデルを再度選択し、開始時にここをクリックして、トラッキングショットを選択します。これで、カメラの動きはこの男が歩くのを追跡します。そして、ここでシルエットを映し出すために右にパンしたいので、このカメラアイコンを選択し、パンライトを選択しましょう。
これでOKです。生成をクリックして、どうなるか見てみましょう。
これが結果です。確かにこの男が歩いてきて、なんと本当に玄関口から誰かが見つめています。夜に録画しているので少し驚かされましたが、ご覧の通り、確かにトラッキングショットになっています。この探偵が歩き回るのを追跡し、その後右にパンして、玄関口から見つめる別の人物を映し出しています。この新しいディレクターモデルは、プロンプトに本当によく従います。
比較のために、同じプロンプトをHailuoの通常のテキストトゥービデオモデルでも使用し、トラッキングショットとパンライトのキーワードも含めましたが、ご覧の通り、これらのカメラの動きのキーワードを理解することができませんでした。この探偵のトラッキングショットは生成されましたが、その後に右にパンして誰かを映し出すことはありませんでした。
次のプロンプトは「ウィル・スミスがディナーテーブルでスパゲッティを食べており、隣でゴードン・ラムゼイがサラダを食べている」です。Hailuoの素晴らしい点は、他のビデオジェネレーターではできない、テキストトゥービデオだけで既存のセレブリティやキャラクターを生成できることです。
では、このシーンのカメラの動きをコントロールしてみましょう。開始時にズームアウトし、ペデスタルアップもさせましょう。食べ物のズームインしたフレームから始まり、その後ズームアウトし、カメラを上に動かしてウィル・スミスを映し出すことを期待しています。そして、ここでカメラを右にパンして、隣でサラダを食べているゴードン・ラムゼイを映し出したいと思います。生成をクリックして、どうなるか見てみましょう。
これが結果です。本当に素晴らしいですね。確かに食べ物から始まり、ズームアウトしてペデスタルアップで少しウィル・スミスを映し出し、その後右にパンしてサラダを食べているゴードン・ラムゼイを映し出しています。これは本当にウィル・スミスとゴードン・ラムゼイに見えます。とても素晴らしいですね。
ウィル・スミスはそのパスタの皿にうんざりしているように見えます。私たちの多くがウィル・スミスにたくさんのスパゲッティを食べさせてきたので、彼は今では本当にうんざりしているに違いありません。
比較のために、同じプロンプトをHailuoの通常のテキストトゥービデオモデルで使用してみました。まだウィル・スミスとゴードン・ラムゼイを一緒に食事している様子を生成することはできますが、やはりプロンプトで指定したカメラの動きは取り入れていません。これは、この新しいディレクターモデルがいかにパワフルであるかを示しています。
次は「鐘が遠くで鳴り響く中、雲までそびえ立つ大聖堂の尖塔が姿を現す」を試してみましょう。そして、これらのフリーセレクションオプションを選ぶ代わりに、シネマティックショットを試してみましょう。上向きチルトを試してみます。ここでカメラの動きの組み合わせが挿入されるのが分かります。生成をクリックして、どうなるか見てみましょう。
これが結果です。確かに上向きチルトになっています。雲までそびえ立つ大聖堂の尖塔を映し出すためにプッシュインしてペデスタルアップしています。比較のために、同じプロンプトをHailuoの通常のテキストトゥービデオモデルで使用してみました。ご覧の通り、またもやプロンプトに全く従っていません。本当に上向きにチルトしたりプッシュインしたりしていません。
このディレクターモデルは製品のコマーシャルを作成するのに最適です。例えば、白い未来的な車の短いクリップを作成してみましょう。ここで左回転を選択すると、車の周りを左側に軌道を描くように回るはずです。これを選択して生成をクリックします。
現在これはテキストトゥービデオなので、実際に車の外観をコントロールすることはできないことに注意してください。最終的にはこのディレクターモデルがイメージトゥービデオにも実装され、既存の車の画像をアップロードしてそこからコマーシャルを生成できるようになることを期待しています。
とにかく、これが結果です。非常に美しくデザインされた車が見えます。実際にとてもスタイリッシュで、確かにカメラはこの車の周りを回っています。このようなものが車のコマーシャルを作成するのに最適であることがお分かりいただけると思います。そして再び、同じプロンプトをHailuoの通常のモデルで使用してみましたが、ご覧の通り、車の周りを本当に回転しているわけではありません。カメラの動きをコントロールしたい場合、このディレクターツールは本当にパワフルです。
次は別のクールな例です。プロンプトは「大聖堂の残骸の中で、カメラは戦士たちと神経質な市民たちの間を通り過ぎ、リーダーは厳しい表情を見せる」です。まず開始時にカメラを右にパンして、これらの戦士たちと市民たちを全て映し出し、その後プッシュインしてリーダーの表情を映し出したいと思います。生成をクリックして、どうなるか見てみましょう。
これが結果です。美しいですね。確かに最初に右にパンし、その後プッシュインしてリーダーの厳しい表情を映し出しています。すべてが本当に詳細に描かれていることに注目してください。再び比較のために、右側は同じプロンプトを使用したHailuoの通常のモデルですが、ご覧の通り、カメラの動きを無視しています。全く右にパンしていませんし、リーダーの表情を映し出すためにプッシュインもしていません。このディレクターモデルを使用することで、シーンのカメラの動きをより多くコントロールできることがお分かりいただけると思います。
このプロンプトも試してみましょう。「悪役が暗い色調の家の屋上に立っている。カメラはペデスタルアップして、夜の壮大な街のスカイラインを捉える。街は光で輝いており、遠くの空には大きな淡い赤い月がある」そしてここでシネマティックショットを選択し、街のスカイラインを映し出すように上向きにチルトするので、上向きチルトを選択します。生成をクリックして、どうなるか見てみましょう。
これが結果です。なんてクールでしょう。これはスーパーヒーロー映画の典型的なシーンのようです。参考として、右側は通常のHailuoテキストトゥービデオモデルを使用していますが、ご覧の通り、本当にプッシュインしたりペデスタルアップしたりしているわけではありません。まだ街のスカイラインと月は映し出していますが、動きはずっと遅く、左側の生成に比べてはるかにシネマティックさに欠けます。
最後に、シェイクオプションもテストしてみたいと思います。このプロンプトを入力してみましょう。「揺れる一人称カメラを通して、視聴者は脈動するアンダーグラウンドクラブを後ろ向きによろめきながら進む。そのネオンライトは不規則に点滅している」そして、ここでこのシェイクオプションを選択して、どれだけ良いか見てみましょう。再び生成をクリックして、どうなるか見てみましょう。
これが結果です。確かにとても揺れています。これは脈動するアンダーグラウンドクラブでネオンライトが点滅しています。シーンがとてもノイジーで、たくさんの人々と動きがあり、カメラも本当に揺れていますが、すべてをかなり一貫して生成できています。多少の歪みはありますが、遠くから見るとそれに気付くのは本当に難しいです。
再び参考として、同じプロンプトをHailuoの通常のテキストトゥービデオモデルで使用してみました。カメラはまだかなり揺れていますが、左側の映像ほどは揺れていないと思います。しかし、コメントで皆さんの意見を聞かせてください。
もし私のチャンネルをフォローしているなら、私が無料のものを大好きだということをご存知でしょう。有料プランを持っていなくても、これはある程度無料で使用できます。無料でサインアップすると、最初に1,000クレジットが付与され、さらに毎日100ボーナスクレジットが付与されます。そして1つのビデオに30クレジットかかるので、無料プランでも1日に3つのビデオを無料で生成することができます。
とにかく、これで新しいディレクターモデルのレビューは以上です。何ができて何ができないのかをよく理解していただけたと思います。先ほど言ったように、これは現在テキストトゥービデオでのみ利用可能ですが、最終的にはこの機能がイメージトゥービデオにも追加されることを期待しています。これら2つの機能を組み合わせることで、さらにパワフルになると思います。
コメントで、これについて皆さんの意見を聞かせてください。ディレクターモードで遊んでみた方は、他にどんなクールで面白い生成ができたのかも教えてください。いつも通り、私は最新のAIニュースやツールを皆さんと共有するために常にチェックしています。このビデオを楽しんでいただけたなら、いいね、シェア、購読をお忘れなく、そして今後のコンテンツもお楽しみに。
また、AIの世界では毎週本当にたくさんのことが起こっているので、私のYouTubeチャンネルですべてをカバーすることは不可能です。AIで起こっていることすべてを本当に把握し続けるために、私の無料ウィークリーニュースレターの購読をお忘れなく。リンクは下の説明欄にあります。視聴ありがとうございました。また次回お会いしましょう。
コメント