
7,973 文字

おっちゃん、AIビデオにめっちゃすごい進化があってんで。もうすぐ誰でもコンピューターだけで、ハリウッド級の映画を作れるようになりそうやねん。俳優雇う必要もないし、撮影も特殊効果もいらん。全部プロンプトで出来るようになるんや。
せやから今日はClling 1.5をガチでテストしてみるわ。できることと、できひんことを見せたるし、新しい動きブラシ機能の使い方も教えたるさかい。
まず、Cllingにアクセスするには、clling.ai.comに行くだけや。説明欄にもリンク貼っとくわ。サイトに入ったら、「AIビデオ」をクリックしてビデオ作成を始められるで。1.5を選んで使うのを忘れんといてな。
最初のプロンプトは「悲しくて困っている女性。目は赤くて涙ぐんでいて、表情が悲しみと心の痛みを表している」にしてみよか。
ちなみに、前の動画でもCllingをテストしてるから、まだ見てへん人はチェックしてみてな。そこでは、シェフになろうとしてるポメラニアンとか、アニメ、空撮映像、テキスト生成、アクション満載のシーンなんかをテストしたんやけど、今日はもっと難しいプロンプトで限界に挑戦して、できることとできひんことを見せたるで。
Cllingを初めて使う人のために、設定を簡単に説明したるわ。プロンプトの下には創造性スライダーがあって、左に寄せるとより創造的になるけど、プロンプトから外れるリスクもあるんや。右に寄せるとプロンプトに忠実になるけど、創造性は下がる。今回のテストでは、デフォルトの0.5にしとくわ。
モードは標準モードとプロフェッショナルモードがあるんやけど、プロフェッショナルモードの方が細かいところまで表現できて、品質も上がるんや。Clling 1.5はプロフェッショナルモードしか使えへんねん。
長さは5秒か10秒を選べるし、アスペクト比もいろいろ選べるけど、今回はデフォルトの16:9にしとくわ。
ネガティブプロンプトってのもあって、ビデオに入れたくないものを指定できるんや。今回は「アニメーション、漫画、抽象的、低品質、変形、歪み」を入れとくわ。
準備ができたら「生成」をクリックすると、Clling 1.5のプロフェッショナルモードで35クレジット使うことになるで。
ほんで、Cllingでビデオ生成にめっちゃ時間かかるって言う人おるけど、それは無料プランだからや。有料プランなら、標準プランでもファストトラック生成ができて、3分くらいで生成できるんや。
さて、悲しい女性のビデオができたで。見てみよか。
うわぁ、すごいな!表情の迫力がすごいわ。本当に悲しくて困ってる感じが出てるし、フェイクやAIっぽくないねん。本物の人間が激しい心の痛みを感じてるように見えるわ。
ちなみに、CllingのライバルのMinimaxでも試してみるで。CllingとMinimaxは今のところビデオ生成のトップを争ってる感じやな。両方に長所短所があるから、どっちがええかは自分で決めてな。
Minimaxは今のところ無料で使えるんや。制限もなさそうやけど、すごいサーバー代かかってそうやな。ただし、プロンプトしか入力できへんし、ネガティブプロンプトも創造性スライダーもアスペクト比や動画の長さも変えられへんのが難点や。画像からビデオへの変換や動きブラシ機能もないし。
ほんじゃ、同じプロンプトでMinimaxで生成してみるわ。
うわぁ、これもすごいな!両方のツールに感心したわ。感情の表現がリアルすぎて、下のロゴを消したら映画のワンシーンみたいや。AIで作ったとは思えへんくらいリアルやで。
2つのビデオを並べて見てみ。どっちがええと思う?コメントで教えてな。
最初に言うたみたいに、もうすぐ誰でもコンピューターだけでハリウッド級の映画が作れるようになりそうやで。プロンプトだけで俳優を作って、表情をコントロールできるんやから。
さて、女性が泣いてるシーンはシンプルで、動きも要素も少ないから、もっと難しいのを試してみよか。
次のプロンプトは「戦争で荒廃した街を走る兵士の一人称視点。ライフルを持って、カメラが素早く動き、近くで爆発が起こって瓦礫が舞い上がる。兵士が身を隠して敵に向かって発砲する様子を、視点が揺れながら映す」や。
これも、すごいできやな。数ヶ月前のビデオ生成ツールと比べたらめっちゃ進化してる。シーンの要素がたくさんあるのに、廃墟とか車とか爆発とか、ほとんどのものが一貫性を保ってるし、プロンプトにもよく従ってる。視点が揺れて、兵士が身を隠して敵に向かって発砲する様子もちゃんと表現できてるわ。めっちゃ感心したで。
Minimaxでも同じプロンプトで試してみたけど、これもなかなかええ出来や。背景の爆発もすごいし、アクションシーンとしてはかなりの高レベルやけど、兵士の動きが自然じゃないんよな。最後の方で急に左に飛んでるし。背景の瓦礫や岩の形も時間とともに変わっていくから、時間的な一貫性はCllingほどないな。それでも、すごい生成やと思うで。
2つの生成結果を並べて見てみ。どっちがええと思う?コメントで教えてな。今回は品質と一貫性、明瞭さの面でCllingの方が上やと思うわ。
さて、今回の動画では本当に限界に挑戦したいから、もっと難しいプロンプトを試してみるで。
次のプロンプトは「ホラー映画。地下鉄の駅でゾンビの群れが人々を襲う。手持ちカメラ風」や。他の設定は同じで、ネガティブプロンプトも前と同じにしてるで。
Cllingの結果を見てみよか。確かにゾンビの群れが地下鉄の駅で人々を襲ってるな。ゾンビの一部に変形があるけど、これだけ難しいプロンプトやし、要素もたくさんあるから、よくここまでできたと思うで。
Minimaxの結果も見てみよか。これもゾンビの群れが地下鉄の駅で人々を襲ってる感じやけど、人々の動きがすごくスローで、逃げてる感じがせえへんな。プロンプトで手持ちカメラ風って指定したのに、カメラも動いてへんし。人々とゾンビの顔がずっと形を変えていくのも気になるな。でも、これだけ難しいプロンプトやから、多少の欠点があるのは仕方ないかもな。
2つの動画を並べて見比べてみ。どっちがええと思う?
次のプロンプトは「戦争で荒廃した環境に立つ少年。表情は恐怖と絶望を表している。背景には破壊、火災、瓦礫が広がっている」や。設定とネガティブプロンプトは前と同じにしてるで。
Cllingの結果を見てみよか。うわぁ、これめっちゃリアルやで!ハリウッド映画のワンシーンみたいや。下のウォーターマークがなかったら、AIで作ったって気づかへん人も多いと思うわ。プロンプトの内容も完璧に表現できてるし、少年の立ち姿、恐怖と絶望の表情、戦争で荒廃した背景、すべてが完璧や。
Minimaxの結果も見てみよか。これもかなりええ出来や。少年の表情に恐怖と絶望が表れてるし、背景も破壊、火災、瓦礫で埋め尽くされてる。これもハリウッド映画のワンシーンみたいやな。
2つの動画を並べて見比べてみ。プロンプトの内容を完璧に表現できてるし、高い動きや要素が少ないシーンやったら、CllingもMinimaxも本当にええ動画を生成できるんやな。
次のプロンプトは、前回の動画でも試したウィル・スミスがスパゲッティを食べるシーンをもっと難しくしてみたんや。「ウィル・スミスと彼のクローン2人が巨大なスパゲッティの山を一緒に食べている。背景で爆発が起こっている」ってプロンプトにしてみた。設定とネガティブプロンプトは前と同じや。
Cllingの結果を見てみよか。うーん、これは想像してたウィル・スミスとはちょっと違うな。でも、どこかにこんな顔のウィル・スミスがおるかもしれへんで。3人のクローンがほぼ同じ顔してるし、巨大なスパゲッティの山を食べてるのはプロンプト通りやな。テーブルには他のおいしそうな料理もあって、見てたらお腹すいてきたわ。背景には確かに爆発もあるし。Cllingは食べるシーンがリアルなことで有名やけど、この「ウィル・スミス」たちも本当にリアルに食べて噛んでるな。全体的にはなかなかの出来やと思うで。
Minimaxの結果も見てみよか。おっ、これは確かに本物のウィル・スミスに似てるな。3人おるし、巨大なスパゲッティの山も食べてる。同じ山から食べてほしかったけど、それはプロンプトでもっと明確に指定せなあかんかったな。でも、食べ方がちょっと変やな。ハムスターみたいにかじってる感じやし、よくわからん。背景の爆発も、爆発っていうより花火みたいやけど、まぁええか。全体的にはこれもなかなかの出来や。
ちなみに、Minimaxは今のところ、ウィル・スミスやドナルド・トランプ、オプラ、ゴードン・ラムゼイなどの有名人を生成できる唯一のビデオ生成ツールなんや。Cllingを含む他のツールは、ディープフェイクを防ぐためか、有名人は生成できへんのや。
2つの動画を並べて見比べてみ。実際の映像品質と人が食べる様子のリアルさでいうと、Cllingの方が上やと思うわ。でも、Cllingは有名人を生成できへんから、テキストからビデオを作る場合は、Minimaxが唯一ウィル・スミスを生成できるツールやな。
でも、ちょっとしたコツがあるんや。FluxやStable Diffusion、Midjourney使って、まず画像を生成してから、それをCllingの画像からビデオ機能で使うこともできるんや。ほな、試してみよか。
Fluxで3人のウィル・スミスが巨大なスパゲッティの山を食べてる画像を生成して、それをCllingの画像からビデオタブにドラッグ&ドロップしたんや。プロンプトは同じにして、生成ボタンを押してみた。
結果を見てみよか。うーん、まぁまぁやな。左のウィル・スミスがちょっとスペイン人っぽくなってもうたけど、開始フレームに1枚の写真を使うだけで、写真でウィル・スミスを正確に生成できれば、Cllingでも巨大なスパゲッティの山を食べるウィル・スミスのビデオは作れるってことやな。
さて、次のプロンプトはもっとハイアクションなシーンで限界に挑戦してみるで。「嵐の海から巨大な海獣が現れる。その巨大な触手が沈みゆく船に絡みついている」ってプロンプトや。設定とネガティブプロンプトは前と同じにしてるで。
Cllingの結果を見てみよか。確かに巨大な海獣が沈みゆく船に触手を絡ませてるな。でも、触手の模様がちょっと時間とともに変わってしもてるし、一貫性がちょっと足りんかったな。それに、これ海獣っていうより、触手付きのゴジラみたいやな。
ちなみに、シーンの構図やキャラクター、要素の配置をもっと細かくコントロールしたいなら、画像からビデオの方がええかもしれへんで。Fluxみたいな画像生成ツールで船を破壊する海獣の画像を作って、それをビデオの最初のフレームとして使うとええかもな。
Minimaxの結果も見てみよか。これは俺がイメージしてた海獣に近いな。でも、やっぱり触手に一貫性がないし、船に絡みついて破壊してるわけでもないな。船も沈んでる感じがせえへん。プロンプトにあんまり従えてへんけど、まぁこれだけ難しいプロンプトやし、完璧を求めるのは無理やろな。これはツールの限界を示すためのテストやからな。
2つの生成結果を並べて見てみ。品質とアクションの面では、今回はCllingの方がちょっとマシかな。
次のプロンプトは「巨大な悪のパンダが街を横切り、建物を破壊している。恐怖に駆られた人々があらゆる方向に逃げ惑う。ハイアクション」や。設定とネガティブプロンプトは前と同じにしてるで。
Cllingの結果を見てみよか。うわぁ、これめっちゃええやん!全体的に一貫性があって、品質も高いな。パンダの動きがすごく自然やし、建物もくっきり見えるし、瓦礫や前景で逃げ惑う人々もええ感じや。本当にええ出来や。全てが一貫性を保ってて、悪のパンダが街を破壊してるシーンがよく表現できてるわ。めっちゃ感心したで。
Minimaxの結果も見てみよか。これはカンフー・パンダからパンダをコピーしてきたみたいやな。悪のパンダっていうより、混乱してるパンダって感じやけど。確かに街を破壊してて、人々も逃げ惑ってるのはええんやけど、ビデオの途中でパンダの腕が突然消えて、別のところに現れたりしてるのが気になるな。それに、逃げてる人々も形が変わったり、消えたり、突然現れたりしてる。これはちょっと目立つ欠点やな。
2つの生成結果を並べて見比べてみ。品質、アクション、一貫性の面では、今回もCllingの方が勝ってるな。
次は、違うビデオスタイルをテストしてみたいんや。ディズニー・ピクサーのアニメーションスタイルを生成できるかどうか試してみるで。プロンプトは「美しくてキラキラした白いドレスを着たお姫様が、赤く光る目をした巨大なドラゴンから逃げている」や。これはClling 1.0でテストしたプロンプトで、あんまりええ結果が出なかったんや。1.5でどうなるか見てみよか。ネガティブプロンプトから「アニメーション」と「漫画」を外して、他のキーワードだけにしてみた。
Cllingの結果を見てみよか。うーん、他のビデオ生成ツールでも同じような問題があったんやけど、プロンプトでお姫様がドラゴンから逃げるって指定したのに、いつもドラゴンに向かって走ってしまうんやな。もう、お姫様、殺されてまうで!それに、これはディズニー・ピクサースタイルとは言えへんな。
Minimaxの結果も見てみよか。ディズニー・ピクサースタイルに関しては、Minimaxの方がええ仕事してるな。お姫様はディズニーのお姫様らしいし、キラキラした白いドレスも着てる。赤く光る目をした巨大なドラゴンもおるし。でも、お姫様はドラゴンから逃げてるんじゃなくて、ゆっくり歩いてるだけやな。この姫様も食べられそうやわ。ディズニーのお姫様ってあんまり賢くないんかな。いつもトラブルに巻き込まれて、王子様に助けてもらわなあかんし。
2つの生成結果を並べて見比べてみ。ディズニー・ピクサースタイルのビデオに関しては、Minimaxの方が点数高いな。
次はアニメが生成できるかどうか試してみるで。プロンプトは「日本のアニメスタイル。着物を着た少女が悪魔と戦う。壮大な戦い」や。前にCllingでアニメを生成できるって示したんやけど、あれは着物を着た少女が京都の街を歩いてるだけのシンプルなシーンやった。今回はもっと難しいのを試してみたいんや。歩くんじゃなくて、戦うシーンを生成してみるんや。ネガティブプロンプトから「アニメーション」と「漫画」を外して、他はそのままにしてみた。
Cllingの結果を見てみよか。うーん、これは全然アニメちゃうな。Clling 1.0でアニメを生成できたのに、1.5ではできてへんのが不思議やな。3Dスタイルのビデオになってしもてるし、少女も悪魔と戦ってるんじゃなくて、カメラの前でポーズ取ってるみたいやな。これはちょっと失敗やな。
Clling 1.0でアニメを生成できたって知ってるから、もう一回試してみたいんや。ネガティブプロンプトが邪魔してるかもしれへんから、全部消して、もう一回生成してみるで。
結果を見てみよか。うーん、まだアニメスタイルちゃうな。これは3Dビデオゲームのシーンみたいやな。今度は戦ってる感じはあるけど、ハイアクションの壮大な戦いっていうより、RPGゲームみたいに順番に技を出し合ってるだけやな。
Minimaxで同じプロンプトを試してみたけど、これもアニメちゃうな。3D日本風ビデオゲームのシーンみたいや。少女と悪魔を戦わせようとしてるけど、戦いって感じやなくて、ダンスしてるみたいやな。
2つの生成結果を並べて見比べてみ。どっちもハイアクションのアニメ戦闘シーンは生成できてへんみたいやな。これは両方のツールの限界やな。
さて、CllingとMinimaxの比較はこれくらいにして、画像からビデオへの変換と動きブラシ機能も見せたるで。
動きブラシを使うには、まず画像をアップロードせなあかんのや。Fluxで生成した女性の画像をアップロードしてみるわ。プロンプトはオプションやけど、「夜の海辺にいる女性」って入れてみるで。
注意してほしいんやけど、動きブラシは1.5では使えへんのや。上の方でClling 1.0を選ばんとアカンで。
ほんじゃ、動きを描いてみよか。女性を動かしたいんやけど、体全体を塗るのは時間かかるから、自動セグメンテーションをオンにしてみるわ。こうすると、女性やドレス、空、建物なんかにカーソルを合わせると、自動的にオブジェクトを選んでくれんねん。
女性全体を選んだら、次は軌跡を描くで。トラック1をクリックして、女性の動きを描いてみるわ。ちょっとまっすぐ歩かせて、右に曲がらせてみよか。他のオブジェクトも選んで動かすこともできるけど、今回は女性だけにしとこか。
確認をクリックして、生成ボタンを押すだけや。
結果を見てみよか。うーん、体を回転させて右に歩いてるんじゃなくて、カメラが動いて女性が右に浮いてるみたいになってもうたな。もっと調整できると思うけど、これは最初の例やからな。
もう一つ例を見せたるわ。今度はゴジラが街を破壊してる画像を使うで。これもFluxで生成したんや。プロンプトは空欄にしとこか。
今回はゴジラと前景の人物の両方の動きを描いてみるで。ゴジラを手動で塗るのは時間かかるから、自動セグメンテーションをオンにして、ゴジラ全体を選んでみるわ。建物も選ばれてしまうから、オフにして、残りの部分を手動で塗ってみるで。
ゴジラを左に動かして、前景の人物を別の要素として選んで、右に動かしてみるわ。
確認をクリックして、生成ボタンを押すで。
結果を見てみよか。ゴジラは左に動いてるけど、人物は歩いてへんな。カメラが動いて、人物が右にパンしてるみたいになってもうた。動きブラシツールはまだ完璧やないな。プロンプトでもっと詳しく指定したら、人物が実際に右に歩くようにできるかもしれへん。それにしても、ゴジラの口でかすぎへん?あくびしてんのか、吠えてんのか、よくわからんわ。
まぁ、これが動きブラシの使い方や。
料金について簡単に説明しとくで。Clling 1.5を使うには有料プランが必要なんや。1.5はプロフェッショナルモードしかサポートしてへんからな。でも、めっちゃ安いで。最初の月は3.88ドル、次の月から8.80ドルや。いつでもキャンセルできるし。
俺、めっちゃケチなんや。普段の昼飯はコストコの試食で済ませるくらいやけど、月8ドルでハリウッド級の品質のビデオが作れるんやったら、喜んで払うわ。
これでClling 1.5と新しい動きブラシ機能のレビューは終わりや。難しいプロンプトを使って、一番近いライバルのMinimaxと比較してみた。
このレビューを楽しんでもらえたらええな。どっちが好きか、Cllingで他にどんなすごいもんや変なもん作れたか、コメントで教えてな。
いつも通り、最新のAIニュースやツールをチェックして、みんなに教えたるで。この動画が気に入ったら、いいね、シェア、チャンネル登録してな。次の動画も楽しみにしててな。
AIの世界では毎週めっちゃたくさんのことが起こってて、YouTubeチャンネルだけじゃ全部カバーできへんのや。最新情報を知りたかったら、無料の週刊ニュースレターを購読してな。リンクは説明欄に貼っとくで。
見てくれてありがとう。次の動画でまた会おな!
コメント