
4,939 文字
Soraがついにリリースされました。間違いなくこれは、全てのAIビデオジェネレーターの中で最もドラマチックなものです。まさに独自のストーリー展開があったわけです。最初は全ての救世主として紹介され、その後、メインストリームでの悲惨なPRで失墜し、そして今日に至っては、私たち全員が期待していたヒーローになるかもしれないし、あるいは最初から恐れていた悪役になるかもしれません。詳しく見ていきましょう。
ついにベールが剥がされ、そうです、今日からsora.comにアクセスして生成を始めることができます。まあ、実際にはしばらく待つことになりますが。
まず、これは数週間前に耳にしたSoraターボモデルのようです。これは最適化された合理的なバージョンのモデルで、1080Pまでの解像度と20秒までの動画を生成できます。以前約束されていた1分には達していませんが、それでも20秒はかなりの長さだと思います。また、生成を簡単に延長できそうな要素もいくつかあります。
Soraのウェブサイト自体は、Midjourney のウェブサイトによく似ています。特に、生成された作品が無限にスクロールされるフィードの部分などですが、任意の生成作品をクリックしてプロンプトを確認できる点は評価できます。
ちょっと話が飛びますが、最初の生成がちょうど完了しました。約20分かかりましたね。いつものチャンネルのお決まりの「青いビジネススーツを着た男性が混雑した都市の歩道を歩く」というプロンプトを使用しました。うーん、なかなか良い出来栄えですね。ネクタイが上着の外に出たり中に入ったりと、一貫性に欠ける部分はありますが、実際にはクールな手品のように見えます。その小さな不整合を除けば、全体的に良い出来です。指も1、2、3、4、5本とちゃんとあります。カメラアングル自体もかなりクールで、そのローアングルのダッチアングルは気に入りました。
画像から動画への変換に関して、おそらく人気が出ないであろう点に触れますが、最初に人物を含む画像を生成しようとしたところ、このメッセージが表示されました。つまり、Proプランでない限り、リアルな人物を生成することはできないということです。結局、皆さんのために私がProプランに加入することにしました。ですので、もしよろしければ「いいね」と「チャンネル登録」をお願いします。その費用を相殺するために、ユーチューブおじさんからちょっと余分にいただく必要がありそうです。
とにかく、最近ショート動画で使用したこの画像を使ってみました。トライアドのギャングが逃げ出すというものですが、画像から動画への変換で、かなり興味深い結果が得られました。特にフルモノクロにした場合は予想外でした。最初の入力から登場人物が完全に変わってしまいました。2回実行してみましたが、こちらが2回目のバージョンです。クリップの終わり頃に後ろ向きに走るシーンがあり、まるでFall Out Boyのミュージックビデオのアウトテイクのようです。
全体的に、少なくとも今のところ、画像の参照はMidjourneyの画像参照と同じような仕組みのようです。画像を提供すると、その画像からインスピレーションを得るような感じで、必ずしも最初のフレームとして直接使用されるわけではありません。他のテストも実行中なので、結果が出次第確認してみましょう。
ここで非常に興味深い機能がいくつかあります。その一つが、動画のストーリーボードレイアウトです。これは本当にクールです。ここでAndy Wangの動画を見てみましょう。Andy、この動画を提供してくれてありがとう。ストーリーを表示すると、プロンプトのタイムラインレイアウトが表示され、Andyの最初のプロンプトから始まり、それが最初の画像生成となり、その後、中間点あたりで少女がゆっくりと手を上げる様子が動画に反映されています。
この動画をリミックスして何かを追加することもできるようです。画像プロンプトを入れることもできます。これは他のビデオジェネレーターでは見られなかった、かなり興味深いレベルのコントロールです。
ブレンド機能も非常に興味深いものです。生成時間を短縮するため、Samによる神秘的な炎のコントロールの生成を使用します。この機能を紹介するために、ブレンドをクリックし、Minxで生成したこの動画をブレンドしてみましょう。ここでは、トランジション、ミックス、サンプル、カスタムなどの興味深いオプションがあります。これは確実に多くの実験が必要になりそうです。少し試してみて、どうなるか見てみましょう。
リミックスは、砂漠を歩き回るウーリーマンモスをロボットのウーリーマンモスに変える機能として紹介されています。試しに、雪山の風景を歩くバイキングを、サイバーパンクの街を歩くサイバーパンクなバイキングに変えてみましょう。キャラクターがどう変化するか、そして背景がどう変化するか興味深いところです。時間の関係で480pに設定し、強めのリミックスで実行してみましょう。
青いビジネススーツの男性の生成に戻ると、これは今のところ実際に生成できた数少ないものの一つですが、リカット機能に非常に興味深い特徴があります。最初に指摘したネクタイの問題について、タイムラインを不整合が起きる時点まで進めたり、逆に戻したりすることで、その問題を解決できる可能性があります。
画像から動画への変換に関して興味深い点ですが、テストの一つが完了しました。Midjourneyで生成したこの画像から始めて、「男が歩いてカメラに向かってくる間、後ろの人々が身を隠す」というプロンプトでSoraに通しました。最初の画像は最初のフレームとして使用されませんでしたが、Soraはシーンのコンテキストをほぼ理解しています。指示通りに後ろの人々が身を隠すことはありませんでしたが、代わりに彼の隣に集まってきました。
途中で少し変なカットがありますが、キャラクターの一貫性という点では、確かに同じ人物です。一方のショットでは少しがっしりしていて、次のショットではそうでもないように見えます。いや、よく見るとほぼ同じ体格かもしれません。
同じ画像での別のバリエーションがこちらです。彼は大体一貫していますが、ランダムなビジネスマンや、彼の復讐の旅に加わるオーケストラの二人組については何が起きているのかわかりません。でも、まあいいでしょう。
興味深いことに、チャンネルのマスコットの一人、海賊の衣装を着たDaniela Vanoを使用した場合、キャラクターはほぼ一貫しており、同じフレームも維持されています。リアルな人物の場合は入力画像が変更されたりスクランブルされたりするかもしれませんが、アニメ調のキャラクターの場合はそうならない傾向があるようです。さらなるテストが必要ですね。
Marques Brownleeのレビューで示されたように、Soraは直接的な画像から動画への変換が可能です。彼自身の画像を提供し、Soraがそれをアニメーション化しました。ただし、物理法則が全て間違っていました。まあ、Marquesがフリスビーフットボールを本当にそんなに下手だということでもない限りは。
カスタムブレンド動画が完成しました。この動画とこの動画を組み合わせてブレンドしたものです。結果はこのようになりました。興味深いですね。まだそのツールの使い方を完全には理解していないので、これはランダムなパラメータでの結果です。右側のバージョンは左側のバージョンよりも興味深く感じます。両方とも面白いですが、クリエイティブな可能性は確実にあります。
青いビジネススーツの男性の編集は少し変な感じになりました。最初のフレームで「青いビジネススーツの男性」とプロンプトを入れたことで、文字通り青いビジネススーツの男性が表示され、その後元の動画に切り替わりましたが、そのつなぎ目はかなりシームレスでした。その部分は非常に印象的です。
未来からの編集者Timからの追記ですが、もう一度実行してみたところ、このような結果になりました。明らかに前回よりも良い出来栄えです。
一方、元々雪山を歩くバイキングだったこの動画を、サイバーパンクな街のサイバーパンクなバイキングにリミックスした結果がこちらです。確かに同じ動画ではありませんが、全体的なアイデアは踏襲されています。
もう一つの興味深い出力がこちらです。これも画像から動画への変換で、Recraftで生成した雪のサイバーパンクな路地を歩く白髪のサイバーパンクな女性の画像です。キャラクターは同じポーズで完全に一致しています。彼女が通り過去ぎる際の顔の照明は本当に素晴らしいです。最初の部分での奇妙なスクランブルについては、何が起きているのかよくわかりません。
Soraの照明については本当に称賛に値します。キャラクターがこの店舗の前を通り過ぎる様子、彼女の目のキャッチライトに至るまで、非常に正確です。本当に良い出来栄えです。
「パイレーツ・オブ・カリビアン」ではないこのMidjourney生成画像をSoraが受け付けるか試してみましたが、画像プロンプトとしては受け付けませんでした。
この時点で、生成時間が短縮されてきていることを指摘しておく必要があります。現在は4〜5分程度になっています。
画像から動画への変換でさらに興味深い結果が得られました。この画像に「カメラが回転して姿を現す疲れた探偵、彼の目は怒りで満ちており、彼から多くのものを奪った街を見つめている」というプロンプトを与えました。興味深い結果となり、最初の画像を保持したまま、異なるアングルを見せ、ゆっくりとズームインしていきました。
基本的にプロンプトの最初の4分の1くらいは、まったく動きのない入力画像のままでしたが、その後急速にアングルが切り替わり、私には少し良くない感じに見えるものになりました。
また、この画像も試してみました。これは私には完全にロウディ・ロディ・パイパー主演の80年代ジョン・カーペンター映画の失われた作品を思わせます。これらの結果はかなり良かったです。Runwayで見られたような上下のピラーボックス(黒帯)が出現しました。どうやらこれらのビデオジェネレーターは本当にピラーボックスが嫌いなようです。
そしてもう一つのバリエーションでは、少しカメラの動きを加えた、よりダイナミックなバージョンのショットが得られました。ここでも最初の数フレームで奇妙なグリッチが発生していますが、ローンチ日なので、この点については特に減点はしないことにします。
これはCling、MiniMax、またはLuma Labsと比べて本当に100倍優れているのでしょうか?皆さん、コメント欄で教えてください。
全体として、これは私たち全員が待ち望んでいた夢のビデオジェネレーターなのでしょうか?正直なところ、まだ100%確信は持てません。この動画は明らかに初期の反応とほぼリアルタイムでの使用感について重点を置いたものでした。
これまで見てきた中で、出力は確かにかなり良好で、ストーリーボード機能、ブレンド機能、リミックス機能という追加の利点があります。これらは確実に探究する価値のあるツールであり、真の強みとなる可能性があります。また、良好な組織化ツールも備えているようで、これは非常に評価できます。
Soraの真の総合的なレビューを行うには、もっと時間をかけて深く掘り下げる必要がありますが、全体的には興味深いものです。月額200ドルを支払う価値があるかどうかは、まあ、すぐにわかることでしょう。
繰り返しになりますが、「いいね」とチャンネル登録をお願いします。今週はいくつか他の動画も予定していますが、空き時間にはSoraを徹底的にテストしていきます。そして、月額200ドルの価値があるかどうかについて、完全で包括的なレビューで必ずお伝えします。
視聴していただきありがとうございます。おそらくかなりまとまりのない動画になったと思いますが。私はTimです。
コメント