Soraが使えるようになりました!その使い方は…

9,034 文字

Fresh Release: Exploring OpenAI's Game-Changing Sora
Sora, the AI Video tool that was teased so long ago is finally available! You can use Sora at More:🛠️ Explore AI Tools &...

ついにその日が来ました。長い間噂されてきましたが、OpenAIがついにAIビデオ生成モデルのSoraをリリースしました。実際に使って試してみるのがとても楽しみです。私自身はまだ使用できていませんが、リリースまでに時間がかかりすぎたため、他のAIビデオ生成ツールが改良され、良くなって、ほぼSoraのレベルまで到達したように見えます。しかし、今日のデモを見る限り、Soraは他の多くのツールよりもまだ少し優位性があるようです。
それでは早速試してみましょう。多くの人が最初に気になるのは、Soraの使用料金でしょう。ChatGPTの有料アカウントを持っていれば使用できます。月額20ドルのプラスアカウントなら、月に50本のビデオ(1,000クレジット)を720pで生成できます。新しい月額200ドルのProプランなら、月に500本のビデオ(10,000クレジット)を生成できます。また、無制限のリラックスモードのビデオも利用可能です。これは処理速度が遅いビデオ生成だと思われます。
1080p解像度で20秒まで生成可能で、5つの同時生成が可能です。つまり、一度に複数の生成を実行できます。また、ウォーターマークなしでビデオをダウンロードすることもできます。月額200ドルのプランでは多くの追加機能が利用できますが、月額20ドルのプランでも使用は可能です。私はYouTubeでAIに関する動画を作成しているので、できるだけ多くの機能にアクセスできるように200ドルのプランにアップグレードしました。
Soraについてもう1つ注意すべき点は、まだすべての国で利用できないということです。現在利用可能な国のリストがありますが、かなりの数の国で利用可能です。ただし、イギリスやEUではまだ利用できないことに注意が必要です。これらの地域ではAI関連の政策がより厳格なため、合法的にリリースできるよう調整を進めています。
それでは実際に試してみましょう。ダッシュボードにログインすると、直感的な見慣れたダッシュボードが表示されます。左側のメニューには、最近のビデオ、注目のビデオ、保存済み、ライブラリ、すべてのビデオ、お気に入り、アップロード、そしてフォルダで整理できる機能があります。これは便利な機能で、ChatGPTにもあったらいいのにと思う機能です。
右上には、プロンプト、ストーリーボード、リミックス、ブレンド、ループでフィルタリングできるオプションがあります。アスペクト比とスクエアでフィルタリングするオプションもありますが、まだその意味は完全には分かっていません。アクティビティと、プロフィールと設定のドロップダウンメニューもあります。
設定をクリックすると、ユーザー名、メール、テーマの選択、エクスプローラーページへの公開の可否、コンテンツをトレーニングに使用するかどうかの選択などのオプションがあります。プランをクリックすると、残りのクレジット数、リラックスモードのビデオ数、最大同時生成数、最大ビデオ時間、最大解像度、ウォーターマークなしでのダウンロード機能など、利用可能な機能がすべて確認できます。
画面下部にはプロンプト入力ボックスがあります。画像をアップロードすることもでき、その際にはいくつかのポリシーに同意する必要があります。今は実際の画像のアップロードは後回しにしましょう。
プリセットとして、バルーンワールド、ストップモーション、アーカイバル、フィルムノワール、段ボール・ペーパークラフトなどがあります。今朝のデモ動画では、独自のプリセットも作成できると言っていました。
解像度については、現時点で16:9、1:1スクエア、9:6の縦型ビデオの3つのオプションがあります。解像度は480p、720p、1080pから選択でき、高解像度になるほど処理時間が長くなることが分かります。
時間は5秒、10秒、15秒、20秒から選択できます。20秒まで使用するにはより上位のプランが必要だと思われます。また、生成するビデオのバリエーションを1つ、2つ、4つから選択できます。さらに、後で試してみるストーリーボードオプションもあります。
それでは、私がビデオジェネレーターを初めて使用する際にいつも試すテストを行ってみましょう。ローラースケートに乗った猿を生成してみます。これまでのビデオジェネレーターではこれをうまく生成できていませんでした。生成速度を考慮して、とりあえず5秒の480pで試してみましょう。
上部に生成キューに追加されたことが表示されました。Proアカウントなので5つまで同時生成が可能です。もう1つ試してみましょう。月に向かって遠吠えする狼を生成してみます。以前のAIビデオ生成の動画をご覧になった方は、これらのプロンプトを使用しているのをご覧になったことがあるでしょう。
タコスを食べる猫も試してみましょう。なぜか1つの動画が失敗してしまいました。「タコスを食べる猫」で予期せぬエラーが発生しました。もう一度試してみましょう。今度は動作しているようです。他のビデオはまだキューに入っているように見えます。
新しく作成したフォルダの名前を変更します。単に「テスト」と名付けておきます。後でSoraを使用する際に、これらがテスト用のビデオだったことが分かるようにするためです。
Soraは今日発表されたばかりなので、現時点で多くの人が一斉にビデオを生成しようとしていると思われます。実際、システムが過負荷になっているようで、多くの人がこのメッセージを受け取っています:「登録は一時的に利用できません。現在、トラフィックが集中しているため、新規登録を一時的に停止しています。できるだけ早く再開できるよう努めています。しばらくしてからもう一度お試しください。」
そのため、ProアカウントやPlusアカウントでSoraにサインアップしようとしても、このメッセージが表示される可能性があります。あなたが試す頃には解消されているかもしれませんが、現在一部のユーザーがこの問題に遭遇しています。
あるコーダーがXで共有したところによると、サインアップはできたものの、「サービスが容量に達しました。後でもう一度お試しください」というメッセージが表示され、実際にビデオを生成することができなかったそうです。私自身はまだこの問題には遭遇していませんが、いくつか予期せぬエラーは発生しています。
ローラースケートに乗った猿の最初の生成が完了しました。480pで、画質はかなり低いですが、これらのビデオの再生を見ていて興味深いのは、マウスをビデオ上でスクロールすると実際に再生される点です。前後に再生することができ、左のビデオに私の指が見えますが、クリックすることなく、マウスを動かすだけで前後に再生できます。
これらのビデオが480pであることを除けば、間違いなくこれはローラースケートに乗った猿です。これまで試したビデオツールの中で、最も良いローラースケートに乗った猿の生成です。明らかに猿がローラースケートを履いています。左の映像では一瞬足が消えたり、足が入れ替わったりしているように見えますが、かなり良い出来です。ただし480pなのでピクセルが荒くなっています。
現在システムがかなり混雑しているようで、生成キューの待機だけで約6分かかりました。月額200ドルのプランを使用しているにもかかわらず、最低解像度、最短時間で生成しても、キューを抜けるまでに6分かかり、生成が始まってからさらに1~2分かかりました。正確な時間は計っていませんでしたが、1~2分はかかりました。
全体として、プロンプトを入力してから動画が出力されるまでに約9分かかりました。月に向かって遠吠えする狼の方は、それよりもさらに時間がかかっています。現在94%まで進んでいますが、生成を開始してから約8分が経過しています。タコスを食べる猫の方は約7分が経過しています。
ようやく月に向かって遠吠えする狼が完成しました。生成に約11分かかりましたが、見てみましょう。2つの生成を同時に見ることができます。右側のものはほとんど動きがなく、木々が少し揺れて、狼がわずかに動くだけです。左側は静止画に視差効果を付けただけのように見えます。狼はまったく動かず、木々もほとんど動きません。星空の背景と、岩と狼と木々のある前景があり、2つの画像の間に視差効果があるだけのように見えます。
右側のものも非常に微妙な動きしかありません。11分待って、480pの5秒の動画としては少し期待外れです。タコスを食べる猫も完成し、これも約11分かかりました。上のものは猫がレタスか何かを食べているように見え、右のものは猫が咀嚼していて、タコスも見えます。悪くはありません。かなり印象的だと思います。特に不満はありません。顔をタコスに突っ込んで食べているような様子だともっと良かったでしょうが、かなり良い生成だと思います。
月に向かって遠吠えする狼は期待外れでしたが、ローラースケートに乗った猿は実際に印象的でした。これまでローラースケートに乗った猿を生成するのは難しかったのです。画像からビデオを生成してみましょう。ここで画像をアップロードします。マイクに向かって話している最近のサムネイル用の画像があります。「マイクに向かって話す男性」というタイトルにしましょう。
現時点で1080pを試すのは少し心配です。他のものが8倍遅くなり、他の生成に10分かかったということは、80分かかることになるからです。デモのために480pのままにしておきましょう。理想的には、Soraが少し長く運用されて、待ち時間が短くなることを期待しています。しかし、今日は大量のアクセスがあると思われます。
その画像に基づいてビデオを生成してみましょう。画像からビデオへの生成を待っている間、これらのプリセットを試してみましょう。バルーンワールドを使ってみましょう。すべてのプリセットで同じプロンプトを試して、プリセットがプロンプトをどのように調整するか見てみたいと思います。「スイカを手品のように操る海賊」というプロンプトを使ってみましょう。このプロンプトをコピーして、何度も使えるようにしておきます。
バルーンワールドのプリセットでそれを実行し、ストップモーションのプリセット、アーカイバルのプリセット、フィルムノワールのプリセットも試してみましょう。顔の画像から始めたビデオ生成は、約20分後に「このプロンプトの実行中に予期せぬエラーが発生しました」というメッセージが表示されました。「プロンプトを再試行」をクリックしてみましょう。
クリックすると、エラーが発生した動画が大きく表示されるページが開くだけです。「プロンプトを再試行」をクリックしても何も起こらないのは、バグなのかどうか分かりませんが、エラーが発生した動画のページを開くだけです。
画像からビデオへの生成は、最初の予期せぬエラーの後に動作するようになりました。結果を見てみましょう。1つ目は目に微妙な動きがあり、ジャケットがよく見えるようにズームインし、その後話し始めます。2つ目は静止画から始まり、動きがなく、その後完全に異なる画像に変わります。
これは少し変な動作ですね。まだSoraの適切なプロンプトの仕方が分かっていません。これは私も初めて使用する日なので、プロンプトで間違っていることがたくさんあるかもしれません。より良い結果を得るためのプロンプトの方法について、多くの人がアドバイスを提供してくれると思います。この画像からは「なるほど、あなたの画像は気に入りましたが、今から全く別のビデオを作ります」と言っているようなものでした。
試してみたプリセットの結果を見てみましょう。バルーンワールドを使用した「スイカを手品のように操る海賊」です。確かにバルーン風に見えますが、どちらかというとピクサー風のアニメーションのように見えます。右側では、手品のように操るというよりも、1つのスイカを2つに変えているように見えます。スイカを浮遊させているだけで、本当の手品のような動きは見られません。まあまあ良い感じのビデオですが。
これはストップモーションビデオで、確かにストップモーションのように見えます。どちらも海賊が手品のように操っているようには見えず、左側はスイカが空中に浮いているだけ、右側は水から飛び出したスイカが浮いているだけですが、確かにストップモーションアニメーションのように見えます。
次にアーカイブ映像ですが、これは少し手品らしく見え始めていますが、ボールが浮いて離れていってしまいます。フィルムの端のような跡があり、古いアーカイブビデオのように見えます。プリセットは機能しているのが分かりますが、ビデオの物理的な動きはまだちょっとおかしいです。明らかにAIで生成されたように見えます。
そして、海賊がスイカを手品のように操るフィルムノワールのプリセットです。これにマウスを合わせてみると、確かに白黒で、影などがあるのでフィルムノワールっぽいですが、やはり手品の部分がうまく表現できていません。スイカにも見えず、ボールや、まあ、ボーリングの球のようなものを持っているように見えます。
最後のプリセット、段ボールと紙の切り抜きバージョンです。またしても手品らしい動きはありません。左側の方が少し手品っぽく見えますが、右側は1つのスイカを2つに変えて地面に落とし、また1つに戻すだけのように見えます。しかし、段ボールと紙の切り抜きの雰囲気は確かに出ています。ただ、まだ手品のような動きを表現することができていないようです。
この生成にも約20分かかったので、現時点ではまだ遅いです。しかし、様々なプリセットがどのように機能するかを確認することができました。ストーリーボード機能を試してみましょう。ストーリーボードをクリックします。これはSoraが本当に強力になる領域の1つだと感じています。タイムライン上で複数のプロンプトを設定し、それらのプロンプトで作業させることができます。
崖の上に立つ男が狼に変身するような映像を作りたいと思います。2秒のマーカーをクリックしてプラスを押すと、別のプロンプトを追加できます。最初は「背景に満月のある崖の上に立つ男」にしましょう。そして2秒後に「男が狼に変身する」というプロンプトを設定します。背景に月のある崖の上に立つ男が、狼、つまり人狼のように変身する様子を作ってみましょう。
これをキューに追加しました。このストーリーボードの他の良い点は、5秒のビデオを生成して、最後の1秒が気に入らない場合、4秒に切り詰めて、最後の1秒を再生成することができることです。または、ビデオ全体をスライドさせて、最初の1秒を再生成することもできます。既存のビデオのコンテキストを把握し、それを拡張する方法を知っているのです。
ストーリーボードの生成結果を見てみましょう。最初は崖の上の男から始まり、その後男が狼に変身するはずです。2つの生成を確認してみましょう。確かに崖の上の男が見えます。マウスを合わせてアニメーションを見てみましょう。彼はしゃがみ込むだけで、狼には変身しません。右側は男にズームインするだけで、やはり狼には変身しません。
もしかしたら、より長い生成時間が必要かもしれません。ストーリーボード機能を使わずに、単純なプロンプトで試してみましょう。「満月の下で崖の上の男が狼に変身する」というプロンプトで、ストーリーボード機能を使用せずに試してみると、もしかしたら期待していたものに近いものができるかもしれません。
しかし、これは単に崖の上に立つ男性の映像になっています。これは静止画をズームインしただけのように見えます。「満月の下で崖の上の男が狼に変身する」という完全なプロンプトの結果を見ると、満月は見え、男性も見えますが、変身の様子はあまり見られません。
また、2つのバリエーションを生成するはずでしたが、1つは失敗してしまいました。これも現在サーバーが完全にオーバーロードしている症状だと思われます。
ここで、より多くのビデオを生成してその機能を示す代わりに、探索タブの注目コンテンツにあるビデオをいくつか紹介したいと思います。というのも、現在ビデオの生成に15~20分かかっているため、私が録画しているこのビデオの制作に非常に時間がかかっているからです。
私のアドバイスとしては、Soraを使用したい場合は、おそらく1週間ほど待って、この混乱が少し落ち着くまで待った方が良いでしょう。現在は非常に過負荷状態で、月額200ドルの高額プランを使用していても、ビデオの生成に長時間かかっています。
また、その頃までにはより良いプロンプトの方法についてのフィードバックやヒントも増えているでしょう。現時点では、Soraから本当に良いものを引き出す方法にまだ少し混乱しています。単純な基本的なプロンプトではうまくいかないので、求めているものを本当に得るためには、もう少し詳細な指示を与える必要があるようです。
しかし、注目タブの例を見ると、人々は本当に素晴らしいビデオを生成しています。フェンスの上の鳥がいて、かなりリアルに見えます。雲もあり、粘土のようなロケットもあります。カラフルなプードルたちが踊っていたり、ファンタジーのような世界で、摩天楼の街を見下ろす人がいたり、煙の中で運転する猿、木々の間を運転する様子、てんとう虫、東京か何かを歩く人、海の上の船、雪の中を歩く象、スケートボードに乗った猫、雪の中を歩くバイキングなど、注目ビデオに表示されているものは本当に印象的です。
人々は本当に素晴らしいビデオを作成しています。私はただプロンプトの与え方をもう少し理解する必要があります。この雪の中のバイキングは本当に印象的です。プロンプトを見ることができるか確認してみましょう。クリックすると、「海の近くの山岳の雪景色を歩くバイキングのビデオ」というプロンプトが表示されます。背景に海と雪景色が見える、かなり良い出来栄えです。基本的なプロンプトでこれだけの結果が出ています。
海の上の船のこのビデオは、「古代ヨッパ港を出港する二本マストの木造船のアナモルフィック超ワイドショット」というプロンプトでした。マウスを合わせると完全なプロンプトが見えますが、全部は読み上げません。非常に詳細な長いプロンプトでした。
このピクセルアートのものは本当に良いですね。これは何でしょう。翻訳してみると、「プレイヤーが徐々に凍りついていく村から脱出するMinecraftのカットシーン」とのことです。このビデオのピクセルアート風の見た目が本当に気に入りました。
私の問題は、プロンプトに十分な詳細を入れていなかったことだと思います。もう少し詳細を追加すると、より良く機能すると思います。この猿のクローズアップを見てください。まるでネイチャードキュメンタリーから切り取ったかのようです。これは別のビデオをリミックスして目を閉じさせたものです。
人々は確かに素晴らしいビデオを生成しています。画面上でこれらのビデオの一部にマウスを合わせて、人々が生成しているものを少し見てみましょう。さらにいくつかをご紹介します。良い点の1つは、注目セクションや最近のセクションに行って、他の人が作成した任意のビデオをクリックすると、その人が使用した正確なプロンプトを見ることができ、そのプロンプトをリミックスして少し調整することができる点です。これはとても素晴らしい機能です。
Soraは間違いなく印象的です。私のコンピュータにある2023年3月に生成したローラースケートに乗った猿のビデオと比べてみましょう。2023年3月にはこのようなビデオでした。2023年3月と2024年12月のSoraが生成するものを比較すると、私たちは長い道のりを歩んできました。
正直なところ、これらのビデオには多くの問題点を見つけることができますが、2023年3月から2024年12月の今日までを見ると、AIビデオは信じられないほどの進歩を遂げています。プロンプトにある程度の詳細を与える必要があるようです。ただ「ローラースケートに乗った猿」「月に向かって遠吠えする狼」といったような単純なプロンプトでは、望む動きを得るには不十分なようです。
また、現在は非常に混雑しています。Xでは1時間以上かかっているという報告もあります。私は15~20分程度で生成できているので、比較的運が良かったのかもしれません。先ほど言ったように、しばらく待った方が良いと思いますが、探索タブで最近のビデオを見ると、一部は本当に印象的です。そうでないものもありますが、Soraはここにあり、これが最悪の状態です。
さらに試してみるのが楽しみです。より多くのヒントやコツを見つけ出したら、おそらくフォローアップ動画を作成し、さらに深く掘り下げていきたいと思います。この動画が楽しめて、Soraの機能についてもう少し理解していただけたなら嬉しいです。実際にビデオを生成できるチャンスを得られることを願っています。システムが混雑しすぎていないことを祈ります。
私はまだ続けていきますが、ビデオの生成に時間がかかりすぎるため、おそらくXやInstagramなどで生成結果を共有していくことになると思います。そこでSoraから実際に得られるものを見ることができます。それらのプラットフォームでフォローしていない方は、そちらでも投稿していく予定です。
システムがこれほど混雑している状態でさらにビデオを生成して試そうとすると、この動画の制作に何日もかかってしまうからです。しかし、Soraはここにあります。イギリスやヨーロッパ以外の誰もが今すぐに試すことができます。
Sam Altmanは、このSoraはAIビデオ生成におけるGPT-1やDALL-E 1のようなものだと言及しています。1年後に何が見られるのか、想像するだけでワクワクします。
以上です。話し過ぎましたね。次の動画でお会いしましょう。さようなら。

コメント

タイトルとURLをコピーしました