
8,620 文字
こんにちは、3日目へようこそ。これは私たちが長い間待ち望んでいたローンチです。Soraというビデオ製品をローンチし、なぜこれがとても重要で刺激的なのかについて詳しくお話ししますが、まずはとにかくすごいので、皆さんにお見せしたいと思います。こちらがSora製品の様子です。フィードをご覧いただけますが、ユーザーが生成した動画が表示されています。これについては後ほど詳しくお話ししますが、まずはちょっとだけお見せしたかったのです。
ビデオはOpenAIにとって多くの理由で重要です。ここでは3つお話しします。1つ目は、私たちはクリエイターのためのツールを作ることが大好きだということです。これは私たちの文化にとって重要であり、人々がAIをどのように使用することを望むかという点でも重要です。特にこれは、初期のテスターたちの間で新しい種類の共創的なダイナミクスが生まれつつあることを示しており、AIの創造的ツールと人々がそれをどのように使用するかについて興味深い示唆を与えています。
2つ目は、私たちは世界がただテキストだけであってほしくないということです。AIシステムが主にテキストによって対話するだけなら、何か重要なものを見逃していると思います。私たちは、AIが動画を理解し、生成できるようになることを望んでいます。これは本当にコンピューターの使い方を根本的に変えると思います。
3つ目は、これは私たちのAGIロードマップにとって重要だということです。動画は、AIが世界で必要なことを学ぶための重要な環境となるでしょう。では、Soraのリーダーであるアディアと、Soraリサーチのリーダーであるビルに引き継ぎます。彼らがこの製品について少し説明してくれます。
ありがとう、サム。今日がついにその日です。Soraが利用可能になる日です。今日遅くに、Soraをアメリカおよびほとんどの国際市場でローンチします。sora.comでモデルにアクセスできます。これはOpenAIによって一から作られた完全に新しい製品体験です。最も良い点は、ChatGPT PlusまたはProアカウントを持っているだけで始められることです。Soraのために追加料金を支払う必要はありません。既にお持ちのアカウントに含まれています。
このような広範なデプロイメントのために、Soraリサーチチームは2月に公開したモデルをはるかに高速で安価にする方法を見つけるために多大な作業を行いました。彼らは本当に成果を上げ、今日私たちはSora Turboをローンチします。これは元のSoraモデルの新しい高性能加速バージョンで、今年初めに発表した世界シミュレーションに関する技術レポートで説明したすべての機能を備えています。
これには、テキストからの動画生成、画像のアニメーション化、新しいスタイルへのリミックス、時間の前後への拡張など、多くの動画機能が含まれます。他のメンバーが数分後にこれらをお見せします。サムが言及したように、私たちはOpenAIでSoraプロジェクトを開始し、世界とその物理法則を本当に深く理解するAIシステムを構築しました。これはまだ始まったばかりです。
このSoraの初期バージョンは間違いを犯すことがあり、完璧ではありません。しかし、すでに人間の創造性を拡張するのに本当に役立つ段階に達していると考えており、今日から世界がSoraで何を作り出すのか楽しみです。
こんにちは、アディアです。このリリースにとても興奮しています。OpenAIには、視覚生成の可能性の境界を押し広げる最先端のモデルを訓練してきた何年もの歴史があります。しかし、視覚生成のさらなる進歩には、機械学習と人間とコンピューターのインターフェース設計の両方での breakthrough(画期的な進展)が必要だと考えています。そのため、私たちが構築した製品を本当に誇りに思っており、ロハンとジョーイに詳しい説明を任せたいと思います。
やあ、ジョーイ。やあ、どうだいサム。この製品をお見せできて楽しみです。
どうぞ、始めましょう。私はロハンで、Soraプロダクトチームのリーダーです。そして私はジョーイで、Soraのプロダクトデザイナーです。
では、ジョーイから始めてください。
まず、探索機能について少しお話ししましょう。探索は、インスピレーションを得るための場所です。コミュニティによって共有された動画のフィードで、誰もがこの強力な新しいモデルの機能を探索するために集まることができます。特に初めて使用する場合、これらのモデルでできることすべてを理解するのが難しい場合があることを私たちは知っています。そのため、人々が集まって、テクニックや方法を共有できる場所を作ることは、とても刺激的であり、また重要だと感じました。
ここをスクロールすると、これらの素晴らしい動画からインスピレーションを得ることができます。特に興味深い動画を見つけた場合は、クリックしてライトボックスで表示できます。このライトボックスの下部には、この動画を作成するために使用された正確な方法が表示されます。それが単純なテキストプロンプトなのか、画像拡張なのか、動画拡張なのか、あるいは他のより強力な創造的ツールなのかがわかります。この方法論を取り入れて、自分の創造的なワークフローに組み込む方法を学ぶことができます。
では、ロハンに最初の生成を任せましょう。
ライブラリに移動しましょう。これはSoraでのあなたの拠点と考えることができ、すべての生成物を表示できます。ここでの表示方法はいくつかの方法で切り替えることができます。グリッドビュー、リストビュー、フォルダーの作成、お気に入り、フィードからのブックマークの表示など、すべて細かな整理機能ですが、私たちがストーリーテリングと、この製品の実際の使用を本当に重視していることを示しています。
下にある簡単なコンポーザーでは、テキストで説明するか画像をアップロードするだけで動画を作成できます。サム、アイデアはありますか?
マンモスが砂漠を歩いているのはどうでしょう?
いいですね。砂漠の風景の中を歩くマンモスにしましょう。ワイドショットにしましょうか。これを実行する前に、下にあるいくつかのオプションについて触れておきたいと思います。アスペクト比については、Soraは横長のアスペクト比から正方形、縦長まで生成できます。解像度は480pから1080pまで生成可能で、5秒から20秒までの動画を生成できます。また、一度に複数のバリエーションを生成することもできます。
この説明から何が欲しいのか正確にはわからないかもしれません。Soraはいくつかの方向性を示してくれるかもしれません。バリエーションを使うと、いくつかのオプションを見ることができます。ここでは4つの動画のバリエーションを生成しましょう。最後に重要なのがプリセットです。時には本当に気に入った美的感覚やスタイルを見つけ、それを再利用可能なコンポーネントとして捉え、多くの生成に適用したいと思うことがあります。
それを行うことができ、自分で作成することもできます。デフォルトでいくつか用意されています。ストップモーション、バルーンワールドはクレイジーなものです。強くお勧めします。では、この生成を実行して、その後ジョーイにストーリーボードについて話してもらいましょう。これは私たちが持っている別の本当に素晴らしい機能です。
ありがとう、ロハン。ロハンが今示したように、一般的なアイデアをSoraに送って、美しい動画のセット全体を作成させることができます。しかし今日、私たちは全く新しい創造的ツールを紹介することに興奮しています。これはまだ非常に初期段階ですが、ストーリーボードと呼んでいるより高度なツールで、馴染みのあるタイムラインを使用してシーケンス全体で複数のアクションを持つ動画を指示することができます。
ここをクリックして、ストーリーボードについて少し説明させていただきます。画面上部にストーリーボードカードがあります。ここで環境、キャラクター、特定の時点で発生させたいアクションを記述します。その下にタイムラインがあり、クリップ全体の概要を見ることができます。ここで動画内のアクションの順序を決めます。その下には、ロハンが先ほど説明した作成設定があります。
ストーリーボードに戻って、シーンの最初のカードを設定しましょう。「美しい白い鶴が小川に立っている、黄色い尾を持っている」としましょう。ここでは、少なく書くことも、多く書くこともできます。少なく書けば書くほど、Soraがより多くの詳細を埋めてくれます。多く書けば書くほど、Soraは私の指示により忠実に従おうとします。
この動画では、最初に鶴が立っていて、その後頭を水に浸して魚を取り出すようにしたいと思います。タイムラインに移動して、クリップの概要内の任意の場所をクリックして、追加のカードを追加し、それらのアクションを指示できます。ここに「鶴が頭を水に浸して魚を取り出す」と書きます。
タイムラインを見直すと、タイムラインの開始時にシーンを設定し、5秒後に鶴が頭を水に浸すことがわかります。これらの2つのカードの間にある空白は重要です。この空白はSoraが最初のアクションのセットと2番目のアクションのセットを結びつけるために必要です。これらのアクションがいつ発生するかは常に調整できますが、これらのアイデアを結びつけるために十分な時間をSoraに与えることは本当に重要です。
連続したショットが欲しい場合は、カードを近づけて映画的なカットを作らせることもできますし、さらに離してSoraにより多くの詳細を埋めさせることもできます。これを5秒に戻して実行しましょう。数分後にこれを確認できますが、ストーリーボードにはもう1つ本当にクールな機能があり、それをお見せしたいと思います。それは画像から動画を作成する機能です。
この最初のストーリーボードカードで、デスクトップにある画像をアップロードします。この画像は灯台のものです。Soraが自動的にその最初の画像を最初のカードに配置し、そして全く新しいカードを作成したのがわかります。これは継続キャプションです。Soraはその画像を見て、この画像で作りたい動きを追加的に理解し、美しい動画にするためのキャプションを埋めました。
テキストと同様に、このカードの内容を編集したり、位置を調整したりできますが、今回はこれを実行して、どのように見えるか確認しましょう。では、ロハンに戻して、作成した動画を確認してもらいましょう。
やりましょう。マンモスを見てみましょう。ここでは、生成のバリエーションにカーソルを合わせて、どれが一番気に入るか感じを掴むことができます。そして、Soraでさらに改良を続けることができます。右上が良いと思います。
私もそう思います。右上を見てみましょう。これはクールですが、シーンを見てみると、このマンモスがロボットだったらもっとクールだと思いませんか?
素晴らしいアイデアですね。やってみましょう。リミックスを使えば、動画の変更を説明するだけで、Soraが残りの作業を行います。ここでリミックスをクリックして、単純に「マンモスをロボットに置き換える」と言います。いくつかの馴染みのあるオプションが表示されます。複数のバリエーションを作成したり、解像度を変更したりできます。また、リミックスの強さもSoraに指示できます。
シーンに大きな変更を加えたい場合、これはおそらく重要な変更なので、Soraに強いミックスを指示しましょう。もし微妙な変更、例えばこのシーンの背景に少し風を加えたり、砂を多く舞い上がらせたりしたい場合は、より穏やかな微妙なリミックスを選びます。今回は強いリミックスで実行しましょう。
ジョーイ、あなたのストーリーボードの生成を見てみましょうか?鶴はどうなりましたか?
見てみましょう。
では、これらの1つをクリックしてみましょう。途中で鶴が水に頭を浸しているのがわかります。魚を捕まえるかどうか見てみましょう。あ、この1回は失敗したようですね。もう1つも確認してみましょう。Soraは私の指示を理解し、まさに望んだ方向に進んでいくのが非常にうまくできています。両方の鶴は失敗したかもしれません…あ、小さな魚を捕まえましたね。
これについても指摘したいのですが、Soraの持つ魅力の半分は、動画を編集し、その上に構築していくことです。この動画の最初の部分、鶴の頭が水しぶきを上げる瞬間が気に入りました。そこで、リカットという別の編集ツールを使用して、動画をトリミングし、さらに多くの指示でストーリーボードで拡張してみましょう。
リカットをクリックすると新しいストーリーボードに移動し、Soraが鶴の動画をインポートしました。タイムラインで動画を確認でき、スクラブして確認することもできます。また、動画をトリミングすることもできます。最初の数秒、頭が水に浸かるまでの部分が気に入ったので、それを使いましょう。
他のストーリーボードの例と同様に、ここで空白にしておいた部分は、そこにあるストーリーボードカードからシームレスに続いていきます。全く新しいエンディングが欲しい場合は、最後を空白にして作成ボタンを押すことができます。全く新しい始まりが欲しい場合、例えばこれをシーンの最後に置きたい場合は、ここに置いておいて、最初の部分で少し長くカメラが鶴に留まるようにすることもできます。
また、真ん中に移動させて、完全に新しい終わりと始まりを生成することもできます。そして、ストーリーボードの他の部分と同様に、常にクリックしてカードを追加し、より多くの指示を与えることができます。では、この動画に新しいエンディングを生成して、どうなるか見てみましょう。
素晴らしい、ありがとうジョーイ。その間に、ロボットはどうなったか見てみましょう。
なんということでしょう!
すごい!
見てください、ここでSoraが…これはマンモスのようなロボットですね。
うん、かなりクールです。実際に素晴らしく歩いていますね。
Soraは「マンモスをロボットに置き換える」という私たちのプロンプトを受け取り、まさにそれを実行しました。クリックすると元の動画を確認できます。これは強いリミックスで、マンモスをロボットに置き換えました。とても素晴らしいですね。
他の機能もいくつか見てみましょう。ジョーイ、あなたの画像から動画への生成を見てみましょうか。
かなりクールですね、この灯台のアンビエンスが。右上のがなかなかいいですね。
ここでは異なるカメラの動きで、いくつかの異なるショットが得られています。見てわかるように、正確に何が欲しいかわからない場合でも、画像を投入してSoraにやらせてみることができます。この右下のが気に入りました。
ループとして使えたら面白いと思います。私たちの素晴らしい機能の1つは、生成が気に入った場合、Soraに「これを無限に繰り返してほしい」と伝えることができることです。それがとても美しいからです。まさにそれをループで実現できます。
ループをクリックすると、このループの開始点をどこにしたいか、終了点をどこにしたいかをSoraに伝えることができます。そしてSoraが隙間を埋めて、このようなシームレスな繰り返しシーンを作成します。ここにはいくつかのオプションがあります。始めと終わりがすでにかなり似ている場合は、フレームを少なく追加することができます。また、より異なる始まりと終わりを結びつけようとする場合は、多くのフレームを追加するようSoraに指示することもできます。
しかし、Soraが重要な作業を行います。これは本当に素晴らしい機能です。私たちのアルファテスターのアーティストの多くがループを本当に気に入っています。
最後に、もう1つの機能について簡単に触れたいと思います。ブレンドです。ブレンドは、Soraに2つのシーンを与え、Soraがそれらの両方の一貫性のある新しいシーンを作成すると考えることができます。それはほとんど、2つの動画を別の次元で一緒に打ち砕いて、この次元に戻してくるようなものです。私は、Soraのモデルでブレンドを使うまで、このようなものを見たことがありませんでした。
ブレンドをクリックすると、ライブラリから別の動画を選択できます。ロボットとマンモスをブレンドするのも面白いかもしれません。ここにはいくつかのオプションがありますが、詳細には立ち入りません。要するに、これら2つのシーンをどのようにブレンドしてほしいかをSoraに指示できるのです。私たちのヘビーユーザーやパワーユーザーが多くの素晴らしい作品を作るための、本当に素晴らしい高度な機能です。
やってみましょうか?
もちろん、実行できます。マンモスとロボットには並行ブレンドがいいでしょうね。やってみましょう。
素晴らしい。まとめとして、特集フィードに戻ります。先ほどジョーイがこれらの動画をスクロールしていたのを覚えていますか?下部にストーリーボードがあるのを見たかもしれません。今はそれが何かわかりましたね。フィードの各生成を見て、それらがどのように作られたのかを知ることができます。
私はフィードが大好きです。なぜなら、インスピレーションを見つけて、他の人の動画の自分なりのリミックスを実行できるからです。インスピレーションに加えて、単に見ているだけでも本当に魅力的です。人々が作り出しているものは驚くべきものです。
本当に信じられないですね。
そして、これがSoraです。これが端から端までの製品で、皆さんが何を作り出すのか本当に楽しみです。より多くの機能を追加し、Soraでさらに素晴らしいことを行っていきますが、はい、サム、利用可能性について教えてくれますか?
これは今日、世界のほとんどの地域で公開されます。ただし、ヨーロッパのほとんどの地域とイギリスは時間がかかります。できる限り早くローンチできるよう努力しますが、まだ共有できる時期はありません。また、私たちが運営できない他の国々もあります。
OpenAI Plusサブスクリプションをお持ちの方は月50回の生成が可能で、OpenAI Proをお持ちの方は、遅いキューモードで無制限の生成が可能です。また、通常の高速生成は500回利用できます。高解像度では、より少ない回数の生成となります。また、どのようなアカウントをお持ちの方でも、フィードを楽しむことができます。
皆さんが何を作り出すのか本当に楽しみです。この新しい種類のエンターテイメントとツールがどのように使われるのか、本当に楽しみにしています。皆さんは本当に素晴らしい仕事をしました。私はチームを本当に誇りに思います。製品も大好きです。最後に何かコメントはありますか?
はい、ジョーイと私は、ここにいる素晴らしいチームの代表にすぎません。このとてつもないモデルを構築し、実際に世界に提供できる段階まで持ってきた研究チームに感謝したいと思います。また、私たちのプロダクトチームは5、6人のプロダクトエンジニアで、数ヶ月でこの製品全体を構築しました。そして明らかに、この段階まで来るためにOpenAIの多くの人々のサポートがありました。
そして、乱用防止と安全性について簡単に触れさせてください。これは明らかに私たちOpenAIのDNAの一部であり、私たちが本当に気にかけていることです。OpenAIとして大きな標的になっていることは明らかなので、Soraの違法な使用を防ぎたいと思います。しかし、それと創造的な表現のバランスを取りたいとも考えています。
これは常に進行中の課題となることを知っています。初日から完璧にはいかないかもしれません。少し保守的に始めますので、もし私たちのモデレーションが適切でない場合は、そのフィードバックをください。改善を重ねていきます。
本当に、本当に皆さんが作り出すものを見るのが楽しみです。ジョーイ、最後に何かありますか?
はい、私の最後の考えは、もしSoraに、ボタンを押すだけで長編映画を生成できるという期待を持って来られても、それは間違った期待だということです。Soraはツールです。同時に複数の場所にいることができ、同時に複数のアイデアを試すことができ、以前は全く不可能だったことを試すことができます。
しかし、私たちが本当に特別だと思うのは、それがそのツールを使用しているクリエイターの拡張であるということです。皆さんが何を作り出すのか、本当に楽しみにしています。フィードで見守っています。
GPT-1のアナロジーに戻ると、これはまだ初期段階です。はるかに、はるかに良くなっていきます。しかし、私たちは初期段階のものを公開しても、人々が驚くべきパフォーマンスと本当の価値を引き出せることに、いつも驚かされてきました。今日遅くにフィードで皆さんが何をするのか、本当に楽しみにしています。ありがとうございました。
コメント