
9,008 文字

こんにちは、3日目へようこそ。これは私たちが長い間待ち望んでいたローンチです。私たちはSora、つまりビデオプロダクトをローンチします。なぜこれがとても重要で刺激的なのか、多くの話をしていきますが、まずはとても素晴らしいので、お見せしたいと思います。
ここでSoraプロダクトがどのようなものか少し見てみましょう。これはフィードで、ユーザーが生成している動画を見ることができます。これについては後でもっと詳しくお話ししますが、少しお見せしたくて仕方ありませんでした。
ビデオはOpenAIにとって多くの理由で重要です。ここでは3つお話しします。1つ目は、私たちがクリエイターのためのツールを作ることを愛しているということです。これは私たちの文化にとって重要で、人々がAIをどのように使用することを望むかということにも重要です。特にこれは、初期テスターの間で見られる新しい種類の共創的なダイナミクスがあり、AIクリエイティブツールと人々がそれをどのように使用するかについて、興味深いことを示唆していると思います。
2つ目は、世界がテキストだけであってほしくないということです。AIシステムが主にテキストによって対話するのであれば、重要な何かを見逃していると思います。私たちのAIが動画を理解し、生成できるようになることを望んでいます。そしてそれは、私たちがコンピュータを使用する方法を深く変えると思います。
3つ目は、これが私たちのAGIロードマップにとって重要だということです。動画は、AIが世界で必要なことをどのように行うかについて多くを学ぶ重要な環境になるでしょう。
では、Soraのリーダーであるアディアと、Soraリサーチのリーダーであるビルに引き継ぎます。彼らがこれに何が込められているのか少しお話ししてくれます。その後、プロダクトチームが登場します。
アディア:今日はついにSoraが利用可能になる日です。私たちはSoraをアメリカ合衆国そして多くの国際市場で本日後半にローンチします。モデルにはsora.comでアクセスできます。これはOpenAIによって完全に新しく構築された、動画生成のためのプロダクト体験です。最も素晴らしい点は、Chat GPT PlusまたはProアカウントを持っているならば、それだけで始められるということです。Soraのために追加料金を支払う必要はありません。既にお持ちのアカウントに含まれています。
このような広範なデプロイメントのために、Soraリサーチチームは2月に公開したモデルをより高速で安価にするための方法を見つけるために多大な作業を行わなければなりませんでした。彼らは本当に成果を上げ、今日私たちはSora Turboをローンチします。これは元のSoraモデルの新しい高性能加速バージョンで、今年初めに世界シミュレーションに関するテクニカルレポートで話したすべての機能を備えています。
これにはテキストからの動画生成、画像のアニメーション化、そして新しいスタイルへのリミックス、時間の前後への拡張など、多くの動画機能が含まれます。他のメンバーが数分後にこれをお見せします。
サムが言及したように、私たちはOpenAIでSoraプロジェクトを開始し、世界とその物理法則を本当に深く理解するAIシステムを構築しています。これはまだ始まったばかりです。このSoraの初期バージョンは間違いを犯すことがあり、完璧ではありません。しかし、すでに人間の創造性を拡張するのに本当に有用になると思える段階に達しており、本日以降、世界がSoraで何を作り出すのか楽しみでなりません。
アド:こんにちは、アドです。このリリースにとても興奮しています。OpenAIは視覚生成の可能性の境界を押し広げる最先端のモデルを訓練してきた長年の歴史があります。しかし、視覚生成のさらなる進歩には、機械学習と人間とコンピュータのインターフェース設計の両方でブレークスルーが必要だと感じています。そのため、私たちが構築したプロダクトを本当に誇りに思っています。そして、ロハンとジョーイに引き継ぎたいと思います。彼らがより詳しく説明してくれます。
サム:やあ、ロハン。
ロハン:やあジョーイ。
ジョーイ:やあ、サム。このプロダクトをお見せできて興奮しています。
サム:始めましょう。
ロハン:私はSoraプロダクトチームのリーダーのロハンです。
ジョーイ:私はSoraのプロダクトデザイナーのジョーイです。
ロハン:ジョーイ、始めてください。
ジョーイ:まず、エクスプローラーについて少し説明させてください。エクスプローラーはインスピレーションを得る場所です。コミュニティによって共有された動画のフィードで、誰もがこの強力な新しいモデルの機能を探索するために集まることができます。モデルは特に初めて使用する時、それで何ができるのかを理解するのが難しい場合があることを私たちは知っています。そのため、人々が集まって、テクニックや方法を共有し、学べる場所を作ることは、エキサイティングであり、かつ重要だと感じました。
ここをスクロールすると、これらの素晴らしい動画からインスピレーションを得ることができます。特に興味深い動画が見つかれば、それをクリックしてライトボックスで表示することができます。このライトボックスの下部には、この動画を作成するために使用された正確な方法が表示されます。それが単純なテキストプロンプトなのか、画像拡張なのか、動画拡張なのか、あるいは他のより強力なクリエイティブツールの1つなのかがわかります。この方法論を取り入れて、自分のクリエイティブワークフローに組み込む方法を学ぶことができます。では、最初の生成のためにロハンに戻しましょう。
ロハン:ライブラリに移動しましょう。これはSoraでのあなたのホームベースと考えることができます。ここですべての生成物を表示できます。ビューをグリッドビューやリストビューなど、いくつかの方法で切り替えることができます。フォルダを作成したり、お気に入りに登録したり、フィードからブックマークを見たりすることができます。これらは些細な整理機能ですが、私たちがストーリーテリングと、このプロダクトの実際の使用を本当に重視していることを示しています。
ここ下にある単純なコンポーザーでは、テキストで説明するだけで、または画像をアップロードすることで動画を作成できます。サム、アイデアはありますか?
サム:砂漠にいるウーリーマンモスはどうですか?
ロハン:砂漠を歩くウーリーマンモス、いいですね。「砂漠の風景の中を歩くウーリーマンモス」としましょう。ワイドショットにしましょうか。
これを実行する前に、ここにあるいくつかのオプションについて触れたいと思います。アスペクト比について、Soraは横長のアスペクト比から正方形、縦長まで生成できます。解像度は480pから1080pまで生成可能で、5秒から20秒までの動画を生成できます。また、一度に複数のバリエーションを生成することもできます。
この説明から何が欲しいのか正確にはわからないかもしれませんし、Soraがいくつかの異なる方向性を取るかもしれません。バリエーションを使えば、いくつかのオプションを見ることができます。ここでは4つの動画バリエーションを生成しましょう。
最後に、プリセットがあります。時には本当に気に入った美的感覚やスタイルを見つけて、それを再利用可能なコンポーネントとして捉え、多くの生成に適用したいと思うことがあります。それが可能です。自分で作成することもできますし、いくつかのデフォルトも用意されています。ストップモーション、バルーンワールド、クレイジーなものもあります。強くお勧めします。
では、この生成を実行して、ストーリーボードという別の本当に素晴らしい機能について説明するためにジョーイに戻したいと思います。
ジョーイ:ありがとう、ロハン。ロハンは一般的なアイデアをSoraに送って、美しい動画のセット全体を作成する方法を示しました。しかし今日、私たちは全く新しいクリエイティブツールを紹介することにワクワクしています。まだ非常に初期段階ですが、ストーリーボードと呼んでいるもので、馴染みのあるタイムラインを使用してシーケンス全体で複数のアクションを指示することができます。
ここをクリックして、ストーリーボードについて少し説明させてください。画面上部にストーリーボードカードがあります。ここで環境、キャラクター、そして特定の時点で発生させたいアクションを説明します。その下にタイムラインがあり、クリップ全体の概要を見ることができます。ここで動画内のアクションの順序を決めます。そしてその下には、ロハンが先ほど説明した作成設定があります。
ストーリーボードに戻って、シーンの最初のストーリーボードカードを設定しましょう。「美しい白い鶴が小川に立っている。黄色い尾を持っている」としましょう。ここでは少ししか書かなくても、たくさん書いても構いません。少なく書くほど、Soraがより多くの詳細を補完し、多く書くほど、Soraはより私の指示に従おうとします。
この動画では、最初に鶴が立っていて、その後水に頭を浸して魚を取り出すようにしたいと思います。タイムラインに移動して、クリップの概要内の任意の場所をクリックして、追加のカードを加え、Soraにそれらのアクションを指示することができます。
ここに移動して、「鶴が水に頭を浸して魚を引き出す」と書きます。タイムラインを見直すと、タイムラインの開始時にシーンを設定し、5秒後に鶴が水に頭を浸すことがわかります。これらの2つのカードの間にクリップの概要内にスペースがあることに気付くでしょう。このスペースは、Soraが最初のアクションのセットを2番目のアクションのセットに接続するために重要です。
これらのアクションを発生させたい場所を常に調整することができますが、連続的なショットが必要な場合、これらのアイデアを接続するためにSoraに十分な時間を与えることが本当に重要です。また、それらを近づけて映画的なカットを作らせることもできますし、より離して配置してSoraにさらに多くの詳細を補完させることもできます。
これを5秒に戻して実行しましょう。これは後で確認できますが、本当に本当にクールなストーリーボードの機能をもう1つお見せしたいと思います。それは画像から動画を作成することです。
この最初のストーリーボードカードで、デスクトップにある画像をアップロードしてみましょう。この画像は灯台のものです。Soraが自動的にその最初の画像を最初のカードに配置し、そして全く新しいカードを作成したことがわかります。これは続きのキャプションです。Soraがその画像を見て、この画像で作りたい可能性のある動きを理解し、美しい動画にするためのキャプションを追加しました。
テキストと同様に、このカードの内容を編集したり、位置を調整したりすることができます。しかし今は、これを実行して、どのように見えるか確認しましょう。これらの動画を確認するためにロハンに戻したいと思います。
ロハン:やりましょう。ウーリーマンモスを確認してみましょう。どうなったでしょうか。素晴らしい、とても良いですね。ここで生成のバリエーションにカーソルを合わせると、どれが一番気に入るか感じることができます。そしてSoraでさらに改良を続けることができます。
右上のが良いと思います。
ジョーイ:私もそう思います。
ロハン:右上を見てみましょう。これはクールですが、このシーンを見て、このウーリーマンモスがロボットだったらもっとクールだと思います。どうですか?
サム:素晴らしい。
ロハン:やりましょう。リミックスでは、動画への変更を説明するだけで、Soraが残りを処理します。ここでリミックスをクリックして、単純に「ウーリーマンモスをロボットに置き換える」と書きます。
いくつかの馴染みのあるオプションが表示されます。複数のバリエーションを作成したり、解像度を変更したりできます。また、リミックスの強さをSoraに指示することもできます。シーンに大きな変更を加えたい場合、これはおそらく重要な変更なので、強いリミックスをSoraに指示します。
もしシーンの背景に少し風を加えたり、より多くの砂を巻き上げたりするような微妙な変更の場合は、穏やかまたは微妙なリミックスを選びます。今回は強いリミックスを実行しましょう。
ジョーイ、あなたのストーリーボードを見てみましょうか。
ジョーイ:鶴がどうなったか見てみましょう。
ロハン:やりましょう。
ジョーイ:では、これらの1つをポップアップで見てみましょう。途中で鶴が水に頭を浸しているのがわかります。魚を捕まえたか見てみましょう。おっと、このでは失敗したようですね。これらの別のものも確認できますが、Soraが私の指示を受け取り、まさに行きたい場所を理解して、かなり良い仕事をしているのがわかります。
両方の鶴は失敗したかもしれません…あ、小さな魚を捕まえましたね。しかし、ここで指摘したいもう1つのことは、Soraの半分のストーリーは動画を編集して、その上に構築することです。この動画の始まり、鶴の頭が水しぶきを上げる瞬間が大好きなので、リカットと呼ばれる別の編集ツールを使用して、動画をトリミングし、さらに多くの指示でストーリーボードで拡張してみましょう。
リカットをクリックすると、新しいストーリーボードに移動し、Soraが鶴の動画をインポートしました。タイムラインで動画を確認でき、スクラブして確認することもできます。また、動画をトリミングすることもできます。実際に、頭が水に浸る瞬間までの最初の数秒が気に入っているので、それを使います。
他のストーリーボードの例と同様に、ここで空白にした部分は、そこにあるストーリーボードカードからSoraがシームレスに続けます。全く新しいエンディングが欲しい場合は、最後を空白にして作成を押すことができます。全く新しい始まりが欲しい場合、例えばこれをシーンの最後に配置したい場合は、これをここに置いておけば、始めの部分でカメラが鶴により長く留まるかもしれません。
また、真ん中に移動させて、動画の始まりと終わりを完全に新しく生成することもできます。ストーリーボードの残りの部分と同様に、常にクリックしてカードを追加し、より多くの指示を与えることができます。この動画に新しいエンディングを生成して、どうなるか見てみましょう。
ロハン:素晴らしい、ありがとうジョーイ。その間に、ロボットができているか見てみましょう。なんということでしょう、できました!驚くべきことです。ここでSoraは、ウーリーマンモスのような動きをするロボットを…そうですね、実際にすごくクールです。歩き方が素晴らしいですね。
つまり、Soraは「ウーリーマンモスをロボットに置き換える」という私たちのプロンプトを受け取り、まさにそれを実行しました。クリックすると、ここで元のものを見ることができます。これは強いリミックスで、ウーリーマンモスをロボットに置き換えました。かなり素晴らしいですね。
実際に他の機能もいくつか見てみましょう。ジョーイ、あなたの画像から動画への生成を見てみましょう。かなりクールですね、この灯台に素敵な雰囲気が出ています。右上のがとてもいいですね。ここでいくつかの異なるショットが得られ、異なるカメラの動きがあります。
見てわかるように、正確に何が欲しいかわからないかもしれません。画像を投げ込んでSoraに任せてみることができます。右下のこれが気に入りました。ループとして良さそうですね。私たちの素晴らしい機能の1つは、生成が本当に気に入った場合、Soraに「これを無限に繰り返してほしい」と伝えることができることです。とても美しいので、まさにそれをループで実現できます。
ループをクリックすると、このループの開始位置と終了位置をSoraに指示でき、Soraがギャップを埋めてこの種のシームレスな繰り返しシーンを作成します。ここにはいくつかのオプションがあります。始まりと終わりがすでにかなり似ている場合、Soraはより少ないフレームを追加することができます。あるいは、より異なる始まりと終わりを接続するために、より多くのフレームを追加するようSoraに指示することもできます。しかしSoraが重要な作業を行います。これは本当に素晴らしい機能です。私たちのアルファ版のアーティストの多くがループを愛用しています。
最後にもう1つ、簡単に別の機能に触れたいと思います。ブレンドです。ブレンドは、Soraに2つのシーンを与え、Soraがそれら両方の一貫性のある新しいシーンを作成すると考えることができます。それはほとんど、2つの動画を別の次元で一緒に混ぜ合わせ、この次元に戻してくるようなものです。私は私たちのモデルでブレンドを使うまで、このようなものを見たことがありませんでした。
ブレンドをクリックすると、ライブラリから別の動画を選ぶことができます。ロボットとウーリーマンモスをブレンドできますね、それはクールかもしれません。ここにはいくつかのオプションがありますが、今は詳しく説明しません。要するに、これら2つのシーンをどのようにブレンドしてほしいかをSoraに指示することができます。私たちのヘビーユーザーやパワーユーザーが多くの素晴らしいクリエイティブを作るための本当に素晴らしい高度な機能です。
サム:それをやってみましょうか?
ロハン:もちろん、これを実行できます。ウーリーマンモスとロボットにはトランジションBブレンドが良さそうですね。実行しましょう。
素晴らしい。まとめとして、特集フィードに戻りましょう。ジョーイが先ほどこれらの動画をスクロールしていたのを覚えているでしょう。下にストーリーボードがあるのを見たかもしれません。今ではそれが何かわかりますね。フィードの各生成を見て、どのように作られたのかを知ることができます。私はフィードが大好きです。なぜなら、インスピレーションを見つけて、他の人の動画の自分なりのリミックスを実行できるからです。
ジョーイ:インスピレーションに加えて、見ているだけでもとても魅力的です。人々が何を作っているのか、すごいですね。
ロハン:本当に驚くべきことです。
これがSoraです。これが端から端までのプロダクトです。皆さんが何を作るのか、そしてここにさらに機能を追加して、Soraでより素晴らしいことを行うのを見るのがとても楽しみです。サム、利用可能性について教えていただけますか?
サム:はい、これは今日、世界のほとんどの地域で公開されます。ただし、ヨーロッパのほとんどとイギリスは時間がかかります。そこでのローンチに最善を尽くしますが、まだ共有できる時間枠はありません。また、私たちが運営できない他の国もあります。
OpenAI Plusのサブスクリプションをお持ちの方は月50回の生成が可能です。OpenAI Proをお持ちの方は、遅いキューモードで無制限の生成が可能で、通常のより高速な生成は500回です。また、より高い解像度でより少ない生成を得ることもできます。そして、どのようなアカウントをお持ちの方でも、フィードを楽しむことができます。
皆さんが何を作り出すのか、本当に楽しみです。この種の新しいエンターテイメントとツールがどのように使用されるのか、すべての新しい方法を見るのが本当に楽しみです。皆さんはこれに対して信じられないほどの仕事をしました。チームを本当に誇りに思います。プロダクトが大好きです。最後に何か考えはありますか?
ロハン:はい、ジョーイと私はここにいる素晴らしいチームの代表に過ぎません。この信じられないほどのモデルを構築し、実際に世界に提供できる段階まで持ってきたリサーチチームに感謝したいと思います。そして私たちのプロダクトチームは、5、6人のプロダクトエンジニアのグループで、このプロダクト全体を数ヶ月で構築しました。そしてもちろん、この段階まで到達するためにサポートしてくれたOpenAIの大きな組織にも感謝します。
そして簡単に、乱用防止と安全性について、これは明らかに私たちのDNAの一部であり、OpenAIで本当に重視していることです。私たちはOpenAIとして大きなターゲットを背負っているので、Soraの違法な使用を防止したいと思います。しかし同時に、クリエイティブな表現とのバランスを取りたいと思います。これは継続的な課題になることを知っています。初日から完璧にはできないかもしれません。少し保守的に始めているので、私たちのモデレーションが完全に正しくない場合は、そのフィードバックをください。私たちは改善を重ねていきます。皆さんが何を作り出すのか、本当に本当に楽しみです。
ジョーイ、最後に何か考えはありますか?
ジョーイ:そうですね、私の最後の考えは、もしSoraにボタンを押すだけで長編映画を生成できると期待して来られるなら、それは間違った期待だと思います。Soraはツールです。一度に複数の場所にいることを可能にし、一度に複数のアイデアを試すことができ、これまで全く不可能だったことを試すことができます。しかし、本当に私たちが思うのは、それはその背後にいるクリエイターの拡張として非常に特別なものだということです。皆さんが何を作り出すのか楽しみで仕方ありません。フィードで見守っています。
サム:GPT-1のアナロジーに戻ると、これは初期段階です。まだまだ良くなります。しかし、私たちは初期段階のものを公開しても、人々が驚くべきパフォーマンスと実際の価値を引き出すことができることに常に驚かされてきました。今日後半のフィードで皆さんが何をするのか、楽しみでなりません。ありがとうございました。
コメント