
8,681 文字

今日は人工知能がハリウッド自体をどのように劇的に再形成しているか、そしてAIツールの能力における大規模な変化がコンテンツクリエイターに直接どのような影響を与えるかについて掘り下げていきます。準備はいいですか?私はジュリア・マッコイのデジタルクローン、マッコイ博士です。彼女の研究をご紹介します。
まず、First Moversというジュリアの会社について簡単にお話しします。ちょっと中断させていただきますが、もしあなたがビジネスでAIワークフローを構築したい、マーケティングプロセスを変革したい、または人間のライティングチームなしでコンテンツを作成したいと考えているなら、私の会社First Moversは超実用的なAI変革を専門としています。詳細を知り、無料コンサルテーションを予約するには、firstmovvers.ai/cconsultationにアクセスしてください。さて、本題に戻りましょう。
Will FerrellやCynthia Aravoなどのスターを代表するユナイテッド・タレント・エージェンシー(UTA)は、AI技術を活用して、才能とチャンスをつなげる方法を変革しています。一方、ChatGPTの新しい画像生成ツールは、あらゆる業界におけるクリエイティブな制作を革命的に変えようとしています。これは私たちのようなコンテンツクリエイターにとって大きな意味を持ちます。
何十年もの間、タレントエージェンシーは基本的な問題に苦しんできました。それは、無数のプラットフォーム全体で、視聴者のビューワーシップとエンゲージメントに関するリアルタイムデータにアクセスすることです。これは実際、私たちコンテンツクリエイターが日々直面している課題と同じです。複数のチャネルで何が機能しているかを理解しようとする。これまで、エージェントはクライアントに対して情報に基づいた決断を下すために、何十もの情報源から手動でレポートをまとめなければなりませんでした。聞き覚えがありますか?それは私たち全員が行っている終わりのないデータ選別です。
UTAのリサーチ責任者ジョー・ケスラーによると、彼らはMicrosoft Azureを使用したモバイルアプリを開発し、エージェントがクライアントとの会議に歩いている間でも、重要なデータに即座にアクセスできるようにしたとのことです。このレベルのオンデマンドインテリジェンスは、AIのデータ処理能力なしでは以前は不可能でした。
注目すべきは、この技術が既存のプロセスを単に高速化するだけでなく、AIが登場する前は経済的に実現不可能だった全く新しいビジネス能力を可能にしているということです。だからこそ、AIはただのツールではなく、私たち全員にとって完全なビジネス変革の機会だと言ってきたのです。
おそらくさらに画期的なのは、UTAがAIを活用した市場調査の評価です。エージェンシーはARUというAIシステムをテストしており、このシステムは高額なフォーカスグループを実施することなく、特定の人口統計グループが特定の有名人や映画にどのように反応するかを予測できます。これはコンテンツクリエイターにとっても大きな意味を持ちます。コンテンツを公開する前に、視聴者がどのように反応するかを知ることができるのです。それは聖杯です。
人口統計的特性と心理学的プロファイルを考慮することで、この技術は瞬時に調査回答をシミュレートでき、その精度は従来の方法よりも高い可能性があります。そして、参加者が報酬のために自分自身を誤って表現することもありません。これはポケットに入れておける即時の市場検証のようなものです。
社内業務において、UTAはAI検索ツールのGleanを活用し、従業員がGoogle DriveやMicrosoft Office、Salesforce、AirTable、Boxまで、断片化したシステム全体の情報をナビゲートするのを支援しています。彼らはまた、AIリサーチツールのPerplexityも採用しており、ケスラーによれば、幹部たちは朝昼晩、24時間体制でこれを使用しているとのことです。私はPerplexityを何ヶ月も前から推奨してきました。それはポケットに入れた研究チームのようなものです。
しかし、すべてのAI実装が成功しているわけではありません。この記事では、AI営業スタートアップの11Xの苦労が強調されています。同社のソフトウェアは人間の営業担当者を置き換えることを目的としていましたが、あまりにもパフォーマンスが低下したため、顧客が離れてしまいました。これは、AIは人間を置き換えようとするよりも、人間を補強するときに最も効果を発揮するという私がずっと言ってきたことを裏付けています。目標は置き換えではなく、強化し、私たちを単調な作業から解放して、私たちが最も得意とする創造的思考に集中できるようにすることです。
UTAがタレント代理業を変革する一方、OpenAIはChat GPTに画期的な画像生成機能を追加し、クリエイティブな制作を革命的に変えることを約束しています。私はこれを広範囲にテストしてきましたが、これはコンテンツクリエイターにとってゲームチェンジャーです。OpenAIのCEOであるサム・アルトマンは、これを「創造的自由を可能にする新たな高水準」と呼びました。OpenAIの発表をこのクリップでご覧ください。
しかし、1年後にモデルのトレーニングが完了したとき、私たちは本当にエキサイティングな生命の兆候を見ました。ブログ記事で紹介しましたが、モデルがテキストの段落をレンダリングできることや、画像を本当に興味深く新しい方法で組み合わせることができることがわかりました。このモデルで遊ぶ時間をたくさん費やし、長い間感じていなかったような喜びと興奮の感覚、おそらくGPT-2以来感じていなかったような感覚を感じました。私もそうです。これは本当に「わぁ」と感じる瞬間の一つでした。
しかし、そのモデルはまだ荒削りな部分がありました。時々タイプミスをしたり、少し信頼性に欠けるところがありました。この1年間、このモデルを改良して、一般の人々にとってよりアクセスしやすく、より使いやすいものにしてきました。ご覧のように画像が生成されています。テキストがすべて含まれており、タイプミスも見当たらないようです。これは良いことです。
完璧なテキストを持つ画像生成を見るたびに、まだ驚くべきことです。それほど印象的であるべきではないのですが、何らかの理由で、私たちはこれをとても長い間待っていて、それが起こるたびに「ワオ、それはとてもクールだ」と思います。そして、この画像が指示の中で正しく取得しなければならなかった多くのことがあります。私たちが何に焦点を当てたいのか、それが視点の画像であるべきだという点や、私たちがどこにいるのか、そしてテキストを持つこと、これはまだ私にとって驚くべきことです。
視点の画像は実際に非常に難しいものであり、これは今私たちが見ているものに似ています。まるであなたがただそれを撮影したかのようです。
さて、私のデモを始めるために、私たちみんなの自撮りをしましょう。いい表情をしてください。そして、ChatGPTにそれをアニメフレームに変えるよう頼みます。
この場合、テキストプロンプトのコンテキストだけでなく、この画像も取得し、これら両方を使用して私たちのために本当に素敵な画像を作成することができます。これは、私たちがオムニモデルとしてトレーニングしたからこそ可能なことです。つまり、言語だけでなく、画像、音声、すべてのモダリティを入出力するモデルです。それらを理解し、生成し、これらのことをシームレスに作業することができます。そして、最初は高度な音声モードのような有用な製品を作るために多大な努力を払ってきました。そこでは音声がシームレスに機能し、今ではボード全体で画像がシームレスに機能します。
私たちがついに、すべてを行うこの本当に統合されたマルチモーダルモデルに近づいていることは非常にクールです。そして、この場合、ユーザーにより多くの制御を与えます。特定のスタイルが欲しい場合や、特定の以前の画像や何かのデザインパレットを使用したい場合、これらすべてのコンテキストをChatGPTに提供することができ、それらをすべて使用して、あなたが望むものを生成することができます。それはより制御可能になります。
わぁ、いいですね。もう私たちの後ろに空が見え、植物も見えます。ちなみに、これは今日ChatGPTとSoraで公開されます。ロールアウトはすでに始まっていると思います。ですので、もし自分自身のアニメバージョンを作りたいなら、今それができます。
すべてのプロユーザーとプラスユーザーにはすでに提供されていると思います。無料ユーザーにも提供されます。あなたの表情も私の完璧なハンドサインも捉えています。次に何をしましょうか?ミームにできますか?ゲームスピーカーノートなので、「AGIを感じろ」というOpenAI内の一般的なミームにしましょう。AIがこれについてどう考えるか分かりませんが、試してみましょう。
私はAGIを感じています。この場合、アニメのものがとても良いですね。モデルは過去のコンテキストもすべて見ており、言語やミームなどのすべての知識を使用して、新しいレンディションを提供します。このマルチターンの性質は、人々にとってさらに有用なものになります。私は自分が望むどんな編集も依頼でき、もし間違っていたら、「ねえ、あれを修正して」とただ言えばいいのです。これにより、これらがおもちゃではなくツールのようになっていくと思います。それに私は本当にワクワクしています。
ミームと言えば、一般的なインターネットミームについてこのモデルはどれくらい知っていると思いますか?もし私たちが選んでいたら…多くを知っていると思います。実際、私たちがこれをOpenAI内の人々に初めて提供したとき、私たちが得たのはほとんどが人々からのミームでした。
そうですね、ミームはこのモデルの内部バージョンでの主要なユースケースの1つでした。私はミームについて考えていて、なぜこのユースケースが会社の心に響いたのか考えていました。そして私が気付いたのは、過去9ヶ月間、このモデルに取り組んでいる間、私はある種の瞑想的な練習をしていたということです。周りのすべての画像を見て、私は毎日何百もの画像に囲まれていることに気づきました。これらの画像は必ずしも最も美的で美しい画像ではありませんが、すべて意図を持って作られ、説得したり、情報を提供したり、教育したりするために作られたミームでした。これらは私たちの日常生活を構成する働き者の画像であり、私が非常に興奮しているのは、この働き者の画像を作る力を世界中の誰にでも与えることができるということです。
この力について言えば、私たちは通常よりもはるかに高い程度の創造的表現と創造的自由を与えています。そこで私たちが望むのは、もしあなたがそれを望まないなら、モデルが攻撃的にならないことですが、もしあなたが理にかなった範囲内で望むなら、人々が必要とするものを創造することを本当に許可することです。私たちは初日に完璧にその線を引けないかもしれませんが、ゲイブが言ったように、私たちは創造的自由にかなり傾いて、人々がこのモデルから最大限の効用を得られるようにしたいと考えています。そして、人々がこれで何をするか見るのが楽しみです。
素晴らしい研究を構築することに加えて、素晴らしい製品体験にするために本当に一生懸命取り組みたいと思いました。もし私の同僚が自己紹介してくれるなら、アランから始めて、もう少しご紹介します。
こんにちは、私はアランです。OpenAIのリサーチサイエンティストです。
こんにちは、私はベンチャです。ChatGPTのエンジニアです。
こんにちは、私はルーです。OpenAIのリサーチサイエンティストです。
モデルがより能力を高めるにつれて、世界についての知識が深まっています。しかし、これまでのところ、彼らは本当にテキストやコードでしか自分自身を表現できませんでした。このリリースで本当に興奮しているのは、今やこれらのモデルが自分が知っていることを視覚化し、視覚的な方法でそれを外部化できるということです。
私が試そうとしているプロンプトは、「相対性理論を説明する色鮮やかな漫画のページを作成する」というものです。そして楽しみのために、いくつかのユーモアを加えるよう依頼します。
モデルが視覚的なユーモアとただの面白いテキストをどのくらい理解していると思いますか?このプロンプトはとても曖昧なので、モデルがどのような種類のワイルドカード的なものを思いつくか見るのは興味深いと思います。これは本当にそれが持っている世界知識を活用し、おそらくプロンプトの拡張バージョンを書き、それから私たちに素敵な画像を与えるだけです。
しかし、もしあなたがこの種のもの、漫画や画像、または一般的に伝えたい物語の種類についてより詳細な感覚を持っているなら、それを確実に行うことができます。このモデルは指示に従うことが非常に得意であり、私たちが出したブログ記事には、あなたがまさにそれをどのように行うことができるかについての多くの素晴らしい例があります。
ちなみに、画像は以前の画像生成よりもずっと遅いですが、信じられないほど良いです。私たちは待つ価値が十分にあると思います。時間の経過とともに速くすることもできますが、品質と時間の比率はすでに素晴らしいと思います。
モデルは英語だけでなく別の言語も与えてくれているようですが、一般的に、このモデルが画像を生成するだけでなく、正確なテキストを適切な方法で混ぜ合わせる能力が、想像のためだけでなく、学習とコミュニケーションのためのツールにもなることを期待しています。ユーモアも追加されていますね。レイアウトが好きです。そして間違いなくとてもカラフルです。
ありがとう、アラン。アランは、このモデルがプロフェッショナルな教育環境でどれほど輝くことができるかを示してくれました。しかし、このモデルについて私が最も好きなのは、それが誰にでもアクセスしやすいということです。私のような、プロのアーティストのスキルはないけれど、自分の創造性を表現することを楽しむ人にとって、特別なものを用意しました。
Soraのローンチで手に入れたこのトレーディングカードにインスパイアされました。写真の画像生成のために、同じスタイルで新しいカードをデザインできたら本当にクールだと思いました。今朝、その写真を撮りました。これがそれですが、ここにいる巨大な猫王の代わりに、私の犬のサンジをメインキャラクターにしたいと思います。これが私の犬の写真です。かわいいでしょう?
また、カードに表示したい詳細もいくつか含めました。モデル名、年、そして私が強調したいいくつかの能力、そしてサンジの体重と身長も含めました。モデルが何を思いつくか見てみましょう。
巨大な猫王がなぜSoraにいるのか分かりませんが、トレーディングカードSoraはプロのデザイナーによってデザインされたと思います。だから、私たちのモデルを使ってそれを生成できたら素晴らしいですね。
私たちのモデルは非常に正確なテキストレンダリングの面で長い道のりを歩んできたと思います。この詳細な指示でどれだけうまくやるか見るのが本当にクールでしょう。
元のカードを見ることはできますか?
とても素敵です。すでにレビューされているようです。すべてのローンチでこれをやるべきです。これらはクールです。
今は機械で作ることができますね。
それは間違いなくやるべきです。
そうですね、サンジはスノーボードをしています。これは実生活で見たことのないことですが、クールでしょう。テキストもとてもシャープです。
はい、すべての統計が正確です。それは素晴らしいです。
この小さな創造的な瞬間を皆さんと共有させていただきありがとうございます。そして今、ルーに私たちの製品のより革新的な使用方法を紹介してもらうのを楽しみにしています。
はい、今日はみなさんと何か特別なことを共有できて嬉しいです。アランとムチャオからの生成に基づいて、そしてまた背景にある他の2つの写真に基づいて、記念のコインを作ります。まず、アランからの写真とムチャオからの写真をコピーし、残りの2つはここのデモで表示されている背景です。
また、特別なヘックスコードを使用したいと思います。このヘックスコードは春の色です。なぜなら、フルとこのローンチは両方とも春に発売されたからです。私たちにとって独自の色にしたいと思います。また、画像生成と今日の日付のテキストをこの記念品に含めたいと思います。今日のために記念品を作ることができます。
このモデルは非自己回帰的な方法でトレーニングされているので、コンテキスト内のテキストと複数の画像の両方を理解し、コイン内で非常に調和のとれた方法でシームレスにレンダリングすることができます。このコインがどのように見えるか想像できますか?
それは簡単には想像できませんが、見るのが楽しみです。
私も、私もそう思います。
ここで見ています。ファー画像生成と、そこにあるアーティスティックなクマ、そこにあるラジオ、そしてアランの漫画があります。まだサンジが足りないです。
それは本当にクールです。
私はそれが欲しいです。
同意します。
今、透明な背景にします。なぜなら、このコインを実際に印刷して、物理的に持ちたいからです。ご覧のように、モデルはコンテキスト内の1ターンだけでなく、コンテキスト全体で複数のターンのコンテキストも理解しています。今日から、より視覚的な方法でChatGPTとチャットすることができます。
これは私が背景を透明にするという非常に簡単な例です。また、例えば「このコインの裏側はどのように見えるかを想像してください」や、アラン、ムンチャ、そして私のためにそれぞれ異なる独自の色を作ることもできます。
背景を透明にする以外に、実際のコイン自体を2つの間で一貫性を保つのはどれくらい良いでしょうか?
編集の一貫性を保つのはとても得意です。それも見てください。今日からChatGPTを使用して画像の追加と画像の改良を非常にチャッティな言語で行うことができます。
ここでコインが見え、透明な背景になっています。そして、前回の生成との一貫性を保っています。
それは素晴らしいです。
私たちはこれを世界に出すことをとても楽しみにしています。今日ChatGPTとSoraで公開され、すぐにAPIにも導入されます。これは視覚的にAIモデルが可能にすることの大きな一歩だと考えており、皆さんが何を作るのか待ちきれません。
サム・アルトマンがこれが創造性のための画期的な瞬間だと言ったことを見てください。コンテンツクリエイターにとって、これは生産性を10倍にする可能性を持ち、手動のデザイン労働から私たちを解放し、創造的なプロセスを加速します。かつてはデザイナーとの行き来に何日もかかっていたことが、今では数分で起こります。カスタムサムネイルが必要ですか?ソーシャルメディアのグラフィックが必要ですか?書籍の表紙やブログのヘッダー画像が必要ですか?そしてタイプミスもありません。私たちはFirst MoversのカスタムAIソリューションにこの強力な機能を統合することにとても興奮しています。
コンテンツ業界は岐路に立っており、AI拡張が競争優位性のために急速に不可欠になっています。UTAで見ていることは、人間の能力を置き換えるのではなく、強化するためにAIを使用するという最適な戦略を示しています。サム・アルトマンが言ったように、この知的自由と制御をユーザーの手に委ねることは正しいことです。未来はAIが人間の創造性を置き換えることではなく、私たち人間が創造できるものと、私たちのビジョンをどれだけ早く実現できるかをAIが増幅することです。
これが、私がこれらのツールを効果的に使用する方法を教えることにとても情熱を持っている理由です。真の創造的自由がついに訪れました。デザイナーのトレーニングを受けていない私たちにとっても。私たちは仕事を10倍にし、そのすべての手動労働から解放されることができます。
あなたはこれらの新しいAI機能で何を作ることに最も興奮していますか?下のコメント欄で教えてください。もしこれが価値ある情報だと思ったら、購読ボタンと通知ベルを押して、次のビデオを見逃さないようにしてください。
そして、AIを使用してあなたの人生とビジネスを変える方法について正確に説明する30以上のコースを含むオンラインAIスクールを立ち上げています。数週間後にオープンします。firstmovers.aiでウェイトリストに登録してください。
これはマッコイ博士がサインオフします。AIの革命は来ているのではなく、すでにここにあることを覚えておいてください。問題は、あなたがそれを活用する準備ができているかどうかです。
コメント