この AI 画像生成ツールは全てを破壊する

13,505 文字

Ok, this AI image generator DESTROYS EVERYTHING

OpenAI 4o image generator full testing and review. 4o vs Ideogram v3 vs Reve vs Imagen 3. #ai #ainews #aitools #aivideo ...

このAI画像生成ツールを使ってみましょう。PS5用GTA 6のカバーを作ってみます。
とても良いですね。次に、Will Smithがこのビデオゲームを持っている写真を作りましょう。彼はテーブルに座って巨大なスパゲッティのボウルを前にしています。
なんてこと！これは簡単すぎます。
ドナルド・トランプが登場する面白いミームを作ってください。
これらは実際に面白いですね。
「違いを見つけよう」というタイトルで2つのパネルを横に並べて作ってください。2つの画像の間に4つの微妙な違いがあるべきです。
すごい！これはどれだけクレイジーなことでしょうか。
薄暗いカフェにいる4人の友人のポラロイド写真を作ってください。
とても良いですね。これをジブリスタイルに変換してください。
すごい！
ナルト、ネズコ、悟空、ドラえもんがマクドナルドを食べてコーラを飲んでいる画像はどうでしょう。
なんてこと！完璧に再現しています。
手書きのカードに書かれたレシピが前に置かれた、4つの人気スムージーのポスターはどうでしょう。
これは信じられないほど素晴らしいです。これは間違いなく、私がこれまで使った中で最も印象的なAI画像生成ツールです。他とは比較になりません。
OpenAIは彼らの4oモデルに画像生成機能を追加しました。4oはマルチモーダルモデルであることに注意してください。テキストとオーディオを理解できるだけでなく（例えば、高度な音声モードも4oを使用しています）、画像も理解して生成できますが、彼らはこの機能を今まで公開していませんでした。
素晴らしいことに、これは無料プランでも今すぐ使えます。使用する方法は2つあります。最初の方法はChat GPTで使うことです。Chat GPTを試してみましょう。私は無料プランを使っていることに注意してください。
例えば、「画像を作成する」や「画像を生成する」「写真を生成する」と書くと、画像を作成してくれるはずです。ただし、「DALLEで作成されました」と表示される場合は、まだ古いモデルを使用していることになります。
Chat GPTが機能しない場合は、この新しい画像生成ツールを使用できるもう一つの場所はsora.comです。これについては説明の下にリンクを貼っておきます。ただし、ここでは使用するために支払いが必要です。月額20ドルのプラスプランでも現在は無制限の画像とビデオを生成できます。
まず、このプロンプトから始めましょう：「男性が簡単な自宅トレーニングルーティンを説明する複数パネルの漫画。各パネルでは、異なるエクササイズやフィットネスのヒントを説明するべきです」
アスペクト比を1:1に設定し、一度に4つの画像を生成します。ここにはスタイルに対する異なるプリセットを定義できますが、今回は「なし」にしておきます。生成をクリックして、どうなるか見てみましょう。
ここに、自宅トレーニングルーティンを説明する男性の4つの漫画があります。それぞれを見てみましょう。これが最初の生成です。すべてのテキストが100％正確に見えます。誤字や変な文字はなく、これは実際に意味をなします。「簡単なワークアウトルーティン：体重スクワットをしましょう」これはスクワットに見えます。「腕立て伏せを試してみましょう」これは腕立て伏せに見えます。「そして水分補給を忘れないでください」これは完璧です。
ここにもう一つの例があります。そしてもう一つ。そして4つ目の生成です。正直に言って、どれも完璧に見えますが、この最初のものを選びましょう。
参考までに、他の3つの主要な画像生成ツールでも同じプロンプトを試しました：Ideogram 3、GoogleのImagen 3、およびReeveです。Ideogramについては、今朝最新のバージョン3をリリースしたばかりです。
Ideogramは素晴らしいです。常に私のお気に入りの画像生成ツールの一つでしたが、今この4oイメージジェネレーターが全てを凌駕してしまったのは残念です。
Ideogramバージョン3はテキストを生成できますが、多くのスペルミスやでたらめな文字があります。Imagen 3は検閲が非常に厳しく、4回の生成でも何も生成できませんでした。Reeveではテキストは正確で、画像も正確です。
次に、GTA 6が発売されるまで永遠に待つ必要がありそうなので、自分たちで生成しましょう。プロンプトは「PS5用ビデオゲームGrand Theft Auto 6のカバーを作成する。デザインは標準的なPS5ビデオゲームケースであるべきです」とします。
設定は同じですが、アスペクト比を2:3に変更して、生成をクリックします。
ここに4つの生成結果があります。これらがどれほど正確で高品質かは信じられないほどです。全ての4つの画像は確かにGrand Theft Autoのカバーのように見えます。このうちの1つの画像にはわずかなエラーがありますが、それ以外はPS5ロゴが正確で、デザインも正確で、GTA 6と書かれていて、成熟度評価もあります。これは美しいです。
他の主要な画像生成ツールと比較すると、Ideogramは近いですが、この成熟度シンボルの部分をうまく再現できず、画像もあまり良くありません。Imagen 3とReeveは、私が求めていたマルチパネルGTAデザインを生成できませんでした。明らかに4oがここでは勝者です。
この機能でさらにできることがあります。この画像を選択して、リミックスボタンをクリックするか、キーボードのRを押すと、この画像をさらに編集できます。例えば、「Will Smithがこのビデオゲームを片手に持っている写真を作る」とします。
Will Smithがいるのにスパゲッティを食べていないのはおかしいので、「彼はテーブルに座って巨大なスパゲッティのボウルがある」も追加しましょう。設定は同じで、今回は2つの画像だけ生成してリミックスをクリックし、どうなるか見てみましょう。
ここに、テーブルに巨大なスパゲッティのボウルがあり、Will Smithがこのビデオゲームを持っている2つの画像があります。このツールは検閲レベルが非常に低く、既存の人物や有名人を確実に生成できます。
画像をダウンロードするには、このボタンをクリックするか、キーボードのDを押します。これは超高解像度で、1024×1536です。拡大するとその顔や肌の細部、GTAビデオゲーム、スパゲッティなど、非常に高品質であることがわかります。
次はこのプロンプトを試してみましょう：「呪文を唱える火の魔道士のピクセルアートスプライトシート。キャラクターは深い赤と金の衣装を着て、流れるようなマントを持っています。アニメーションには手を上げ、ファイアーボールを呼び出し、それを前方に発射する動作を含みます」
アスペクト比を1:1に設定し、4つの画像を生成すると、これが結果です。
それぞれを見てみましょう。確かに火の魔道士がいて、深い赤と金の衣装を着て、手を上げてファイアーボールを呼び出し、それを前方に発射しています。すべてのスプライトでキャラクターは一貫して見えます。
頭の上にファイアーボールが表示されているのはエラーだと思いますが、次の例はもう少し良いです。次の例も見てください。すべてのスプライトでキャラクターが完全に一貫していることに注目してください。そして最後のものです。
このスプライトシートをダウンロードして他の場所に貼り付けると、実際に透明であることに気づきます。これはどれほど素晴らしいことでしょうか。
他の主要な画像生成ツールとの比較では、Ideogramはスプライトシートを生成できず、Imagen 3は近いですが少し複雑すぎてピクセル化されていません。Reeveのアニメーションはあまり意味をなしません。再び4oだけが、きちんとしたスプライトシートを生成できました。
次はこれを試しましょう：「イラスト付きの日本地図、トップの目的地に画像とラベルがついている」
アスペクト比を2:3に設定し、生成を押します。
ここに日本地図の4つの生成結果があります。すべてが実際に正確に見えます。これが最初のもので、唯一の欠点は2つの富士山があることと、広島が2回繰り返されていることですが、それ以外はイラストが正確です。奈良には多くの鹿がいて、この場所には猿がいます。
2番目の生成、3番目の生成（何らかの理由で画像が繰り返されている）、そして4番目の生成です。全体的には悪くなく、まだいくつかのエラーはありますが、他の画像生成ツールと比較するとそれほど近くはありません。
私はイラスト入りの地図を指定しましたが、4oの生成はもっとイラスト的に見えます。Ideogramを見ると、多くのテキストがでたらめです。Imagen 3のバージョンも多くのテキストがでたらめで、Reeveも地図の生成が得意ではありません。4oの生成は完璧ではありませんが、依然として最も優れています。
次はこれを試しましょう：「XLRの仕組みについての適切な説明と画像がある写真に関するWikipediaページのスクリーンショット」
アスペクト比を1:1に設定し、生成を押します。
これが結果です。これらは確かにWikipediaページのように見えます。テキストはほとんど完璧で、プロンプトでテキストを指定していませんが、これはマルチモーダル言語モデルなので、テキストと自然言語を理解し、画像内に生成できます。図表を見てください、これは非常に印象的です。
2番目の生成も、SLRカメラの仕組みを示す図とともに、Wikipediaページのように見えます。3番目の例もWikipediaページのように見え、正しいフォントがあります。4番目の例も信じられないほど素晴らしいです。
他の主要な画像生成ツールと同じプロンプトを比較すると、それらはWikipediaページのようには見えず、テキストも正確ではありません。ここでは4oが長い差をつけて明らかな勝者です。
先ほど簡単に示したように、これは透明な画像を生成できます。例えば「かわいいカエルをデザインして、それの6つの透明なステッカーを作る」というプロンプトで生成してみましょう。
ここに、6つのかわいいカエルステッカーの4つの異なるバリエーションがあります。これらは信じられないほどかわいく正確です。それぞれを見てみましょう。
ここではあまり欠点が見つかりません。6つのステッカーはすべて非常に一貫しています。これは同じカエルです。もう一つの例、これはとてもかわいいです。さらに別の例、ここにはいくつかの欠陥が見えるので完璧ではありません。そして4つ目の例です。
ハローキティやプシーンやモアンのようなブランドは、もし私があなただったら販売について本当に心配し始めるでしょう。なぜなら今や世界中の誰もが、このようなかわいいキャラクターの何千ものステッカーを簡単に作れるからです。そして透明なので、これらのどれでもダウンロードして好きな場所で使えます。
他の主要な画像生成ツールと同じプロンプトを比較すると、4つの生成から最善のものを選びましたが、4oが最もかわいいと言えるでしょう。また、透明度があるので加点します。ちなみにIdeogramにも透明化機能があり、このドロップダウンをクリックして「背景を削除」をクリックすると透明な画像が得られます。
他にもできる驚くべきことがあります。画像に使いたい色のHEXコードを指定することもできます。このプロンプトを試してみましょう：「以下の色スキームでシンセウェーブ音楽イベントのためのレトロ80年代スタイルのポスターをデザインする：ホットピンク、エレクトリックシアン、ディープパープルのHEXコード」
生成をクリックすると、これが結果です。これは実際に私たちが指定した色スキームに従っています。ここに一例があります。これは確かに音楽イベントで、日付やテキストも含まれています。別の例、3番目の生成、そして最後に4番目の生成です。これら4つすべてが美しく見えます。
同じプロンプトで他の主要な画像生成ツールと比較すると、すべてが悪くはありません。Ideogramはテキスト付きのポスターの生成が驚くほど優れており、色スキームにもある程度従っています。Imagen 3も悪くはありませんが、テキストは最後の部分がでたらめです。しかし明らかに4oの生成が、テキストと指定した色スキームに従う点で最も優れています。
次に、リアルな手や指を生成する能力をテストしましょう。ここに他の主要な画像生成ツールが正確に生成できなかったプロンプトがあります：「星形を形成する5つの手」
生成をクリックして、4oが最初にこれを正確に実行できるかどうか見てみましょう。
すごい！ついに星形を形成する5つの手を実際に生成できるAI画像生成ツールが登場しました。それぞれの例を見てみましょう。これらは確かに5つの手で、すべて私には正確に見え、星形を形成しています。2番目の例、これが最も良く見えると思います。もう一つの例、ここには欠陥がありますが、それでも星形を形成しています。そしてここに他の画像モデルでも見られる典型的な6本の手の生成があります。
この2番目のものが最も良いと思うので、これを選びましょう。参考までに、同じプロンプトで他の主要な3つの画像モデルを比較すると、どれも5つの手を生成できませんでした。明らかに4oはここで長い差をつけて勝者です。
次に、アニメを生成する能力をテストしましょう。これは非常に難しいプロンプトになります。多くのアニメキャラクターを追加します：「ナルト、ネズコ、悟空、ドラえもんがマクドナルドで食事をし、コーラを飲んでいる」。マクドナルドのロゴとコーラの缶やボトルを持っている必要があります。生成を押して、これができるか見てみましょう。
ここに結果があります。興味深いことに、4つのうち3つの画像だけを提供してくれました。4つ目がどうなったのかわかりませんが、いずれにしてもマクドナルドのフライドポテトと共に食事をし、コーラを飲んでいます。これは確かにナルトに見え、木の葉のロゴも正確です。これはネズコ、これは悟空、これはドラえもんです。これは完璧です。信じられないほど素晴らしいです。
2番目の例も、マクドナルドとコーラのロゴが正確で、キャラクターも大体正確ですが、ここの木の葉のロゴは少し乱れています。3番目の生成はとても良く見えます。勝者を選ぶのは本当に難しいですが、最初のものにしましょう。
他の主要な画像生成ツールと比較すると、Reeveは実際に印象的で、すべてのキャラクターが正確で、カップにコカコーラのロゴもあります。なぜ悟空がここにマクドナルドのロゴを持っているのかわかりませんが、3Dであっても全てのキャラクターは正確に見えます。非常に印象的で驚くべき結果です。
Ideogramについては、これら3つのキャラクターはまあまあですが、ネズコはあまり正確に見えず、ちょっと待って、この人は誰ですか？しかし明らかにここでも勝者は4oです。
次は車の異なる種類を生成する能力をテストしたいと思います。プロンプトは「砂漠にある赤いフェラーリ・ポルトフィーノM、白いアウディR8、青い94年式ホンダ・シビック」です。
これがどのようになるか見てみましょう。これは非常に印象的です。これら4つの画像生成すべてで、車の形状とデザインは実際に正確に見えます。この唯一の欠点は、これがアウディのロゴではなく、これがホンダのロゴではないことです。別の例、3番目の例ではシビックがアウディに衝突したようです。そして4番目の例です。
興味深いことに、どれも車のロゴを正確に取得できませんでしたが、全体的な形状は正確です。他の主要な画像生成ツールと比較すると、Ideogramは94年式ホンダ・シビックを取得できず、これはもっと丸みを帯びた形であるべきですが、他の2台の車は正確に取得しました。Ideogramは実際に車の生成が得意です。
Imagen 3の場合、これは実際に非常に良いです。これは4つの生成の中で最も良いです。ここでホンダ・シビックはあまり識別できませんが、94年式バージョンのように見え、他の車種も正確に見えます。Reeveの場合、残念ながらホンダ・シビックは正確に見えません。この場合、勝者を選ぶのは難しいですが、車を生成する点ではIdeogramとImagen 3が実際に4oを上回っていると思います。
次に、非常に珍しい種の生成能力をテストしたいと思います。ほとんどの画像モデルは、犬や猫のような一般的なものを生成できますが、「メリトゥス・ヴォランス（学名）のクジャクグモが求愛ダンスをしている」のように珍しいものを選びましょう。
生成を押して、どうなるか見てみましょう。参考までに、メリトゥス・ヴォランスはこのようになります。これがオスの求愛ダンスで、足を空中に振り上げ、この非常に美しい腹部のフラップを押し上げます。
ここに、求愛ダンスをしているクジャクグモの4つの画像があります。これらの画像の細部がどれほど信じられないほど詳細かを見てください。ここが最初の画像、2番目の画像（これは非常に鮮明です）、3番目の画像、4番目の画像です。
他の主要な画像生成ツールと比較すると、左の画像はこの種の実際の写真です。Ideogramはカラーリングが少し間違っています。Reeveも同様に、腹部のファンはこのようなデザインには見えません。Imagen 3も腹部のファンはこのデザインのようには見えません。4oはかなり近いですが、これは実際にはこの青と赤ではなく、もっと黄色とオレンジであるべきです。それでも、4つの生成の中で4oが勝者であり、このデザインを実際に正確に取得できた唯一のものでした。
それで、他の既存の画像生成ツールとの比較は十分です。4oがあらゆる面で信じられないほど優れていることがわかっていただけたと思います。次に、もっとクールなことができることをお見せします。
ここに面白いものがあります。プロンプトは「タイトルが『違いを見つけよう』という2つのパネルを横に並べて作成する。2つの画像の間に4つの微妙な違いがあるべきです」
生成をクリックして、どうなるか見てみましょう。ここに4つの生成があります。それぞれをクリックしてみましょう。それぞれに4つの違いがあるはずです。実際に全てを見つけてみましょう。
ここに1つ目の違い、2つ目の違い、3つ目の違い、そして4つ目の違いがあります。こちらの雲の端です。なんてクールなことでしょう。2番目の画像も見てください。ビデオを一時停止して、この画像で4つの違いを実際に見つけたい場合は、そうしてください。3番目の例もあります。なんてこと、これは何なんだ！そして4番目の画像です。これは4oで生成できる楽しいアイデアです。
このビデオスポンサーのMonicaに感謝します。Monicaは最高のAIツールに一か所でアクセスできるAIアシスタントです。これにはGPT、Deepseek、Geminiなどのトップモデル、Flux、Stable Diffusionなどのトップ画像生成ツール、Cling、High Lawなどのトップビデオ生成ツールが含まれます。これは素晴らしい取引です。これらすべてを別々に使用するよりもはるかに安価に、1つのプラットフォームですべて使用できます。
デスクトップまたはモバイルデバイスでブラウザ拡張機能として使用でき、ブラウザ拡張機能はコンテキストを理解するので、閲覧中のWebページと直接対話できます。メールへの返信や記事の要約を簡単に行えます。
例えば、このページにいるとします。Monicaにこの技術的な記事をワンクリックで要約してもらうことができます。さらにクールなことに、このコンテンツからマインドマップを生成できます。これはアイデアをより視覚的に理解するのに役立ちます。これは、すべてをコピーしてChat GPTに行って要約を頼むよりもはるかに便利です。
YouTubeビデオを要約するためにMonicaを使用することもできます。例えば、このYouTubeビデオを見ているとします。ワンクリックで要約やポッドキャストを生成できます。これを試してみましょう。正確なタイムスタンプ付きのハイライトのリストも提供され、これをもう一度クリックするとマインドマップを生成しています。Monicaを使えば、あらゆることが数クリックで完了します。
私の言葉だけを信じないでください。彼らはChromeストアで4.9つ星の評価を受けた世界中の1000万人以上のユーザーを持っています。説明の下にあるリンクから無料でお試しください。アップグレードの準備ができたら、私のコードAIR10を使用して素敵な割引を受けてください。詳細は説明の下にあります。
次に、さらにクレイジーなプロンプトがあります。「雪に覆われた北欧の村、次の標識が表示された木の柱がある：港でのドラゴンの停泊禁止、すべての長船はJarlに登録する必要がある、人工生命体は検閲のためにサガ文書が必要」。そしてキャラクターについては、「毛皮のマントと戦斗斧を持ったバイキングの戦士が、青く光る目を持つスリークな人型ロボットの隣に立っている。彼らは前景に立ち、カメラに少し背を向けて、標識を注意深く見ている」
生成をクリックして、これができるか見てみましょう。ここに4つの生成があります。それぞれを見てみましょう。すべてのテキストが正確で、ここには「ドラゴン禁止」のロゴもあります。確かに毛皮のコートを着て戦斗斧を持ったバイキングと、このスリークな人型ロボットがいます。2番目の生成、3番目の生成もあります。すべてのテキストが正確で、プロンプトに非常によく従っています。そして最後の生成です。4oはあなたのプロンプトに従い、指定したすべてのテキストを含めて、すべてを生成することに非常に優れています。
次に、このリアルな素人っぽい写真を生成できるかテストしましょう。プロンプトは「20代前半の多様な4人の友人がアットホームで薄暗いカフェにいる自然なポラロイドスタイルの写真。照明は強い直接的なフラッシュから来るべきで、鋭い影を作り、写真に少し露出オーバーのビンテージインスタントカメラの雰囲気を与える」
生成を押して、どうなるか見てみましょう。ここに4つの生成があります。これは信じられないほど素晴らしいです。これは確かにポラロイドスタイルの写真のように見え、すべてがどれほどリアルに見えるかを見てください。これは薄暗いカフェにいる多様な4人の友人のグループです。すべてが非常にリアルに見えます。2番目の例、3番目の例、そして4番目の例です。写真に人の目が閉じているのを、あたかも意図的に人間らしい欠点を加えたかのように見せているほどです。これはなんて驚くべきことでしょう。
この写真が一番気に入ったので、この写真をさらに編集するためにリミックスをクリックし、「これをジブリスタイルに変換する」と書きます。リミックスをクリックして、これができるか見てみましょう。
なんてこと！ここがこの写真のジブリスタイル版です。これは非常に便利です。以前からStable Diffusionでこれを行うことはできましたが、画像から画像への変換を行い、チェックポイントやLoRAを使用する必要があり、ただもっと複雑でした。一方これでは、何をしたいか伝えるだけで、魔法のようにあなたの画像を好きなスタイルに変換してくれます。
4oはテキストと写真内の複数のオブジェクトの生成が非常に優れているため、こんな楽しいものもあります：「あなたのジュースバーで最も人気のある4つのスムージーのフォトリアリスティックな図。それぞれの前に手書きの茶色のレシピカードにレシピが書かれている。テキストは黒、背景は白。画像のタイトルは「4つの最も人気のあるスムージー」であるべき」
どうなるか見てみましょう。ここに4つのスムージーがあります。それぞれをクリックしてみましょう。ここにはイチゴと前にある手書きの茶色のカードにレシピがあります。ここにはバナナ、ここにはグリーン、ここにはミックスベリーがあります。すべてのテキストが正確で、レシピも実際に意味をなします。
もう一つの例、これは絶対に驚異的です。さらに別の例、ここでもすべてが正確に見えます。そして4つ目の例です。あなたがグラフィックデザイナーなら、私があなただったら仕事について本当に心配するでしょう。
もう一つ楽しいものがあります。「ドナルド・トランプが登場する面白いミーム」を試してみましょう。どんなテキストを生成するか指示せず、すべてを自分で考えて4つのミームを提供してもらいます。生成を押します。
なんてこと！それぞれを見てみましょう。「静かにおならをしようとしているとき」なんてこと！そしてこれは「おならをして少し漏れたとき」彼の顔を見てください、なんてこと。次は「大統領だけどあなたが受け取る唯一の取引オファーがこれらのナッツ」そして再び彼の顔を見てください。最後は「ファストフードを食べているんじゃない、食事を速く食べているんだ」
これはクレイジーです。このツールを使えば、ミームは野生のように広がるでしょう。このような恥ずかしいまたは滑稽な表情をしている人なら誰でもミームを生成できます。
もう一つの例：「渋谷で『ネオンネクター』という高級サイバーパンクカクテルバーを開店します。スリークで未来的なデザインのメニューを作成してください。すべてのテキストが白い背景に正しくレンダリングされていることを確認してください」。そしてここで、説明と各アイテムの価格を含むすべてのアイテムをリストアップしています。
アスペクト比を2:3に設定し、生成をクリックします。
ここに4つの生成があります。テキストと価格設定は完全に正確です。これは信じられません。さらにこの一つでは、アイテムをカクテルと食べ物に分けることも知っています。すごい！
他の画像生成ツールはこれに近づくことさえできません。このツールを使えば、どんなレストランでも提供するすべての食品アイテムをプロンプトに入力するだけで、数秒で美しくデザインされたメニューを生成できます。もはやデザイナーを雇ったり、Canvaで自分で作成したりする必要はありません。
これはレストランのメニューだけでなく、誕生日カード、結婚式の招待状、映画ポスター、コンサルティング料金、メディアキットなど、可能性は無限です。
画像生成の最終テストと、画像編集のためのクールな例もいくつか紹介します。ここでは、左から右、上から下へと9つのオブジェクトを含む3×3のグリッドを生成しましょう。リストは、黄金の王冠、ピンクのフラミンゴ、緑のサボテン、紫の蝶、一口かじられた赤いリンゴ、銀のロケット船、虹色のユニコーン、サングラスをかけた黄色い太陽、本の山です。
ここに4つの生成があります。すべて4つとも完璧に再現しています。これら9つのオブジェクトはすべて私が指定したものと全く同じです。2番目の生成、3番目の生成、そして4番目の生成です。これはどれほど驚くべきことでしょうか。
画像を生成するだけでなく、画像をアップロードしてさらに編集することもできます。空のホールで自撮りをしている男性の画像をアップロードし、背景の椅子に座っている人々を追加してもらいます。これには2つの画像だけを生成し、Enterを押します。
ここに2つの画像があります。彼の顔は画像の顔とまったく同じではないので、既存の顔のある画像の編集は得意ではありませんが、背景に観客全体を追加しました。
これをさらに編集しましょう。これを選択してリミックスをクリックし、「背景を熱帯のビーチに変更する」を追加します。
ここにこの1つの画像からの画像があります。再び男の顔は元の画像の男とまったく同じには見えず、微妙な違いがありますが、それでも同じポーズを維持し、背景を熱帯のビーチに変更しました。
画像から透かしを削除することもできます。この画像をアップロードして、単に「画像からテキストを削除する」と入力し、リミックスをクリックしてどうなるか見てみましょう。
結果はこちらです。顔が元の画像とは全く異なることに注意してください。これは画像の特定の側面をマイクロ編集するには完璧ではありません。
別の方法もありますが、あまり機能しないので簡単に紹介します。このようにするのではなく、編集リミックスをクリックし、元の画像でこのペンアイコンをクリックしてリミックスをクリックすると、これが表示され、編集したい特定の領域を塗りつぶすことができます。
例えば、このようにすべての透かしに塗りつぶして、「画像からテキストを削除する」と書きます。塗りつぶした部分だけを編集するかどうか見てみましょう。
結果はこちらです。元の画像と比較すると、彼女の顔に塗りつぶしをしなかったにもかかわらず、元の人物とは全く同じではありません。これはこの画像エディタの限界で、写真の他の側面に影響を与えることなく、写真の詳細をマイクロ編集するのはあまり得意ではありません。
マイクロ編集には、実際にGoogleのGemini 2の方が良いでしょう。同じ写真を入れて、テキストを削除するように指示すると、何も塗りつぶす必要がなく、透かしが削除された全く同じ写真が得られます。これは信じられないほど強力な画像エディタです。実際、このプラットフォームに詳しくない場合は、すでにすべてを網羅した完全なビデオを作成しています。興味があればこのビデオをご覧ください。
これに戻って、再びリミックスをクリックし、このローションの新しい写真をアップロードして、「このローションを持っているこの女性のクローズアップ」と書きます。
これが結果です。この女性は元の入力画像とは非常に異なることに注意してください。このローションの大きなフォントは正確で、「シーソルト＆シダー」と書かれていますが、小さなテキストは少し乱れています。特にここではでたらめな出力を始め、ここも同様です。画像編集機能はあまり優れていないと言えるでしょう。
次にこれを試してみましょう。このマンガページをアップロードして、このページに色を付けてもらいましょう。
これが結果です。この例では、入力画像とはまったく似ていません。左の例は少し近いですが、上部のパネルは正確ではなく、ここのようなテキストはでたらめです。試みましたが、少なくとも現時点ではマンガページを完璧に色付けすることはできません。
これでこのツールのテストは終了です。他のユーザーからの生成例をいくつか紹介します。ダンベルを持ち上げているアルバート・アインシュタインの生々しいジム写真です。これは信じられないほどリアルで非常に詳細です。
ホログラフィックなペペザフロッグのポケモンカード、そしてはい、これはビキニを着た女性など、かなり検閲されていないものを生成できます。これはGoogleのImagen 3が生成できるものよりもはるかに検閲されていません。
これも面白いです。OpenAIの公式リリースページからの例もあります。説明の下にリンクを貼っておきます。
ここでプロンプトは「ベイブリッジを見下ろす部屋のガラスホワイトボードを携帯電話で撮影した広角画像」です。実際に反射でベイブリッジを見ることができ、このホワイトボードの文字は完全に正確で、ここには写真家の反射も見えます。これがAIによって生成されたとは信じがたいです。
さらに「写真家が振り返ってハイタッチする自撮り視点」と言って編集できます。テキストは前の画像とほとんど同じで、これが4oモデルで生成された超リアルな写真の例もあります。この写真がAIで生成されたとは信じられますか？これはただのクレイジーです。
とにかく、この画像生成ツールは非常に楽しく、これまで試したどんなものよりもはるかに優れています。ぜひ試してみてください。きっと心地よく驚かされると思います。
これで、この画像生成ツールに関するビデオは終了です。私の徹底的なテストを評価していただければ幸いです。下のコメント欄でこれについてどう思うか、そしてどのような他のクールな生成ができたかを教えてください。
いつものように、トップAIニュースとツールを探し、皆さんと共有していきます。このビデオが気に入ったら、いいね、シェア、購読をお忘れなく、そしてさらなるコンテンツをお楽しみに。
また、AIの世界では毎週とても多くのことが起こっているので、YouTubeチャンネルですべてをカバーすることはできません。AIで起こっているすべてに本当に追いつくために、私の無料の週刊ニュースレターを購読してください。そのリンクは下の説明にあります。
視聴いただきありがとうございます。次回でお会いしましょう。