AI 画像作成のチュートリアルと比較: Dall-e VS Stable Diffusion VS Canva (Text to Image)

現在のメディア人気で AI言語モデルを活用してコードのデバッグからデータの異常検出まで、 についても話す機会です DALL-E、同じくによって設計された別の人工知能 オープンAI ! より一般的には、画像生成 AI です。 ChatGPT が驚くほど簡単にテキストを生成できるのに対し、DALL-E とその同類は、ユーザーからの単純な書面による要求から画像を作成するように訓練されています。

この画像作成 AI の比較記事で、それらがどのように機能するか、その機能だけでなく、その限界も見てみましょう。

ところで、AI はどのように機能するのでしょうか。

特に ChatGPT に関する以前の記事では取り上げなかったので、すぐに戻ってくるのは興味深いかもしれない非常に良い質問です。 「人工知能」と聞くと、映画で見たようなヒューマノイド ロボットを思い浮かべることができます。 これは、この記事の紹介画像など、これらのキーワードの検索に対応する画像を求められたときに AI 自体が生成するものです。

この風景は存在しません。AI によって生成された 100% 人工的なものです

しかし実際には、既存の AI の多くには物理的なエンベロープがありません。 実際、ほとんどの場合、多かれ少なかれ複雑な特定のタスクを実行するために人間によって訓練された特定のアルゴリズムに基づくコンピューター プログラムです。

画像生成は、XNUMX つ (または複数) の AI に割り当てることができるタスクです! AI による画像の作成方法の詳細については、次のビデオをご覧ください。

人工知能で最初の画像を生成しましょう

これを行うには、取得したい画像をテキストで AI に説明するだけなので、一見するとこれほど簡単なことはありません。 この記事では、XNUMX つの AI ジェネレーターによって提供された画像を比較することにしました。

  • DALL-E
  • 安定拡散
  • Canva (テキストから画像へ)

もちろん、テストすることをためらってはならない他のものもあります。 これがXNUMXつです 非網羅的なリスト.

少しクリエイティブな方なら、生成する画像のアイデアがたくさん見つかるはずです。 しかし、もう少し複雑な場合は、ChatGPT に少し助けを求めることができます。 はい、AIを使用して別のAIを使用しました...

質問に対する ChatGPT の回答: dall.e に関する記事を書かなければならないのですが、この AI モデルで生成できる画像のアイデアはありますか?

もちろん、画像生成モデルとして、DALL-Eは多種多様な画像を作成できます。 DALL-E で生成できる画像のアイデアを次に示します。

  1. ファンタジー動物: DALL-E に想像上の動物の画像を作成してもらいます。たとえば、蝶の羽を持つドラゴンや足のあるヘビなどです。
  2. 奇妙な食べ物: DALL-E に、チョコレート ピザやスイカのスライスが入ったハンバーガーなど、変わった食べ物の画像を生成するように依頼します。
  3. 変わった服: DALL-E に、エッフェル塔の形をした帽子や翼のある靴など、変わった服の画像を生成するように依頼します。
  4. 架空の風景: DALL-E に、雲に浮かぶ都市や巨大なキノコの森などの幻想的な風景の画像を生成するように依頼します。
  5. ハイブリッド オブジェクト: DALL-E に、ハンモックのようなベッドや鳥の翼のある車など、XNUMX つの異なるものが混在するオブジェクトの画像を生成するように依頼します。
  6. 有名人のポートレート: DALL-E に、存在しない有名人のポートレートの画像を生成するように依頼します。たとえば、タトゥーを入れたマリリン モンローの代替バージョンなどです。
  7. 未来の車: DALL-E に、飛行機に変形できる車や空を飛ぶことができる車など、未来の車の画像を生成するように依頼します。
  8. ファンタジー建築: DALL-E に、ドラゴンの形をした超高層ビルや木のように見える家などのファンタジー建築の画像を生成するように依頼します。

これらのアイデアは、DALL-E で何ができるかを示すための単なる提案です。 この AI テンプレートを使用して、他にも何千もの画像のアイデアを生成できます。

各 AI には独自のスタイルがあります。

このリストを使用して、画像を生成する方法と、選択したさまざまなソフトウェアのどれが最適かを一緒に見てみましょう.

また読みます:  新しいへの移行 forum phpBB 2.0.xからphpBB 3.1へ!

最初の画像では、蝶の羽を持つドラゴンを表現することにしました。 文脈を追加するために、これを「おとぎ話のファンタジーの森」で描写することも求めています。 IA によっては、要求の言語が結果に影響を与える可能性があります。 そのため、DALL-E と Stable Diffusion についてはすぐにわかりました。 英語は最良の結果をもたらす言語でした。 逆に、Canva のテキストから画像へのアプリケーションは、通常、フランス語でうまく機能します。

1. DALL-E で生成されたチョウチョウウオ科のドラゴンの画像

2. Stable Diffusion で生成されたドラゴン

3. 最後に、Canva ツール用に保持することを選択したもの

最初にすぐにわかることは、同じリクエストに対して、各 AI が独自のスタイルを持っていることです。

  • DALL-Eには「想像力豊かな」側面がありますが、「おとぎ話」の森は妖精には少し暗いですが、蝶の羽はよく表現されていてきれいです. それはスタイルです デジタルアート.
  • 安定した拡散では、スタイルはより「楽しい」です。 少し子供っぽい. 私たちは、これらの画像が子供向けの物語を描いていることを非常によく想像しています。 ここでは龍がはっきりと見えており、それが国章である中国を思い起こさせます。 一方、AI は蝶の羽を完全に覆い隠し、ドラゴンの横に本物の蝶を出現させるという簡単な解決策を選択しました。
  • 最後に、Canva ツールについては、選択内容からリクエストに対応する唯一の画像を選択しました。 ただし、XNUMX つの要素 (ドラゴンと翼がここに存在します)。 すべての画像はテーマに沿った実用的なものですが、Canvaはリクエストを忠実に実行することに最善を尽くしているため、ここで最初のポイントを獲得しています.

要求された画像の芸術的なスタイルの可能性は何ですか?

アート スタイルの詳細が要求されない場合は、AI がドラゴンの例のようにそれらを選択します。

それにもかかわらず、たとえば Dall-e では、次のスタイルを定義することができます。

  • 油絵 : Dall-e は、絵画で見たい色と質感の説明から油絵を生成できます。
  • 写真撮影 : Dall-e は、写真で見たい色、テクスチャ、詳細に基づいて写真を生成できます。
  • デジタルアート : Dall-e は、あらかじめデザインされたテンプレートから、またはアートワークで見たい色や詳細の説明からデジタル アートワークを作成できます。
  • 抽象芸術 : Dall-eは、作品で見たい動き、色、形に基づいて抽象的な作品を制作できます。
  • デザイン :Dall-eは、デザインで見たい色と形に基づいてデザインを生成できます。
  • ベクター アート : Dall-e は、定義済みのテンプレートから、または画像に表示する色と詳細の説明からベクター画像を生成できます。

ドラゴンの例は、デジタル アート スタイルでアプリオリに作成されました。 スタイルは、最終的に生成されるイメージに大きく影響します。

さらに強く、のスタイルをリクエストすることが可能です 某有名アーティスト. そこで、スタイルでチャットを生成しました ピカソ、ゴッホ、ダリ ! そして結果は…とても素晴らしいです!

3 人の巨匠のスタイルで AI が描いた猫

  1. ピカソ風猫
  2. ゴッホ風猫
  3. ダリ風猫

より良い、それから私たちは「 ピカソとダリとゴッホのスタイルの猫 そして、これを得ました:

私たちもリクエストしました 「ピカソ風豚」 その結果は、それ以上ではないにしても、同様に印象的でした…

AI は、今後数年間でアートとインターネットの分野に革命を起こす可能性が高く、投機的な NFT の場合はすでにそうなっています。

また読みます:  RES法律:法律上のデータとヨーロッパの再生可能電力

私たちは理解しています プロへの不信感 これらの芸術的 AI に対する芸術の恐怖は、ChatGPT のようなチャットボットに対する出版や文学創作の恐怖と同じです! 彼らは正しいです、私たちの意見では、これらすべての恐れは正当化されます!

Dall-e でイメージの作成をリクエストするさまざまな方法は何ですか?

Dalle-e を使用した画像の作成を示すために、いくつかの方法を使用できます。これには、必要に応じてより高速な結果を得るためのグラフィック方法が含まれます。

  • キーワードから画像を生成する : キーワードを入力すると、入力したキーワードに基づいて Dall-e が画像を生成します。
  • 文章から画像を生成する : 完全な文を入力すると、入力した文に基づいて Dall-e が画像を生成します。
  • 画像の説明から画像を生成する : Dall-e は、画像で見たい色、形、オブジェクトの詳細な説明から画像を生成できます。
  • シーンからの画像の生成 : Dall-e は、シーンの完全な記述から 3D 画像を生成できます。
  • パターンから画像を生成する : Dall-e は、入力したパターンから画像を生成できます。
  • テンプレートから画像を生成する : Dall-e に定義済みのテンプレートを提供すると、提供したテンプレートに基づいて画像が生成されます。
  • アニメーション シーケンスからの画像の生成 : Dall-e は、シーケンスで見たい動き、色、音の説明からアニメーション シーケンスを生成できます。

現実的だがありえないイメージ

次に、AI 画像ジェネレーターに私たちを描くように依頼しました 目のサラダ : 一見相容れない3つの要素。 しかし、この段階では、私たちの XNUMX つのジェネレーターは、明らかな問題なく通過しました。

1. DALL-Eが提案する目のあるサラダのXNUMXつの画像

2. Stable Diffusion によって生成されたリクエストに対応する XNUMX つの画像

3. Canva ツールの対応する XNUMX つの画像

ここでも、各画像には独自のスタイルがありますが、特に印象的なのは、さまざまな画像のリアリズムです。AI は写真スタイルを使用しています。

私たちは食べ物を特によく認識しており、キッチンで提案されたさまざまなアイデアを再現したいと思うかもしれません。 Canvaが「絵文字」のインスピレーションを備えた画像を提供することでその独創性を際立たせている場合、XNUMXつの異なる画像とすべてが要求されたテーマでポイントを獲得するのはDALL-Eです.

Stable Diffusion のフロップの中で、まだ戻ってくる価値のある画像が XNUMX つあります。

確かに、この画像には目が含まれていないため削除されていますが、一方で、作業計画の表現における AI のリアリズムの努力が見られます。

私たちの AI は、「サラダ」という単語を対応する環境に関連付けることができます。 これは、上の画像ではすでにそうでした プレート、フォークの表現 および料理分野に関連するその他の要素。

まだ定期的なフロップ

全体的な効率性にもかかわらず、私たちの AI は依然としてかなりの量を生み出しています 平凡で誤ったイメージは、需要と完全に一致していないように見えます. これは私たちの場合でした エッフェル塔の形をした帽子.

DALL-E は、私たちの要求に近づく唯一のイメージでポイントを獲得しました。 ジュヌヴィエーヴ・ド・フォントネーの頭 !

オープン AI の AI によって提供されるこの小さな笑い声は別として、他の画像は現実的すぎて、要素の XNUMX つを単純に表し、他の要素を覆い隠しています。

最初の画像では、Stable Diffusion はタワーを表していますが、XNUMX 番目の画像では、DALL-E が帽子のスタックを送信することを選択したため、リクエストの XNUMX 番目の部分がわかりにくくなっています。

DALL-E がエッフェル塔のお土産の置物を表しているこれらの XNUMX つの画像のように、彼らは要求を誤って理解していたかのどちらかです。

また読みます:  Ma-Bonne-Action.com、連帯のマーケティング、人道や慈善

最後に、一部の画像は完全に風変わりである場合があります。この画像の場合、「IA Stable Diffusion の想像力から生まれた人物」を表していると思われ、未知の言語で自発的に引用を追加することを選択しました...英語に近い...

一語一句変わることもある感性

テストを実行することで、満足のいく結果が得られなかった場合に、AI が状況を修正するだけで十分な場合があることがすぐにわかります。 そのため、それぞれに最適な画像を選択して、「曇り空に浮かぶ都市」を AI に初めて尋ねると、次の結果が得られます。

上から順に、Stable Diffusion、DALL-E、Canvaの結果

非常に素晴らしい画像ですが、私たちのリクエストの「非現実的な」意味合いを実際には反映していませんが、人間は理解していますが、ジェネレーターは理解していないようです。 需要をわずかに変えるだけで、まったく異なる結果が得られます。

したがって、「曇り空に浮かぶ幻想的な都市」という文で、今回は次のようになります。

1. DALL-E のより想像力豊かな画像

2.「曇り空に浮かぶ」部分を完全に省略したStable Diffusionの非常に素晴らしい都市

3. Canvaでビデオゲーム(MinecraftやLego Worldsなど)から撮影できるいくつかのシーン

ここで、DALL-E と Canva の両方が、私たちの要求のいずれかによって、私たちの街を雲の中に浮かぶように管理したことにポイントを与えることができます.

では、画像生成の未来はどうなるのだろうか?

全体的に非常にうまく機能するソリューションに直面すると、人工知能による画像生成の将来の用途がどうなるか疑問に思う. もちろん、ここでインターネットでの失敗の作成を引用したくなるかもしれません。遠慮なく来てください。 私たちに投稿する forum あなたがすでにオンラインで出会ったかもしれないもの。

しかし、もっと深刻な用途も想像できます。 このように、Canva ツールに「実際には家である木」のイメージを作成するよう依頼して得られた結果は、自然に溶け込む生息環境の作成を担当する建築家に簡単にアイデアを与えることができます!

それでは、3 つのイメージ ジェネレーターのうちどれが最も優れているのでしょうか?

家にもなる木は、道具ごとに簡単に点数をつけていきます!

DALL-E、Stable Diffusion、Canva ツールでそれぞれ提案された画像の例

鳥の翼を持つ車は、私たちのすべての AI に挑戦しましたが、飛ぶことができる車は、Canva と Stable Diffusion をいくつかの非常に現実的な未来的なレンダリングで際立たせることができました。

上が安定拡散、下がCanvaです。

最後に、DALL-E は非常に効率的であることを示しました。 龍の形をした建物 (ただし、まだ作成中です)、有名人を「AIの想像上の人物」に置き換えることで、多少修正したポートレートのリクエストにCanvaが最もよく応えることができました.

XNUMX つの Canva ポートレートの背後にある画像生成を示唆するいくつかの要素にもかかわらず、リアリズムは依然として印象的です。

したがって、最終的なカウントでは、これらは DALL-EとCanvaのツールがそれぞれ5点ずつ獲得。

通常、ユーザーの要求の大部分に沿った結果を提供できます。

Canva はそのリアリズムで際立っていますが、DALL-E は、要求が想像力や絵画の分野を必要とする場合、より関連性があるように見えます。

しかし、2点しかないにもかかわらず、Stable Diffusionは提供できる画像品質を損なうことはありません! 欠点は、彼が非常に現実的である傾向があるため、ユーザーの要求を理解することにあります。 ただし、発見することも非常に興味深いままです。

とにかく、今後数年のうちに、人工知能が多くの活動分野に革命を起こすことを期待できます。 そして確かに、それ以来、一部の人が考えるよりも高速です 一部または全部が AI によって書かれた本は、Amazon ですでに販売されています…BFMTV からのこの短いビデオ レポートは、数日前にそれについて話しました。

ご意見やご質問については、 forum AI専用.

コメントを残します

あなたのメールアドレスが公開されることはありません。 必須フィールドは、マークされています *