自分のブログ名

超 カーデザイン レビュー

「日本車はカッコ悪い」なんて言わせたくない

Copilot vs Gemini 無料AI画像生成のカーイラスト描写力を比較

カーデザイン

Copilot」とGemini」の どっちがカーイラストに向いているか比較してみた

■最近の会話型AIの画像生成は かなりの実力

  最近の会話型AI (画像生成専用AIでなく) は 無料での画像生成も かなりの実力。 以前から使っていた 画像生成AI 「Stable Diffusion」より便利かも。しかも画像をアップロードして それを元に 様々な画像生成をしてくれる。いわゆる「image to image」 (i2i) だ。

  今回は Webブラウザで簡単に利用できる Microsoft「Copilot」とGoogle「Gemini」に シンプルなカーイラストをアップロードし、それを写実的な画像へ変換させて、カーイラストに向いているか実力を見てみた。(どちらも無料プランのまま)

■お題は マツダ ロードスター リファイン案

  アップロードしたイラストは線画に着色しただけのシンプルなもの。お題は 以前に投稿した マツダ ロードスター リファイン案。それもコメントの文字や矢印が残ったまま。これが どれだけ写実的になるか楽しみ。

カーデザイン

■先ずは Copilot

  イラストをアップロードした後、「写実的に変換、高速走行の効果を追加、背景にワインディングロードを追加、高解像度」などと文章で指示した。

  変換結果を見ると 確かに写実化されたが、写真的というよりイラスト的。これは「写真的に変換」と指示しても 変わらなかった。元のイラストの文字や矢印は 問題なかった。

  そして 肝心のクルマの形状を見ると アップしたイラストに似ているが、マツダ ロードスター2代目(NB)に似通った形状に見える。おそらくマツダ ロードスターの画像で学習した効果だろう。これは「元のイラストの自動車の形状を変えず」と指示しても 変わらなかった。

カーデザイン

Copilot

  その後 「オープンカーにして」と指示してみた結果、きれいに屋根を開けた画像を生成できた。クルマの形態を変えるのは 得意のようだ。 マツダロードスターの画像でタップリ学習した成果なのか。

カーデザイン

Copilot

■次は Gemini

  段取りは Copilotの場合と同じ。その結果を見ると まるで写真のような画像へ変換できた。最初は マツダ ロードスター4代目(ND)にソックリな画像が生成されてしまった。

  しかし「元のイラストの自動車の形状を変えず」と指示したら 元のイラストの形状に近づけることができた。フォルムが NDぽいのは もう仕方ないか。

カーデザイン

Gemini

  その後 「オープンカーにして」と指示してみた結果、きれいに屋根を開けたうえに サイドウィンドウを上げて 背景が透けて見える 画像に変換できた。かなりの描写力だ。

カーデザイン

Gemini

■まとめ

① CopilotとGeminiのどちらも i2iで 写実的な画像生成は可能

良い点

・特に指示しなくても 写実的な陰影と光の反射を追加

・走行の描写、ドライバー、背景などを追加可能

・「オープンカー」にするようなクルマの形態の変更も可能

・元のイラストに文字や矢印などがあっても省略可能

イマイチな点

・元のイラストの形状に忠実ではなく、既存のクルマに似てしまう

   ←おそらく 画像生成が既存データに強く依存しているためだろう

・画像の修正を細かく指示しても 修正できない (プロポーションやパーツの形とか)

   ←AIが車のパーツや その形状をパラメータ化していないためでは?

   (「オープンカー」のようなカテゴリはパラメータ化してるだろうが)

⇒つまり 文章の指示だけで 思うようなクルマのカタチは まだ作れない

② 写真のような画像を求めるなら Gemini 一択?

・「写真的」と指示しなくても 写真のような画像が簡単に生成可能

・アップロードした形状への忠実さも Copilot よりは少しだけマシ

   ⇒ Gemini で もっと画像生成してみたい と思わせる実力だった

カーデザイン

上 Copilot、下 Gemini

■注記

※このブログのレビューは あくまで個人的意見

※このブログで「デザイン」は外装スタイリング(外観)のこと

ホットドッグ

<PR>