
「Copilot」と「Gemini」の どっちがカーイラストに向いているか比較してみた
■最近の会話型AIの画像生成は かなりの実力
最近の会話型AI (画像生成専用AIでなく) は 無料での画像生成も かなりの実力。 以前から使っていた 画像生成AI 「Stable Diffusion」より便利かも。しかも画像をアップロードして それを元に 様々な画像生成をしてくれる。いわゆる「image to image」 (i2i) だ。
今回は Webブラウザで簡単に利用できる Microsoft「Copilot」とGoogle「Gemini」に シンプルなカーイラストをアップロードし、それを写実的な画像へ変換させて、カーイラストに向いているか実力を見てみた。(どちらも無料プランのまま)
アップロードしたイラストは線画に着色しただけのシンプルなもの。お題は 以前に投稿した マツダ ロードスター リファイン案。それもコメントの文字や矢印が残ったまま。これが どれだけ写実的になるか楽しみ。

■先ずは Copilot
イラストをアップロードした後、「写実的に変換、高速走行の効果を追加、背景にワインディングロードを追加、高解像度」などと文章で指示した。
変換結果を見ると 確かに写実化されたが、写真的というよりイラスト的。これは「写真的に変換」と指示しても 変わらなかった。元のイラストの文字や矢印は 問題なかった。
そして 肝心のクルマの形状を見ると アップしたイラストに似ているが、マツダ ロードスター2代目(NB)に似通った形状に見える。おそらくマツダ ロードスターの画像で学習した効果だろう。これは「元のイラストの自動車の形状を変えず」と指示しても 変わらなかった。

その後 「オープンカーにして」と指示してみた結果、きれいに屋根を開けた画像を生成できた。クルマの形態を変えるのは 得意のようだ。 マツダロードスターの画像でタップリ学習した成果なのか。

■次は Gemini
段取りは Copilotの場合と同じ。その結果を見ると まるで写真のような画像へ変換できた。最初は マツダ ロードスター4代目(ND)にソックリな画像が生成されてしまった。
しかし「元のイラストの自動車の形状を変えず」と指示したら 元のイラストの形状に近づけることができた。フォルムが NDぽいのは もう仕方ないか。

その後 「オープンカーにして」と指示してみた結果、きれいに屋根を開けたうえに サイドウィンドウを上げて 背景が透けて見える 画像に変換できた。かなりの描写力だ。

■まとめ
① CopilotとGeminiのどちらも i2iで 写実的な画像生成は可能
○ 良い点
・特に指示しなくても 写実的な陰影と光の反射を追加
・走行の描写、ドライバー、背景などを追加可能
・「オープンカー」にするようなクルマの形態の変更も可能
・元のイラストに文字や矢印などがあっても省略可能
△ イマイチな点
・元のイラストの形状に忠実ではなく、既存のクルマに似てしまう
←おそらく 画像生成が既存データに強く依存しているためだろう
・画像の修正を細かく指示しても 修正できない (プロポーションやパーツの形とか)
←AIが車のパーツや その形状をパラメータ化していないためでは?
(「オープンカー」のようなカテゴリはパラメータ化してるだろうが)
⇒つまり 文章の指示だけで 思うようなクルマのカタチは まだ作れない
② 写真のような画像を求めるなら Gemini 一択?
・「写真的」と指示しなくても 写真のような画像が簡単に生成可能
・アップロードした形状への忠実さも Copilot よりは少しだけマシ
⇒ Gemini で もっと画像生成してみたい と思わせる実力だった

■注記
※このブログのレビューは あくまで個人的意見
※このブログで「デザイン」は外装スタイリング(外観)のこと

<PR>


