新しい画像生成AI「Stable Diffusion XL」を 今までのAIと比較してみた
■新しく公開された「Stable Diffusion XL」を試してみた
これまで自分が使っていたのは 以前紹介したように画像生成AI「Stable Diffusion」のデモ版。<Ref. https://stablediffusionweb.com/#demo>
2023年7月に新しい画像生成AI「Stable Diffusion XL 1.0」(SDXL 1.0)が公開された。簡単な呪文(プロンプト)で高品質な画像が生成できるらしい。早速 無料で画像生成が出来るデモ サイト「Clipdrop」でカーイラストの画像生成を試してみた。そして今まで使っていた「Stable Diffusion」比較してみた。
<Ref. https://clipdrop.co/stable-diffusion>
■先ずは未来的なSUVの画像を生成してみた
先ずは未来的なSUVの画像を生成してみた。プロンプトは「suv, coupe, futuristic, in city」だけ。
Stable Diffusionの結果は生成された画像の中から選べば それほど悪くない。車は少し曖昧だが、背景は かなり細かく描写されている。ただし 生成した際に車が見切れている画像が多いため 場合によっては何回か生成して良い画像を選ぶ必要がある。
一方 SDXLの結果は 車の描写が詳細で迫力がある。(ブログ用の画像では画素数を減らしたが、元画像の画素数はStable Diffusionより多い) しかも見切れている画像が少ないので1回の生成で それなりの画像を得られる。これは良い。
■次にランドクルーザーの画像を生成してみた
先ずはトヨタ ランドクルーザーの画像を生成してみた。プロンプトは「toyota landcruiser, new, off road」だけ。
Stable Diffusionの結果は確かにランクルっぽい。けれど 細部のツメが甘いので 現実的でない感じ。
一方 SDXLの結果は まるでランクル。細部までも現実的で見応えある。さすがにTOYOTAロゴは違っているが、簡単に修正できるレベル。
■最後にキャンバスの画像を生成してみた
最後にダイハツ ムーヴ キャンバスの画像を生成してみた。以前 Stable Diffusionで生成してみて上手くいかなかったクルマ。
SDXLの結果は 確かにダイハツの軽自動車で後席スライドドアっぽい。けれど いかにも昔の軽自動車っぽい感じでキャンバスの可愛さが全然ない。やはり軽自動車の画像の学習は不十分みたいだ。
■まとめ
新しく公開されたSDXL 1.0は簡単に高品質の画像が得られる という謳い文句通り。かなり詳細で迫力のある画像が得られた。今後のカーイラストでは SDXLを使いたい と思わされた。ただし 日本独自の軽自動車は まだまだ無理そうだ。
■注記
※このブログのレビューは あくまで個人的意見
※このブログで「デザイン」は外装スタイリング(外観)のこと
※画像の出典