画像生成AI「Stable Diffusion」で効果的な呪文(キーワード)を試行錯誤
■最近 流行りの画像生成AIを使ってみた
自分が使ってみたのは画像生成AI「Stable Diffusion」のデモ版。使った時点では無料、アカウント登録不要、特回数制限なしでwebブラウザ上で画像を生成することが出来た。
<Ref. https://stablediffusionweb.com/#demo>
StableDiffusionはテキストを入力すると画像を生成するAIモデルの1種。Stability AIという企業が開発し、オープンソースとして公開。様々なアプリケーションやwebサービスで利用可能。
■同じキーワードを入力しても生成画像は毎回違う
使い方は非常に簡単。webサイトへアクセスして、好きなキーワードを いくつか入力し、画像生成ボタンをクリックするだけ。1クリックで生成される画像は1度に4枚。キーワードは英語が良かった。
キーワードを増やすことで生成画像を調整できるし、同じキーワードでも生成画像は ほぼ毎回違う。もし生成された画像が気に入らなければ、キーワードを変えるか、再度クリックすれば新しい画像を得られる。
■先ずは試しにSUVの画像を生成してみた
先ずは試しに「suv」と入力して画像生成してみた。自分が試したときには10秒から20秒 ほどで画像が生成された。得られた画像は ちゃんとSUVぽい感じ。
生成画像はクルマの端が見切れていることが ほとんど。縦横1:1の画像サイズのせいか またはAIの参照画像が見切れているのが多いせいか。(最近のカーメーカーのフォトギャラリーは見切れている写真が多い気がする) とにかく標準設定のままではカーイラストに あまり向いてない。なお自分が生成した時のオプションはデフォルトのまま。
クルマが見切れていたとしても 自分の目的はカーイラストの完成品ではなく、カーデザインのヒントなので さほど問題ではないけれど。
■キーワードを追加入力して生成画像を調整してみた
「suv」にキーワードを追加入力して生成画像を調整してみた。やはりキーワードによって画像に反映しやすいものと反映しにくいものがある。
①周辺環境 ◎
・キーワード: 「オフロード」「オンロード」「都市」「砂漠」
・結果: クルマのスタイルや背景等を かなりイメージに近く反映できた。Stable Diffusionは特に背景を入れ替えるのが得意そうだ。
②時代性 〇
・キーワード: 「ヴィンテージ」「レトロ」「現代的」「未来的」
・結果: まあまあ画像へ反映できた。
③動力形式 〇
・キーワード: 「EV」「ハイブリッド」「V8」
・結果: EVは割と分かりやすく反映できた。その他も何となく雰囲気は出ている。
④プロポーション △
・キーワード: 「クーペ」「ファストバック」「ラージ」「コンパクト」「ロングノーズ」等
・結果: クーペは上手く反映できたが、ファストバックはレトロっぽくなってしまった。
サイズの大小は微妙。特に「スモールキャビン」を入れたらキャンピングカーだらけで可笑しかった。「ビッグキャビン」は そんなことなかったのに。
⑤フォルム △
・キーワード: 「流線形」「楔形」「ラギッド」「スリーク」「ボクシー」「スポーティ」
・結果: キーワードによって得手・不得手がある。流線型とラギッドは かなり反映できたが、その他は微妙。
■実際のカーデザインのテーマを入力してみた
実際のカーデザインのテーマやメーカー名を示すキーワードを入力してみた。各社らしさは反映されているようだが、テーマを反映するのは難しい。逆に言うと テーマのキーワードがデザインへ反映しやすいかどうか分かる。
・キーワード: 「ALLURING」「 VERVE」「LEXUS」
・結果: レクサスの大型車っぽい画像になった。スピンドルグリルが古めかしい。
テーマの反映は不明。もともとテーマの意味も分かりにくいし。
・キーワード: 「Vital」「Tech Gear」「LEXUS」
・結果: レクサスぽっさはRXと同様。Gear のゴツい道具感は反映されている。Vital の有機性や Tech の先進性は解釈が難しかったのか反映は不明。
・キーワード: 「tough」「high quality」「nissan」
・結果: タフと日産によってかエクストレイルらしい画像になった。しかし高品質の反映は不明。
・キーワード: 「 AMP UP YOUR LIFE」「honda」
・結果: CR-Vっぽく、しかも派手な画像になった。ホンダのSUVと言えばCR-Vがメジャーだし、AMP UP が派手にさせたのだろうか。
・キーワード: 「noble」「toughness」「mazda」
・結果: 普通にマツダのSUVっぽい画像になった。noble は解釈が難しいし、toughness はSUVでは当たり前か。
・キーワード: 「BOLD STRIDE」「mitsubishi」
・結果: アウトランダーと言うよりエクリプスクロスっぽい画像になった。アウトランダーでは もう少しタフな道具感のあるキーワードの方が合いそうだ。
■まとめ
カーイラストの画像を生成するのは簡単だが、思うような画像を描くのは簡単ではない。キーワードによって画像への反映しやすさも様々。良さそうな画像を得るには反映されやすいキーワードを いくつか組み合わせて何回か試行錯誤してみる必要がある。
良さそうな画像はカーデザインのヒントになりそう。逆に良くない画像は反面教師として奇抜すぎたり平凡すぎたりすることについての理解が進みそうだ。
とにかくキーワードを入力するだけで様々なカーイラストが生成されるのは単純に面白い。この先はSUV以外の画像もトライしてみたい。
■追記
新しく公開された「Stable Diffusion XL 1.0」(SDXL 1.0)と今まで使っていた「Stable Diffusion」の画像を比べてみた。
■注記
※このブログのレビューは あくまで個人的意見
※このブログで「デザイン」は外装スタイリング(外観)のこと
※画像の出典