1つずつ細かくプロンプトを指定してみる
お手本となるこの写真から、特徴を箇条書きで書き出していきます。
・薄水色のお皿
・1つの大きなチャーシュー
・緑の拳程度の大きさのほうれん草の塊
・濃厚で濁っているとんこつスープ
・3枚の長方形の大きな黒い海苔が重なり合って皿の縁についている
という感じで、色、形状、大きさ、数などを細かく定義するのがコツです。
続いて、これらの特徴を翻訳していきます。翻訳ツールは何でもいいのですが、精度が高いので筆者は「DeepL」を使っています。
・薄水色のお皿
・1つの大きなチャーシュー
・緑の拳程度の大きさのほうれん草の塊
・濃厚で濁っているとんこつスープ
・3枚の長方形の大きな黒い海苔が重なり合って皿の縁についている
という感じで、色、形状、大きさ、数などを細かく定義するのがコツです。
続いて、これらの特徴を翻訳していきます。翻訳ツールは何でもいいのですが、精度が高いので筆者は「DeepL」を使っています。
日本語で特徴をDeepLに入力すると
A light blue plate
One large piece of pork chashu
One large piece of green fist-sized spinach
Thick, muddy tonkotsu (pork bone) broth.
Three large rectangular pieces of black nori seaweed overlapping each other and attached to the edge of the plate.
このようにプロンプトを生成してくれました。これをChatGPTを使いながら少し修正して、最終的に以下のようなプロンプトにしました。
a high-resolution image of a bowl of Yokohama-style ramen,A light blue plate with thick, muddy tonkotsu (pork bone) broth. In the center, one large piece of pork chashu. Beside it, one large piece of green fist-sized spinach. On the edge of the plate, three large rectangular pieces of black nori seaweed overlapping each other, providing a rich contrast. The dish is vibrant, appetizing, and detailed, evoking the essence of traditional Japanese ramen,photo realistic ,16k
以下が、Midjourneyでの出力結果です。
A light blue plate
One large piece of pork chashu
One large piece of green fist-sized spinach
Thick, muddy tonkotsu (pork bone) broth.
Three large rectangular pieces of black nori seaweed overlapping each other and attached to the edge of the plate.
このようにプロンプトを生成してくれました。これをChatGPTを使いながら少し修正して、最終的に以下のようなプロンプトにしました。
a high-resolution image of a bowl of Yokohama-style ramen,A light blue plate with thick, muddy tonkotsu (pork bone) broth. In the center, one large piece of pork chashu. Beside it, one large piece of green fist-sized spinach. On the edge of the plate, three large rectangular pieces of black nori seaweed overlapping each other, providing a rich contrast. The dish is vibrant, appetizing, and detailed, evoking the essence of traditional Japanese ramen,photo realistic ,16k
以下が、Midjourneyでの出力結果です。
クオリティーは上がりましたが、スープの色がまだまだ透明で、もっと濁る必要がありますね。
後は細かくプロンプトを修正していきます。スープの部分を少し変えました。太字が変更部分です。
a high-resolution image of a bowl of Yokohama-style ramen, A light blue plate with golden, cloudy tonkotsu (pork bone) broth. In the center, one large piece of pork chashu. Beside it, one large piece of green fist-sized spinach. On the edge of the plate, three large rectangular pieces of black nori seaweed overlapping each other, providing a rich contrast. The dish is vibrant, appetizing, and detailed, evoking the essence of traditional Japanese ramen, photo realistic, 16k.
以下が、Midjourneyでの出力結果です。
後は細かくプロンプトを修正していきます。スープの部分を少し変えました。太字が変更部分です。
a high-resolution image of a bowl of Yokohama-style ramen, A light blue plate with golden, cloudy tonkotsu (pork bone) broth. In the center, one large piece of pork chashu. Beside it, one large piece of green fist-sized spinach. On the edge of the plate, three large rectangular pieces of black nori seaweed overlapping each other, providing a rich contrast. The dish is vibrant, appetizing, and detailed, evoking the essence of traditional Japanese ramen, photo realistic, 16k.
以下が、Midjourneyでの出力結果です。
ここまで手を掛けても、なかなか家系ラーメン本来の不透明の白濁したスープを再現するのは難しいですね。本当に再現を目指すのなら、微妙なプロンプトの調整を何十、何百と行う必要があります。
(そもそも家系独特のスープが濁ったラーメンは、既存の画像生成AIのデータセットにないようです。本気で再現するなら、Stable Diffuisonなどを利用して、個別に複数の家系ラーメンの画像を読み込ませて、LoRA(Low-Rank Adaptation、画像を追加学習する手法)を使う必要があるかもしれません。それにはそれ相応のスペックのパソコンが必要なので、一筋縄ではいかないのですが……)
(そもそも家系独特のスープが濁ったラーメンは、既存の画像生成AIのデータセットにないようです。本気で再現するなら、Stable Diffuisonなどを利用して、個別に複数の家系ラーメンの画像を読み込ませて、LoRA(Low-Rank Adaptation、画像を追加学習する手法)を使う必要があるかもしれません。それにはそれ相応のスペックのパソコンが必要なので、一筋縄ではいかないのですが……)
画角の変更や部分変更もできる
プロンプトを調整すると、少しカメラを引いた、こんな感じのお洒落な写真も生成できます。
加えて、最近Midjourneyにも導入された「inpainting」という機能を使えば、生成した画像の範囲を選択してプロンプトを入力することで、任意の部分のみ変更できます。
【🔥朗報:MidJourney新機能でクリエイター革命】
— チャエン | 重要AIニュースを毎日発信⚡️ (@masahirochaen) August 24, 2023
「inpainting」という機能が搭載
生成した画像の範囲を選択してプロンプトを入力すると、任意の部分のみ変更できる
■例
・笑顔にする
・服の色変える
・持ち物を変える
MidJourneyという高品質画像生成にこの機能搭載は大きい
作品例↓ pic.twitter.com/vmZbevNakQ
Vary(Region)を押して
このように任意の範囲を選択して、プロンプトを追加して、再度画像生成をすることもできます
Midjourneyでinpainging機能を使うには、以下のように設定を変更する必要があります。
1. /setting
2. Remixモード選択
3. 画像を生成
4. 生成後に表示される「vary(Region)」ボタンを押す
5. 範囲を選択して任意のプロンプトを記述
1. /setting
2. Remixモード選択
3. 画像を生成
4. 生成後に表示される「vary(Region)」ボタンを押す
5. 範囲を選択して任意のプロンプトを記述
【番外編】このテクニックを人物で使うと……
ここまで使ってきたテクニックを「ラーメンを食べる人」にも応用してみました。まずは「ラーメンを食べてほほ笑む日本人女性」から。
A photorealistic image of a slender, young, and elegant Japanese office lady with delicate features, looking as if taken from a professional photoshoot, heartily slurping Yokohama-iekei ramen. The ramen has a thick and cloudy pork broth, with thick noodles, and is topped with 3 slices of chashu pork, a sprinkle of chopped green onions, 2 pieces of nori seaweed, and a soft-boiled egg cut in half. She is captured in the moment, facing the camera directly with a slight smile.
A photorealistic image of a slender, young, and elegant Japanese office lady with delicate features, looking as if taken from a professional photoshoot, heartily slurping Yokohama-iekei ramen. The ramen has a thick and cloudy pork broth, with thick noodles, and is topped with 3 slices of chashu pork, a sprinkle of chopped green onions, 2 pieces of nori seaweed, and a soft-boiled egg cut in half. She is captured in the moment, facing the camera directly with a slight smile.
続いては、男性で。「彫りの深い、たくましいアメリカ人男性」を指定したのですが……。
A photorealistic image of a robust and muscular American man, with distinct chiseled features, as if taken straight from a high-quality photograph, heartily enjoying a bowl of Yokohama-iekei ramen. The ramen boasts a thick and cloudy pork broth, accompanied by thick noodles, and garnished with 3 slices of chashu pork, a sprinkle of chopped green onions, 2 pieces of nori seaweed, and a soft-boiled egg split in half. He's captured mid-slurp, eyes focused on the bowl, embodying the pure satisfaction of savoring the dish
A photorealistic image of a robust and muscular American man, with distinct chiseled features, as if taken straight from a high-quality photograph, heartily enjoying a bowl of Yokohama-iekei ramen. The ramen boasts a thick and cloudy pork broth, accompanied by thick noodles, and garnished with 3 slices of chashu pork, a sprinkle of chopped green onions, 2 pieces of nori seaweed, and a soft-boiled egg split in half. He's captured mid-slurp, eyes focused on the bowl, embodying the pure satisfaction of savoring the dish
人物画像の生成に関しては、Stable DiffusionなどでLoRAのような追加学習も使った方が、クオリティは高いかもしれません。ただ、サクッと作りたいときには「ChatGPT+Midjourney」のコンボが最適でしょう。
今回は、画像生成AIとChatGPTを組み合わせて特定の画像を作るプロセスを、詳しく説明してみました。ぜひ、これを応用して作ってみたかった画像生成にチャレンジしていただければと思います。また、ニーズがあれば画像生成系の記事も書いていきますので、やってみたいことや質問がありましたら、SNSなどでシェアやコメントをお寄せください。
今回は、画像生成AIとChatGPTを組み合わせて特定の画像を作るプロセスを、詳しく説明してみました。ぜひ、これを応用して作ってみたかった画像生成にチャレンジしていただければと思います。また、ニーズがあれば画像生成系の記事も書いていきますので、やってみたいことや質問がありましたら、SNSなどでシェアやコメントをお寄せください。
チャエン
株式会社デジライズ 代表取締役、GMO AI & Web3株式会社 顧問
AIシステム開発・販売を行う株式会社デジライズをはじめ、他数社の代表取締役。GMO AI & Web3株式会社など他数社の顧問も兼任。Twitterはフォロワー8.6万人。日本初AIツール検索サイト「AI Database」やAIニュースレターも運営。ABEMAやTBSテレビなどメディア出演も多数。
X: @masahirochaen