話題の画像生成AIで実写みたいな絵を作る!Stable Diffusionで「BRAV5」を使う方法

小泉 勝志郎

AISpecial使ってみた
私はプログラマーで、普段はシニア向けのプログラミング学習支援を行っているのですが、最近はシニアプログラミング界隈でも、AIに関するビックウェーブが来ています。

シニアも生成AIを活用中!

画像を生成するAIや、「ChatGPT」などの自然な言葉で応答できるAIはまとめて「生成系AI」と呼ばれています。私が運営している団体「シニアプログラミングネットワーク」でも、生成系AIをシニアの皆さんが活用中です。

88歳のiPhoneアプリ開発者・鈴木富司さんは、ChatGPTに指導してもらってプログラミングをしてアプリをリリースし、その経験をもとに本をAmazonで出したほど!

鈴木富司さんの著書『88歳、トミ爺。ChatGPTをSwiftUIのコーディングメンターにする!これでアプリ開発も挫折しらずに』

シニア世代になると新しいものに挑戦しなくなる方が多い中、生成系AIを使ってのアプリ開発挑戦はすばらしいですね。

本記事ではAIを用いた画像生成、それも写真にしか見えないリアルな画像の生成について、具体的なやり方を説明します。ちょっと技術的な用語が出てきたりもしますが、そんなに難しくはありません。自分で作れるようになると楽しいですよ!

※本記事は2023年7月3日時点の情報に基づいて記載しています。

AIで画像を作るには?

手軽にAIで画像を作るにはLINEの「お絵描きばりぐっどくん」やMicrosoft Bingのチャットによる画像生成「Bing Image Creator」などがあります。

お絵描きばりぐっどくんはLINEで公式アカウントをフォローして「どんな画像か」を入力すると画像を作ってくれます。こちらは「ラーメンを食べる女の子」。
Bing Image CreatorはMicrosoftの検索エンジンである「Bing」のAIチャットで「画像を作成してください」と入力すると画像を作ってくれる機能です。
生成された画像を見ると、女の子の目が妙に細かったり、指や手が余計に生えていたりして、直して欲しくなりますよね?

なので、より厳密に出力しようとすると入力する文章が長くなり、初心者には意味不明のものとなっていきます。そのためか、AIで画像を生成するための文章は「呪文」と呼ばれることもあります。

この呪文は一般的には「プロンプト」と呼ばれるものです。

呪文の世界は奥が深くて難しいのですが、今回は「日本人の女の子のAI写真を作る」ことにフォーカスすることで、その入力を簡単にする方法を説明していきます。

アジア系美女のリアルな画像が作れる「BRAV5」

BRAV5は、AIを用いて写真のようにリアルな画像を生成できるAI作画モデルです。BRAとは「Beautiful Realistic Asians」、“写実的な美しいアジア人女性”の略で、V5はそのバージョン5という意味。つまり、BRAV5は美しいアジア女性の写実的な画像生成に特化しています。

「モデル」というとファッションモデルや写真モデルを思い浮かべる人もいるかと思いますが、ここでのモデルはその意味ではありません。AIが大量に画像を学習して、その学習した傾向から新しい画像を作り出す仕組みのことです。

先ほど紹介したお絵描きばりぐっどくんは「Stable Diffusion」というモデルを、Bing Image Creatorは「DALL・E」というモデルを使っています。

2022年8月に生成AIモデルのStable Diffusionがオープンソースとして公開され、瞬く間にその派生モデルがたくさん作られました。Stable Diffusionは写真から絵画、レントゲン写真やドット絵まで、さまざまな画風の画像を作ることができます。ただ、それでは作風が広すぎるので、何か特定の要素に特化した画像を作るために、たくさんの派生モデルが作られたんです。

当初、派生モデルでは日本風アニメ絵のモデルが話題でした。そして、2023年になってから急速に話題になっているのがアジア系の美女を生成できるモデルです。

Stable Diffusionだと、先ほどの作例のように糸みたいな目の日本人にされちゃいがち! ところが派生モデルなら、ちゃんとかわいい日本人系の女の子が出せるんです! BRAV5はその中でも特に人気が高いモデルで、シンガポール出身のPleaseBanKaiさんという方が作成されています。

使いやすいWebインターフェイスを備えた「Stable Diffusion Web UI」

Stable Diffusionは、オープンソースであり誰でも使えますが、利用するにはプログラミングの知識が必要でした。これはBRAV5のような派生モデルを使うときも同様です。

そこで、Stable Diffusionを簡単にインストール・使用できるようにした「Stable Diffusion Web UI」があります。このWeb UIはブラウザから使用できます。Stable Diffusionを実行するために必要なものだけでなく、使いやすくパワフルなWebインターフェースも搭載されているのです!

Stable Diffusionのほかにも優れたAI作画サービスは数多くありますが、AIで作画することにのめり込んだ人の大半は、このStable Diffusion Web UIを使っているのではないでしょうか。

Stable Diffusion Web UIは新機能の追加も盛んで、Stable Diffusionをより使いやすくする拡張機能が頻繁に追加されています。

Stable Diffusion Web UI公式のリポジトリ(プログラム置き場)には、このWeb UIの使用方法などが細かく記載されています。ただ、手順が記載されているとはいえ、プログラミングになじみのない人がこれを実行するのはかなり難しいでしょう。そこで利用したいのが「Google Colaboratory(Google Colab)」というプログラムの実行環境です。

「Google Colab」でBRAV5を動かそう!

Googleが提供するGoogle Colabは、クラウドベース(ブラウザ上)でPythonプログラムを記述・実行できる環境です。今回はGoogle Colab上に、Stable Diffusion Web UIの環境を作成し、BRAV5を読み込んで画像を生成するところまでやってみましょう!

これまで、Pythonのプログラミング学習やデータ解析、機械学習のために使用されてきたGoogle Colabの大きな特徴の1つは、無料でGPU(Graphics Processing Unit)を利用できることです。これがAI画像生成に非常に適しているのです。

GPUとはもともとコンピュータの画面出力を担当する装置で、画像や動画を高速に処理する能力を持っています。そして、その高速な計算能力は近年、機械学習やAIの分野で注目されています。特に、AI画像生成などのタスクでは、大量のデータを高速に処理する必要があり、GPUがないとまず処理ができません。

Google ColabはGoogleのクラウド上で動作するため、パソコンの性能に左右されることなく、インターネット接続が可能な環境であればどこからでもアクセスし、作業を行うことができます。そして、Google Driveと直接連携しているため、作業の保存や共有が簡単です。今回もGoogle Driveを利用します。

Google Colabの利用にはGoogleアカウントが必要です。今はGmailを使っている人も多いのではないでしょうか? Gmailをすでに使っている人ならすぐに使うことができます。

Google Colabの大きな利点は無料使用枠の存在です。筆者はPythonのプログラミング教育にもGoogle Colabを使っています。ただ、GPUを用いると無料枠がすぐに消費されてしまいます。また、最近のトピックとして今回紹介する「Stable Diffusion Web UI」は無料枠でのGoogle Colabの利用に制限がかかっています。

どうやらこれはGoogle ColabのFAQにあるリソースの制限事項で、「リモート デスクトップまたは SSH の使用」に抵触するためのようです。実際にStable Diffusion Web UIを起動すると警告が出てきてしまいます。

そのため、今回の記事ではGoogle Colabの有料版利用を前提とすることをご了承ください。
105 件

小泉 勝志郎

株式会社テセラクト 代表取締役社長
シニアプログラミングネットワーク代表
震災復興活動の中で海藻・アカモクをモチーフにつくったキャラクター「渚の妖精ぎばさちゃん」を運営。Appleの開発者カンファレンスに「81歳のアプリ開発者」として招待された若宮正子さんへの教育をきっかけに、高齢者向けのプログラミング教育にも力を入れ、現在はコミュニティ「シニアプログラミングネットワーク」を運営する。2023年3月「第1回AIアートグランプリ」において「渚の妖精ぎばさちゃん」をテーマにした漫画で準グランプリを受賞するなど、生成AIにも造詣が深い。

ranking

  • 1
    サムネイル

    Googleの最上位AIモデル「Gemini Ultra」が登場!早速試してみました

  • 2
    サムネイル

    お手頃価格でパソコン周りが快適に! コストパフォーマンス抜群の買って良かったデスク周り商品4選

  • 3
    サムネイル

    明日から使える!効率良く手書きメモを取るための8つのコツ

  • 4
    サムネイル

    全部試した!1食250kcalの「マイサイズ」で一番おいしいのは?

  • 5
    サムネイル

    ダイソー・セリア・キャンドゥ 100円ショップのパソコン周りクリーナーおすすめ6種を試してみた

  • 1
    サムネイル

    Googleの最上位AIモデル「Gemini Ultra」が登場!早速試してみました

  • 2
    サムネイル

    ダイソー・セリア・キャンドゥ 100円ショップのパソコン周りクリーナーおすすめ6種を試してみた

  • 3
    サムネイル

    まるでAI秘書!? ChatGPTにはない「Geminiの良さ」とは?具体的に活用するためのポイント

  • 4
    サムネイル

    お手頃価格でパソコン周りが快適に! コストパフォーマンス抜群の買って良かったデスク周り商品4選

  • 5
    サムネイル

    「楽しい」「便利」だけじゃない!カスタムしたGPTsをビジネスでも活用する方法

  • 1
    サムネイル

    ダイソー・セリア・キャンドゥ 100円ショップのパソコン周りクリーナーおすすめ6種を試してみた

  • 2
    サムネイル

    全部試した!1食250kcalの「マイサイズ」で一番おいしいのは?

  • 3
    サムネイル

    時間泥棒を卒業し、仕事をうまく回す!「コミュニケーションコスト」を削減する方法

  • 4
    サムネイル

    逸品発見!100均電子レンジ調理器6選。焼き魚にだし巻き卵、マカロニまで!

  • 5
    サムネイル

    Googleの最上位AIモデル「Gemini Ultra」が登場!早速試してみました

internet for you.