Stability AI日本代表ジェリー・チーに聞く クリエイターがジェネレーティブAIと良好な関係を築くには?
文章を入力するだけで画像が生成できる画像自動生成AIの「Stable Diffusion」や「Midjourney」、対話型のAIチャットボット「ChatGPT」など、日本でも昨年から、「ジェネレーティブ(生成)AI」が大きな話題になっている。その理由は、ジェネレーティブAIの活用に関して、短期的な視点での利点と長期的な視点での期待があるからだ。
まず短期的な視点ではジェネレーティブAIを使うことで、アニメーションや着色作業の自動化や、自分の文章力の向上などの利点が挙げられる。また長期的な視点では、AIがほとんどの仕事やプロジェクト、趣味において補助や拡張の役割を果たすようになると予想されており、人間のクリエイティブな活動において大いに役立つことが期待されている。
まず短期的な視点ではジェネレーティブAIを使うことで、アニメーションや着色作業の自動化や、自分の文章力の向上などの利点が挙げられる。また長期的な視点では、AIがほとんどの仕事やプロジェクト、趣味において補助や拡張の役割を果たすようになると予想されており、人間のクリエイティブな活動において大いに役立つことが期待されている。
クリエイターたちの間で生じる“AI脅威論”の実際
しかしながら、ジェネレーティブAIの登場によって、一部のクリエイターたちの間では“AI脅威論”とも言うべきものが生じている。その理由について、Stable Diffusionを開発するStability AIの日本代表、ジェリー・チー氏は「人々がAIに対する反感や脅威感を感じる理由は少なくとも3つある」と語る。
「1つ目はAIに関する誤解です。画像生成AIがただ画像をコピーしてコラージュを作っているだけだという誤解が反感を引き起こす原因となっています。2つ目の理由は新しい技術は恐れられることが多いということです。歴史的にも自動車が発明された当時、馬を飼っていた人が脅威を感じたように、新しい技術に対して恐れを感じる人がいますが、それはある種、自然な反応だと思います。
3つ目は、AIが何でもできる万能な存在だという誤解です。実際にはAIにはまだ限界があり、むしろ人間がいないとできないことがほとんどです。AIは完全に人間に代わるものではなく、今後は人間とAIの組み合わせが労働市場において最も競争力を持つことになると思います。
ただ、テクノロジーを拒否する人はAIをうまく使いこなす人に比べて仕事が減る可能性はあります。そういった新しいテクノロジーを使いたくない人にとっては、確かにAIは脅威になるかもしれません」(ジェリー氏)
「1つ目はAIに関する誤解です。画像生成AIがただ画像をコピーしてコラージュを作っているだけだという誤解が反感を引き起こす原因となっています。2つ目の理由は新しい技術は恐れられることが多いということです。歴史的にも自動車が発明された当時、馬を飼っていた人が脅威を感じたように、新しい技術に対して恐れを感じる人がいますが、それはある種、自然な反応だと思います。
3つ目は、AIが何でもできる万能な存在だという誤解です。実際にはAIにはまだ限界があり、むしろ人間がいないとできないことがほとんどです。AIは完全に人間に代わるものではなく、今後は人間とAIの組み合わせが労働市場において最も競争力を持つことになると思います。
ただ、テクノロジーを拒否する人はAIをうまく使いこなす人に比べて仕事が減る可能性はあります。そういった新しいテクノロジーを使いたくない人にとっては、確かにAIは脅威になるかもしれません」(ジェリー氏)
Stability AI日本代表のジェリー・チー氏
AI開発者とクリエイターが良好な関係を築くために
機械学習で学習データとして使用した絵柄や画風に、AIが生成した画像が類似している場合、それは元データの著作権を侵害している可能性がある、という法律関係者の見解がある。一方で、「絵柄や画風自体は著作権保護されていないアイデアであり、類似しているかどうかの判断は最終的には裁判所の判断になる」とも言われている。
著作権の問題に関して、ジェネレーティブAIを開発する側としては、クリエイターとどのような関係を築くべきだと考えているのだろうか。ジェリー氏は「あくまで弁護士などの専門家ではない、個人としての意見」と前置きした上で、こう語る。
「Stability AIは人間の能力をAIで補助し、拡張させることを目標にしており、クリエイターと良い関係を築きたいと考えています。ただ、全てのクリエイターの要望を満たすAIを作ることは難しい。全員の要望を満たすことに注力していると、結局何も貢献できないということになってしまいます。だからこそ、クリエイターやAIコミュニティ、政府、企業、業界団体なども含めていろいろな意見を聞き、バランスをとりながらジェネレーティブAI業界を盛り上げて、クリエイターたちの能力や作業効率を改善していくことを目指しています」(ジェリー氏)
一例として、「haveibeentrained.com」というウェブサイトでは、アーティスト名を入力することで、そのアーティストの画像がStable Diffusionモデルの訓練データに含まれているかを確認でき、もし自分の画像を機械学習されたくない場合は除外することも可能だ。ジェリー氏はクリエイター側に主導権を与えることで「AIで学習されることを気にするクリエイターとの関係も良くしていきたい。また何か提案があれば、コミュニティからも意見を聞きたい」と言う。
将来的に画像生成AIの開発会社が、自分のコンテンツを学習モデルとして提供したクリエイターにその分のロイヤリティを支払うことも考えられるのだろうか。これはクリエイターからすると気になる問題だ。ジェリー氏は「Stability AIではクリエイターから寄せられる意見は基本的には何でも検討したい」としながら、現実的にそのためのシステムや仕組みをどう実装するかには課題がある、と説明する。
「現時点ではStable Diffusionの訓練データセットに含まれる全ての画像の作成者を特定して連絡を取る方法がないため、それは難しいと言わざるを得ません。またアーティストの中には銀行口座を持っていない人もいます。こういった著作権関連の支払いをブロックチェーンで管理するというアイデアもありますが、それに関してもまだうまく機能するかどうかはわかりません。しかし、いい仕組みやシステムのご提案がある方は、ぜひご連絡いただければと思います」(ジェリー氏)
著作権の問題に関して、ジェネレーティブAIを開発する側としては、クリエイターとどのような関係を築くべきだと考えているのだろうか。ジェリー氏は「あくまで弁護士などの専門家ではない、個人としての意見」と前置きした上で、こう語る。
「Stability AIは人間の能力をAIで補助し、拡張させることを目標にしており、クリエイターと良い関係を築きたいと考えています。ただ、全てのクリエイターの要望を満たすAIを作ることは難しい。全員の要望を満たすことに注力していると、結局何も貢献できないということになってしまいます。だからこそ、クリエイターやAIコミュニティ、政府、企業、業界団体なども含めていろいろな意見を聞き、バランスをとりながらジェネレーティブAI業界を盛り上げて、クリエイターたちの能力や作業効率を改善していくことを目指しています」(ジェリー氏)
一例として、「haveibeentrained.com」というウェブサイトでは、アーティスト名を入力することで、そのアーティストの画像がStable Diffusionモデルの訓練データに含まれているかを確認でき、もし自分の画像を機械学習されたくない場合は除外することも可能だ。ジェリー氏はクリエイター側に主導権を与えることで「AIで学習されることを気にするクリエイターとの関係も良くしていきたい。また何か提案があれば、コミュニティからも意見を聞きたい」と言う。
将来的に画像生成AIの開発会社が、自分のコンテンツを学習モデルとして提供したクリエイターにその分のロイヤリティを支払うことも考えられるのだろうか。これはクリエイターからすると気になる問題だ。ジェリー氏は「Stability AIではクリエイターから寄せられる意見は基本的には何でも検討したい」としながら、現実的にそのためのシステムや仕組みをどう実装するかには課題がある、と説明する。
「現時点ではStable Diffusionの訓練データセットに含まれる全ての画像の作成者を特定して連絡を取る方法がないため、それは難しいと言わざるを得ません。またアーティストの中には銀行口座を持っていない人もいます。こういった著作権関連の支払いをブロックチェーンで管理するというアイデアもありますが、それに関してもまだうまく機能するかどうかはわかりません。しかし、いい仕組みやシステムのご提案がある方は、ぜひご連絡いただければと思います」(ジェリー氏)
わいせつな画像など問題のある画像生成への対策
画像生成AIには、著作権侵害だけでなく、わいせつな画像など、問題のある画像を生成してしまう可能性もある。現状の対策について、Stability AIでは「(不適切な画像が)意図せず生成されないようにするために、モデルの改善に取り組んでいる」とジェリー氏はいう。
具体的には、生成される画像がインプットされたテキスト情報に近いものになるよう、オープンソースコミュニティとプロジェクトを進めているという。また、わいせつな画像が含まれていないか調べることができるAIモデルも公開するなど、高品質なAI生成画像の実現に向けた取り組みを行っている。
一方で意図的にわいせつな画像を生成するケースについては、「国や文化によってどこからがわいせつかの基準が異なるため、判断が哲学的で難しい」とジェリー氏は言う。
「児童ポルノなどはどの国でも良くないので、生成が非常に難しくなるよう努力しています。例えば、訓練データから裸の人間の画像を除外するなどです。しかしビキニの写真などは国によっては問題ないと考えられているため、多くの場合では問題ないと考えています」(ジェリー氏)
具体的には、生成される画像がインプットされたテキスト情報に近いものになるよう、オープンソースコミュニティとプロジェクトを進めているという。また、わいせつな画像が含まれていないか調べることができるAIモデルも公開するなど、高品質なAI生成画像の実現に向けた取り組みを行っている。
一方で意図的にわいせつな画像を生成するケースについては、「国や文化によってどこからがわいせつかの基準が異なるため、判断が哲学的で難しい」とジェリー氏は言う。
「児童ポルノなどはどの国でも良くないので、生成が非常に難しくなるよう努力しています。例えば、訓練データから裸の人間の画像を除外するなどです。しかしビキニの写真などは国によっては問題ないと考えられているため、多くの場合では問題ないと考えています」(ジェリー氏)
Jun Fukunaga
ライター・インタビュワー
音楽、映画を中心にフードや生活雑貨まで幅広く執筆する雑食性フリーランスライター・インタビュワー。最近はバーチャルライブ関連ネタ多め。DJと音楽制作も少々。