GAI警察
人間と同じように絵や文章を生成するAIは、もちろん素晴らしく有用な技術であるのですが、同時にフェイクニュースなどの問題、意図しない盗作問題、社会通念、倫理に反した創作物を創ってしまうといった問題がより深刻なことになるというやっかいな一面を持っています。
ただし、この事実をもって「AIは怖い、危険だ、けしからん」、「試験が無効化されてしまう」、「シンギュラリティーだ、人類が征服される」というあおりは、自分的には無意味な気がしています。
優れた道具は、いい人(=いい使い方)においても悪い人(=悪い使い方)においても「優れている」わけですから、常に使い方次第でダークサイドのツールになるのは自明です。包丁は調理に欠かせない道具であると同時に、日本では犯罪で頻繁に使用される凶器でもあります。
ツール自体に善悪の原因はなく、それを使う人間の問題であるということは、AIにおいても他の便利ツールと同じである。ただ、それだけのことだと思います。そうしたテーマに興味のある方は、ぜひ映画『Winny』をご覧ください。
チューリングテストをやすやす合格してしまうGAIについての監視は必要で、実際に例えば、DetectGPTのようにその文章がChatGPTのつくったモノか否かを判定するツールなどの研究開発も盛んです。また、GAI自体に不適切で悪質な創造物を生まない、表出させない仕組みも進化しています。むしろ、SNSなどに大量に放出される人間によるデマなどの「劣化情報」を監視する方が、筆者には手薄であるように思えます。
ただし、この事実をもって「AIは怖い、危険だ、けしからん」、「試験が無効化されてしまう」、「シンギュラリティーだ、人類が征服される」というあおりは、自分的には無意味な気がしています。
優れた道具は、いい人(=いい使い方)においても悪い人(=悪い使い方)においても「優れている」わけですから、常に使い方次第でダークサイドのツールになるのは自明です。包丁は調理に欠かせない道具であると同時に、日本では犯罪で頻繁に使用される凶器でもあります。
ツール自体に善悪の原因はなく、それを使う人間の問題であるということは、AIにおいても他の便利ツールと同じである。ただ、それだけのことだと思います。そうしたテーマに興味のある方は、ぜひ映画『Winny』をご覧ください。
チューリングテストをやすやす合格してしまうGAIについての監視は必要で、実際に例えば、DetectGPTのようにその文章がChatGPTのつくったモノか否かを判定するツールなどの研究開発も盛んです。また、GAI自体に不適切で悪質な創造物を生まない、表出させない仕組みも進化しています。むしろ、SNSなどに大量に放出される人間によるデマなどの「劣化情報」を監視する方が、筆者には手薄であるように思えます。
AIは大食漢
人間の脳を模した深層神経回路網(以下、DNN:Deep Neural Network)を利用したAIは、学習する際に大量の教師データを必要とします。t2iも例外ではありません。タグ付きの大量の絵が必要になります。これはつくるのも集めるのも大変な手間とコストが発生します。インターネットが普及する前だったら、十分な量の教師データは収集、生成できなかったんじゃないでしょうか。
もし1990年代(2回目のAIブーム期)に、超天才が現在のDNNのアルゴリズムを発明したとしても、インターネットの大規模普及前で、十分な成果は実現不可能だったんじゃないでしょうか。さらに、計算コストも大変なものなので、20世紀のマシンでのDNNの計算はかなりしんどかったに違いありません。このように、AIの進化は、インターネットとコンピューターの進化と密接に関連しているのです。
さて、ではそんな状況の中で、SD(Stable Diffusion)はどうやって教師データを集めたかと言うと、SDはLAION(Large-scale Artificial Intelligence Open Network、ライオン)という非営利団体が提供しているタグ付きのグラフィックデータデータベースを利用しています。
LAIONにはおおよそ58億枚の絵があり、SDは、そのうち10数億枚程度の絵を使って学習させているそうです。が、現在ではもっとたくさんのタグ付きの絵を追加で学習しているに違いありません。
こうしたDBの存在は、現在のAIの学習には必須となっています。各社が自前で数十億単位のデータをつくったり集めたりするのは、ほぼ不可能と言える気がします。
また、逆に、こうしたDBがあるために、Midjourneyの開発会社であるMidjourneyやSDの開発会社であるStability AIといった新興のIT企業が、GoogleやMicrosoftやMETA(元Facebook)などの大手に肩を並べるというか飛び越すことが可能になったとも言えます。
ちなみに、タグ付きの画像データをつくる仕事には、どうしても人力に頼らざるを得ないところがあります。集められる絵には、見るに堪えないタイプの絵も存在しています。そうした絵にタグを付ける作業には精神的な苦痛がつきまといます。AIの学習のために人が苦痛を伴う仕事をしなくてはならないのは、どこか本末転倒な感じがします。「人間のために働くAIのために働く人間」という複雑なヒエラルキーが出来上がりつつあります。
このあたりの人とAIの関わり方や仕事の棲み分けは、今後の社会の重要なテーマとなりそうです。
前編では、主にt2iのクオリティーと人間のアーティストとの関わりについて紹介しました。後編では、GPT-xなどの言葉を生み出すTGAが抱える課題と、生成系AIとの向き合い方を語ってもらいます。
もし1990年代(2回目のAIブーム期)に、超天才が現在のDNNのアルゴリズムを発明したとしても、インターネットの大規模普及前で、十分な成果は実現不可能だったんじゃないでしょうか。さらに、計算コストも大変なものなので、20世紀のマシンでのDNNの計算はかなりしんどかったに違いありません。このように、AIの進化は、インターネットとコンピューターの進化と密接に関連しているのです。
さて、ではそんな状況の中で、SD(Stable Diffusion)はどうやって教師データを集めたかと言うと、SDはLAION(Large-scale Artificial Intelligence Open Network、ライオン)という非営利団体が提供しているタグ付きのグラフィックデータデータベースを利用しています。
LAIONにはおおよそ58億枚の絵があり、SDは、そのうち10数億枚程度の絵を使って学習させているそうです。が、現在ではもっとたくさんのタグ付きの絵を追加で学習しているに違いありません。
こうしたDBの存在は、現在のAIの学習には必須となっています。各社が自前で数十億単位のデータをつくったり集めたりするのは、ほぼ不可能と言える気がします。
また、逆に、こうしたDBがあるために、Midjourneyの開発会社であるMidjourneyやSDの開発会社であるStability AIといった新興のIT企業が、GoogleやMicrosoftやMETA(元Facebook)などの大手に肩を並べるというか飛び越すことが可能になったとも言えます。
ちなみに、タグ付きの画像データをつくる仕事には、どうしても人力に頼らざるを得ないところがあります。集められる絵には、見るに堪えないタイプの絵も存在しています。そうした絵にタグを付ける作業には精神的な苦痛がつきまといます。AIの学習のために人が苦痛を伴う仕事をしなくてはならないのは、どこか本末転倒な感じがします。「人間のために働くAIのために働く人間」という複雑なヒエラルキーが出来上がりつつあります。
このあたりの人とAIの関わり方や仕事の棲み分けは、今後の社会の重要なテーマとなりそうです。
前編では、主にt2iのクオリティーと人間のアーティストとの関わりについて紹介しました。後編では、GPT-xなどの言葉を生み出すTGAが抱える課題と、生成系AIとの向き合い方を語ってもらいます。
森川 幸人
ゲームAI設計者、グラフィック・クリエイター、モリカトロン株式会社代表取締役、筑波大学非常勤講師
ゲームAIの研究開発、CG制作、ゲームソフト、アプリ開発を行う。ゲーム「がんばれ森川君2号」「ジャンピング・フラッシュ」「アストロノーカ」「くまうた」「ねこがきた」などを開発。ゲームAIに関する論文「ゲームとAは相性がよいのか?」(2017年・人工知能学会)などを執筆。X:@morikawa1go