初心者でも分かる生成系AI入門：ChatGPTが開いた「AIブーム3.5」の扉（後編）

2023.4.14

ChatGPTの登場で、にわかに活気づいたAIの世界。ChatGPTは間違ったことを言うこともあるけれど、AIを古くから知る人にとって、それは「不思議」でも「残念」でもないそうで……？ゲーム系AIの第一人者でグラフィッククリエイターの森川幸人さんによる「初心者でも分かる生成系AI入門」、後編では生成系AIの現状や課題についてゆるく教えてもらいました。

AI研究者にとってChatGPTの「間違い」は想定内

ChatGPTの登場以来、たくさんの人がChatGPTで遊んだ結果をSNSなどに投稿しています。それを読んでいると驚くというか「なるほどなー」と気づかされる点があります。多くのユーザーが「マジ、すげー」とビックリしていると同時に「正しくないこと言っている（残念）」とも言っているのです。

昔から対話型AIに取り組んでいる身としては、ChatGPTに対しては「マジすげー。勝負は終わった。以上！」というのが素直な感想で「正しいことを言わないことがある」というのは、さほど驚かないというか、「Transformerという技術を使っているのだからしょうがないよね。むしろ、それでもここまでできるのか！」という気持ちです。

Transformerとは2017年にGoogleとトロント大学で開発された自然言語を処理する仕組みで、最初は翻訳を活躍の場と想定していたみたいですが、蓋を開けてみたら、とんでもないポテンシャルがある機能であることが分かって、今ではテキスト生成AI（以後、TGA）には欠かせない学習モデルとなっています。

Transformerの機能や構造の説明をしていると、本稿はあと2万文字くらい必要になりそうなので、割愛させてもらいます。というか、これも分かりやすい説明がインターネット上にいっぱいありますので、興味のある方はそれを探してください。ただし、基本構造の理解は超簡単ですが、細かいところまでの理解は地獄。と覚悟してください（笑）。

Transformerをざっくりと説明すると、今まで人間が作ってきた文章を利用して、「言葉A」と関連してよく出てくる言葉は「言葉B」といった結びつきや、文節の関連付けを学習して応用するという仕組みです。

たとえば「柿食えば」という言葉は、「岩にしみ入る」とつながるより「鐘が鳴るなり」につながる文章の方が断然多い。「梨も食う」につながる例はない。といった言葉と言葉の関連付け（の重み）を学習していきます。そしてその学習を利用して、ユーザーが「柿」というキーワードを使えば、即座に“「柿食えば」→「鐘が鳴るなり法隆寺」→「と言いますが...…」”といった具合に文章を作っていきます。

ですので、基本、統計的な判断なのです。人間のように真に言葉を理解しているわけではありません。ですから、正しくないことを言ってしまうわけです。次につなげる単語なり文節は出現頻度に応じて確率的に選ばれるので、確率のいたずらで間違った選択をすることがあります。

そういった背景があるため、AI研究者たちは、ChatGPTがたまに間違ったことを言うと「Transformerを使ってるとそういうこともあるよねー」とつい同情的になってしまうのですが、そうした事情を知らない人は、ちょっと失望するかもしれません。

なにせ、ほとんどの場合は素晴らしく正しいことを言ってくるので、ちょっとの間違いがかえって目立ってしまうことがあります。

不気味の谷の住人

「不気味の谷」という言葉があります。芸術やロボット工学、心理学などの世界で、人間に近づけば近づくほど親近感、好感度が高くなるのですが、ある一定のところまで近づいた時点で、急激に「キモい、怖い、残念」と負の気持ちになってしまう現象です。

TGAもChatGPTの登場により、いきなりその域に達してしまったのかもしれません。

一昔前のTGAなら、人の発話や会話と比べられるようなレベルにはまったく達していませんでした。ですからTGAは人間から「AI君もがんばっているよね」と余裕を持って好意的に、安心して接してもらえていたのに、いざ人間っぽく喋れるようになると「TGAは怖い、危ない、間違えたことを言うので残念」と、TGAを不気味の谷の住人と見なす人間が現れるのも不思議ではありません。

もうひとつ問題点があります。

前回、人の文章を学習データとして学習したと説明しました。人の文章や会話データは、インターネット上から採取されます。ここでも既存のDB（データベース）が活躍します。GPT-xではCommon Crawl（編集部注：インターネット上の文書や画像などを周期的に収集・アーカイブし、無償でデータベースを提供する非営利団体　）が公開しているDBを利用しています。

これ、誰でも自由にアクセスできるDBですが、TB（テラバイト）サイズの大きさがあるので、うっかりダウンロードしないほうがよろしいかと思います。ちなみにGPT-3はそのうち45TB程度のテキストデータで学習していると言われています。

このようにインターネット上に転がっている文章をAIの学習に使っているがために起こる問題もいくつかあります。ひとつは情報の鮮度。GPT-3は2021年までに採取された文章を元に学習しています。そのため、2022年以降に発信されたネタについては学習していません。例えばロシアがウクライナに軍事侵攻したことも知りません。

なぜChatGPTは「ジョン・レノンが属したグループ名は？」をうまく答えられなかった？

9 件

森川幸人

ゲームAI設計者、グラフィック・クリエイター、モリカトロン株式会社代表取締役、筑波大学非常勤講師
ゲームAIの研究開発、CG制作、ゲームソフト、アプリ開発を行う。ゲーム「がんばれ森川君２号」「ジャンピング・フラッシュ」「アストロノーカ」「くまうた」「ねこがきた」などを開発。ゲームAIに関する論文「ゲームとAは相性がよいのか？」（2017年・人工知能学会）などを執筆。X：@morikawa1go