テキスト生成AI:「対話型AI」の超基本的な仕組み
キーワードやテーマを元に文章を作ったり、要約したり、それを対話の形で書き起こしたりするAIであるテキスト生成AI(以後、TGA:Text Generative AI)の領域は、多岐にわたります。また古くから存在するAIです。
最近では、TGAと言えばGPT-3(編集部注:人間が使う言葉を理解するAIのひとつ)やGPT-3.5を元にしたChatGPTという空気になっていますが、以前からたくさんのテキスト生成AIが存在しています。古くはカウンセラーを模したMIT(マサチューセッツ工科大学)のELYZAがありますし、有名どころでは、GoogleのBard、不適切な会話によりいち早く物議を醸したMeta(Facebook)のBlenderBotなど、枚挙にいとまがありません。
もう、どこのTGAが優れているかというより、自分にとってどれが使いやすいか、お財布に合うか、用途に合うかで「選ぶ」時代になっていると思います。
ちなみに、ChatGPTを開発したOpenAI社は、イーロン・マスクも出資している会社としても知られています。またしてもイーロン・マスクです。電気自動車、SNS(Twitter)、ロケットビジネス、衛星通信(スターリンク)、AI(ChatGPT)などなど、未来を築く強力なツール、ソフトウェア、ネットワーク、インフラの全てにイーロン・マスクが関わっています。われわれはイーロン・マスクの手のひらで遊んでいるようなものです。
という話はさておいて、2022年の時点で、AI業界では2022年中にGPT-3の後継モデルGPT-4がリリースされるのではないかという噂が出ていました(この文章を校正している3月14日にはすでにリリースされてしまいました!)。
こうした予想を裏切りというか飛び越える存在のChatGPTは、2022年11月にリリースされました。GPT-xが「人間っぽいもっともらしい文章を生成する、あるいは要約する」という機能であったのに対して、ChatGPTは、名称の通り、人と「対話する」機能がメインです。
最近では、TGAと言えばGPT-3(編集部注:人間が使う言葉を理解するAIのひとつ)やGPT-3.5を元にしたChatGPTという空気になっていますが、以前からたくさんのテキスト生成AIが存在しています。古くはカウンセラーを模したMIT(マサチューセッツ工科大学)のELYZAがありますし、有名どころでは、GoogleのBard、不適切な会話によりいち早く物議を醸したMeta(Facebook)のBlenderBotなど、枚挙にいとまがありません。
もう、どこのTGAが優れているかというより、自分にとってどれが使いやすいか、お財布に合うか、用途に合うかで「選ぶ」時代になっていると思います。
ちなみに、ChatGPTを開発したOpenAI社は、イーロン・マスクも出資している会社としても知られています。またしてもイーロン・マスクです。電気自動車、SNS(Twitter)、ロケットビジネス、衛星通信(スターリンク)、AI(ChatGPT)などなど、未来を築く強力なツール、ソフトウェア、ネットワーク、インフラの全てにイーロン・マスクが関わっています。われわれはイーロン・マスクの手のひらで遊んでいるようなものです。
という話はさておいて、2022年の時点で、AI業界では2022年中にGPT-3の後継モデルGPT-4がリリースされるのではないかという噂が出ていました(この文章を校正している3月14日にはすでにリリースされてしまいました!)。
こうした予想を裏切りというか飛び越える存在のChatGPTは、2022年11月にリリースされました。GPT-xが「人間っぽいもっともらしい文章を生成する、あるいは要約する」という機能であったのに対して、ChatGPTは、名称の通り、人と「対話する」機能がメインです。
人と対話するAIの歴史は長い
人と対話するAIというのは実は古くからあり、なんなら最初のテキスト生成系AIが対話型AIであるとも言えます。前出のカウンセラーを模した対話型のAIであるELYZA(1966)が有名です。もっとも、ELYZAは、今となってはこれをAIと呼んでよいのか躊躇するくらいの簡単な仕組みで、どちらかというと昔流行った人工無能の先祖と言えるものです。その後もきっとたくさんの対話型のAIが考案されたことでしょうが、正直、よく分かりません。
ちなみに筆者も2013年に「てきとうパパ」という、子ども(プレイヤー)の問いに対してパパが答えるiOSアプリを出しました。このパパは、最初はまともな応答をするけれど、どんどんテキトーなことを言い出すという、いったい誰用なの?とも言えるアプリです。このときは、WikipediaのDBを利用して「正しい側の」応答をするようにしました(残念ながら現在はApp Storeに並んでおりません)。
で、話を戻すと、OpenAIがGPT-4をリリースする前に、ChatGPTをリリースしてきたというのは非常に驚きました。もっとも、ChatGPTはGPT-3.5をベースとしていますが。単に文章を生成するより、「人との対話を自然に行うことのほうがインパクトのある未来なのだ!」という着眼点と、とんでもない精度に仕上げてきた技術力とスピードには脱帽するよりほかありません。仮に発表が半年遅れたら、AIの世界はGoogleのBardの天下になっていたかもしれません。
ところで、知人の会社の社長が「うちもChatGPTみたいなものを作れないのか」と言ったらしいですが、「社長、おやめになったほうがいいです。ムリです。精神論だけでは到底突破できない力量の差があります。われわれは、ChatGPTをベースにした面白いサービスは何なのかを考える方向に舵を切るほうが、よほど脈あり」と自覚すべきです。
OpenAIが大盤振る舞いでChatGPTを誰でもいじれるようにしたおかげで、TGAがどんなものであるか、みんなが体感できることとなりました。この功績は非常に大きいと思います。AI開発のビジネスをしていると、クライアントから「理屈は分かるけど、いまいちピンとこない」という感想をいただくことが多いのです。ピンとこない最大の原因は、実際に体験していないからだと痛感しています。ですから今後は「対話型AIを使ってですね……」といったビジネスは大変やりやすくなると思います。
前編では生成系AIの“超簡単な”仕組みと背景についてご紹介しました。後編ではChatGPTによって始まった嵐のような「AIブーム3.5」が、人々にどう受け止められ、長年AIと付き合ってきた筆者がそれをどう見ているかをお伝えします。
ちなみに筆者も2013年に「てきとうパパ」という、子ども(プレイヤー)の問いに対してパパが答えるiOSアプリを出しました。このパパは、最初はまともな応答をするけれど、どんどんテキトーなことを言い出すという、いったい誰用なの?とも言えるアプリです。このときは、WikipediaのDBを利用して「正しい側の」応答をするようにしました(残念ながら現在はApp Storeに並んでおりません)。
で、話を戻すと、OpenAIがGPT-4をリリースする前に、ChatGPTをリリースしてきたというのは非常に驚きました。もっとも、ChatGPTはGPT-3.5をベースとしていますが。単に文章を生成するより、「人との対話を自然に行うことのほうがインパクトのある未来なのだ!」という着眼点と、とんでもない精度に仕上げてきた技術力とスピードには脱帽するよりほかありません。仮に発表が半年遅れたら、AIの世界はGoogleのBardの天下になっていたかもしれません。
ところで、知人の会社の社長が「うちもChatGPTみたいなものを作れないのか」と言ったらしいですが、「社長、おやめになったほうがいいです。ムリです。精神論だけでは到底突破できない力量の差があります。われわれは、ChatGPTをベースにした面白いサービスは何なのかを考える方向に舵を切るほうが、よほど脈あり」と自覚すべきです。
OpenAIが大盤振る舞いでChatGPTを誰でもいじれるようにしたおかげで、TGAがどんなものであるか、みんなが体感できることとなりました。この功績は非常に大きいと思います。AI開発のビジネスをしていると、クライアントから「理屈は分かるけど、いまいちピンとこない」という感想をいただくことが多いのです。ピンとこない最大の原因は、実際に体験していないからだと痛感しています。ですから今後は「対話型AIを使ってですね……」といったビジネスは大変やりやすくなると思います。
前編では生成系AIの“超簡単な”仕組みと背景についてご紹介しました。後編ではChatGPTによって始まった嵐のような「AIブーム3.5」が、人々にどう受け止められ、長年AIと付き合ってきた筆者がそれをどう見ているかをお伝えします。
森川 幸人
ゲームAI設計者、グラフィック・クリエイター、モリカトロン株式会社代表取締役、筑波大学非常勤講師
ゲームAIの研究開発、CG制作、ゲームソフト、アプリ開発を行う。ゲーム「がんばれ森川君2号」「ジャンピング・フラッシュ」「アストロノーカ」「くまうた」「ねこがきた」などを開発。ゲームAIに関する論文「ゲームとAは相性がよいのか?」(2017年・人工知能学会)などを執筆。X:@morikawa1go