AIが今はまだ空気を読めないワケ
せっかく膨大なデータで訓練されてきたAIであるにもかかわらず、人間なら無意識のうちにできることが理解できないのは、なぜなのでしょうか。その答えは、現在のAIモデルの作り方にあると研究者は指摘しています。
たとえばコンピューターイメージング用のAIは、人間の脳が静止画像を処理する仕組みに着想を得たニューラルネットワークに基づいています。この方法で訓練されたAIは、顔認識や物体検出といったタスクでは信じられないほどの成功を収めており、MRIやレントゲン画像から、医者でも見落としてしまうような病変を発見することもあります。
しかし、実生活は静止した「スナップショット」ではありません。現実の状況は常に動的に変化しており、それを正しく把握するには、複雑な関係性や文脈の変化を理解する力が必要です。そのため、静止画のようなフレーム単位で物事を理解しようとする現在のAIでは、目の前で起きている出来事の全体像や、その背後にあるストーリーを認識できません。こうした限界は、人間とのインタラクションが絶え間なく続く、予測不可能な環境でAIを使う際に、大きな盲点になる可能性があります。
たとえばコンピューターイメージング用のAIは、人間の脳が静止画像を処理する仕組みに着想を得たニューラルネットワークに基づいています。この方法で訓練されたAIは、顔認識や物体検出といったタスクでは信じられないほどの成功を収めており、MRIやレントゲン画像から、医者でも見落としてしまうような病変を発見することもあります。
しかし、実生活は静止した「スナップショット」ではありません。現実の状況は常に動的に変化しており、それを正しく把握するには、複雑な関係性や文脈の変化を理解する力が必要です。そのため、静止画のようなフレーム単位で物事を理解しようとする現在のAIでは、目の前で起きている出来事の全体像や、その背後にあるストーリーを認識できません。こうした限界は、人間とのインタラクションが絶え間なく続く、予測不可能な環境でAIを使う際に、大きな盲点になる可能性があります。
「社会に溶け込むAI」を開発する道のりは長い
今回の研究は、AIが人間と同じように社会に溶け込むためには、単に「見る」「聞く」だけでなく、状況を深く理解するためのモデル設計が不可欠であることを示しています。つまり、静的な場面だけでなく動的な関わり合いを処理できる人間の脳の仕組みからヒントを得るべきであることを意味しています。
命令に従い、物体を認識し、さらには文章を生成するAIを構築するために、AI研究者や開発者は長い年月を費やしてきました。しかし社会的な関わり方については、それを処理するプログラムコードがまだ存在していません。AIが我々と同じような社会性を身につけるには、まだまだ長い道のりが続きそうです。
命令に従い、物体を認識し、さらには文章を生成するAIを構築するために、AI研究者や開発者は長い年月を費やしてきました。しかし社会的な関わり方については、それを処理するプログラムコードがまだ存在していません。AIが我々と同じような社会性を身につけるには、まだまだ長い道のりが続きそうです。

Munenori Taniguchi
ライター。ガジェット全般、宇宙、科学、音楽、モータースポーツetc.、電気・ネットワーク技術者。
実績媒体:TechnoEdge、Gadget Gate、Engadget日本版、Autoblog日本版、Forbes JAPAN他
Twitter:@mu_taniguchi