NO.36 言わずとも、 ロボットが心情を察してくれる・・・ 「空気を読めるAI」の開発を目指す!
先進工学部 情報メディア工学科
人工知能研究室
呉本 尭 教授
■機械は人間の心を読めないのでしょうか
「察言観色(さつ げん かん しき)」という四字熟語は、約2,500年前に書かれた「論語」からの出典です。人の言葉や顔表情から相手の性格や心の中を見抜くことの意味をします。こんな能力も備えるロボットの開発は20年以上前から人工知能(AI)分野で行われています。人間の感情を推定しようとする表情認識に関する研究は、近年深層学習(Deep Learning: ディープラーニング)技術の活用より、実用段階までレベルの向上が着実に進んでいます。
【写真1】データベースCK+に含まれる喜怒哀楽など7種類の顔表情
■より複雑な感情を見極めることに挑戦しましょう
「泣いている」顔を見ましたら、「悲しい」感情だと幼稚に推定してしまうのは、昨今のAIです。今後の感情認識は、「嬉しい涙」、「悲しい涙」、「嬉しい笑顔」、「苦笑い」、「夢中」、「嫉妬」などなど、より複雑な感情を識別しようと挑戦しています。つまり、個別の顔のみでなく、背景を含んだシーンの文脈を読み、「空気を読む」ことを目標にしています。また、画像のみでなく、音声、脳波などの情報を集成し、よりスマートなマルチモーダルAIの開発が期待されます。
■AIの仕組み
代表的AIである深層学習モデルは、ユニット数と階層数が共に多いニューラルネットワーク(人工神経回路網)で構成されます。ユニットとは、ニューロンモデルの意味を指し、神経細胞の活動様子を数理モデルで表現した線形、または、非線形関数(グラフの形状は直線,または,曲線となる関数)と理解できます。ユニット間は各自の出力に重み(シナプス:可塑的結合荷重)を加えて互いに結合することによって、ネットワークが構成されます。AIの学習とは、サンプルデータによって、ユニット間の結合荷重やしきい値(バイアスとも呼ぶ)を調整し、ネットワークの期待される出力を達成する過程を指します。
【写真2】ニューロンモデルと非線形関数
■空気が読めるAIの応用
感情認識できるAIは、様々な場面での活躍が期待できます。例えば、
・会話型ロボット
・幼児教育用ロボット
・営業部門の顧客満足度分析
などが挙げられますが、皆様からのご提案も喜んで開発して参りたいと思います。
【動画】これまで開発したオンラインでの顔表情認識システム
(NE:自然 SU:驚愕 DI:嫌悪など7種の顔表情を99.06%の成功率で瞬間に識別できる)