问题概述:
随着近年来智能设备的普及,纯粹的命令式操作及其机械性的响应逐渐无法满足自然人机交互的需要,人们开始追求更高层次的人机交互技术。脑电能够在人与外部设备之间建立直连通路,不通过直接的语言和动作向外界传达大脑的思想,使机器像人一样自然地进行“感知”交互。脑电的发展不由地引发了人们的思考,人与人间的交流自然且富有感情,如何使与人交互的机器具有类似的观察、理解和生成情感特征的能力,是待解决的科学问题。人机情感交互使计算机以自然的方式识别用户传达的情绪信息,旨在改善人机交互,使其变得更加自然舒适。随着情感计算等技术的不断发展,情感交互已经成为未来超信息时代人机交互的主要发展趋势。目前情感交互已经成为人工智能领域中的热点方向,国内外众多团队企业已经开始人机情感交互技术的研发工作。
情感交互是一个交叉学科,涉及神经系统科学、心理学、计算机科学和语言学等学科。在计算机领域,情感交互也是研究的重点,在该领域情感交互又被称为情感识别、情感计算或自动情绪识别等。为了对情感进行量化的研究,首先需要量化定义人类的基本情感,这些工作在心理学和计算机等领域已经被深入研究[1][2]。在情感交互方式上,早期的情感交互多以单一方式判别用户的情感信息,这些交互方法包括语言[3]、人脸表情[4][5][6]和肢体姿态[7][8][9]等。但是这些基于单一模式的交互方法存在局限性,如应用场景特定、无法充分利用多种语义线索和交互系统性能低等。随着机器学算法的进步、运动采集设备的普及与发展,基于多模式的情感交互方法的优势逐渐显现,一些有代表性的工作如Wollmer等人[10]使用双向长短期记忆网络的方法,从语音和人脸视频两种数据中对用户的情感进行识别;Kahou等人[11]利用递归-卷积神经网络(CNN-RNN)对面部表情进行建模,并采用支持向量机(SVM)的方法处理音频特征,提出了一种基于神经网络的特征融合技术,用于对视频中人物进行情感预测。但是目前基于多模式的人机情感交互方式的研究依然处于起步阶段,相关研究方法和成果较少[12][13]。未来的发展方向是将多模式交互方式与机器学习方法更紧密地结合,并通过互联网众包等方式收集海量数据,以更好地挖掘各种模式与情感之间潜在相关关系。
虽然情感交互在研究领域已经取得可喜的成果,但在未来的发展中还面临如下关键问题和挑战:首先,目前人机情感交互的物理交互方式单一,理想的人机情感交互应结合表情、语音、眼神、手势等多种交互方式,并使用具有脸部和躯体的仿生机器人作为情感交互的物理媒介。此外,目前人机情感交互软件较为简单,在未来需要借助更高级的算法完成情感感知与传达。如何调整交互模式来更好地为用户提供服务、如何将用户的反馈与计算机的操作相关联、如何以舒适可靠的方式感知和识别用户传达的情感信息,是人机情感交互软件面临的挑战。最后,目前人机情感交互中信息处理方式多种多样,其中情感表达方式、情感描述方式、情感获取方法和处理流程等均缺乏统—的标准,未来应在物理和软件层面制定统一标准,为情感交互的技术研发和产业发展提供良好的环境。
情感交互致力于使机器尝试感知与传递情感信息,给数字世界带来了情感智慧,这将是人机交互领域乃至电子信息领域上一次里程碑式的革新,也将引领多个行业产生革命性进步。在消费和服务领域,具有情感交互功能的新型客服机器未来可能完全取代人工客服;在工业领域,具有情感交互功能的机器人将明显提升生产和工作效率。
目前绝大部分设备仍通过纯命令或简单的肢体运动进行交互。情感交互问题的解决可以提供智能舒适的情感交互接口,带来更加人性化的交互体验,这不仅是人机交互领域的一次重大革新,更会极大促进传感器技术、运动捕获技术、人工智能和生产制造等领域的发展。情感交互技术革命式的更新,将为各类产业带来不可估量的经济效益。例如,在服务业中,情感交互技术可以通过智能服务系统为人类提供便捷和精准的服务,如医院及养老院的护理机器人;在广告业和商业中,情感计算机器人通过观测记录人的情感变化、测试人类的兴奋点,来分析人类对某些产品或事物的看法和态度,以推动商业指向性的发展等。同时,情感交互技术对未来社会生活的影响也不容小觑。比如,应用该技术检测驾驶员在行车中的情绪和行为状态,预防疲劳驾驶等危险状况,从而在一定程度上减少交通事故;甚至在医疗领域,对自闭症等病人的情绪进行监测和康复治疗,可以减少社会负担。因此拥有“情商”的智能系统的出现及应用,将为经济发展和社会生活带来更加美好的明天。