情绪识别原本是指个体对于他人情绪的识别,现多指
AI通过获取个体的生理或非生理信号对个体的情绪状态进行自动辨别,是情感计算的一个重要组成部分。情绪识别研究的内容包括面部表情、语音、心率、行为、文本和生理信号识别等方面,通过以上内容来判断用户的情绪状态。
情绪是综合了人的感觉、思想和行为的一种状态,在人与人的交流中发挥着重要作用。情绪是一种综合了人的感觉、思想和行为的状态,它包括人对外界或自身刺激的心理反应, 包括伴随这种心理反应 的 生 理反应。在 人 们 的 日 常工作和生活中,情绪的作用无处不在。在医疗护理中,如果能够知道患者、特别是有表达障碍的患者的情绪状态,就可以根据患者的情绪做出不同的护理措施,提高护理 量。在产品开发过程中,如 果能够识别出用户使用产品过程中的情绪状态,了解用户体验,就 可 以 改 善 产 品 功 能,设 计 出 更 适 合 用户需求的产品。在各种人-机交互系统里,如果系统能识别出人的情绪状态,人与机器的交互就会变得更加友好和自然。因此,对情绪进行分析和识别是神经科学、心理学、
认知科学、计算机科学和人工智能等领域的一项重要的交叉学科研究课题。
关于情绪识别的普遍性观点最早可以追溯到查尔斯·罗伯特·达尔文(Charles Robert Darwin)在 1872 年所写的《
人类和动物的表情》一书, 他认为人的情绪和表情是天生的、普遍的, 人们能够识别来自不同文化、种族的人的情绪和表情。
从上世纪 60 年代起许多心理学家通过研究都得出了情绪识别具有普遍性的结论。Ekman 和 Izard 提出人类共具有 6 种基本表情(basic emotion):高兴、愤怒、恐惧、悲伤、厌恶和惊奇。然而, 其他一些心理学家则认为情绪的表达和识别是后天习得的, 具有
文化差异性, 这文种化上的差异在面部表情的强度和对情绪体验的推断等方面都有所体现。
对应于不同的情绪诱发方法,情绪识别方法也各不相同,常见的情绪识别方法主要分成 两大类:基于非生理信号的识别和基于生理信号的识别。基于非生理信号的情绪识别方法主要包括对面 部 表 情 和 语 音 语 调 的 识 别。面 部 表 情 识别方法是根据表情与情绪间的对应关系来识别不同的情绪,在特定情绪状态下人们会产生特定的面部肌肉 运 动 和 表 情 模 式,如 心 情 愉 悦 时 嘴 角 角 上翘,眼部会出现环形褶皱; 愤怒时会皱眉,睁大眼睛等。目前,面部表情识别多采用图像识别的方法来实现。语音语调识别方法是根据 不 同 情 绪 状态下人们的语言表达方式的不同来实现的,如心情愉悦时说话的语调会比较欢快,烦躁时语调会比较沉闷。基于非生理信号识别方法的优点是操作简单,不需要特殊设备。缺点是不能保证情绪识别的可靠性,因为人们可以通过伪装面部表情和语音语调来掩饰自己的真实情绪,而这种伪装往往不易被发现。其次,对于患有某些特殊疾病的残疾人来说,基于非生理信号识别的方法往往难以实现。
基于生理信号的情绪识别方法,主要包括基于自主神经系统( autonomic nervous system) 的情绪 识别和 基 于 中 枢 神 经 系 统( central nervous system) 的情绪识别。基于
自主神经系统的识别方法是指通过测量心率、皮 肤 阻 抗、呼吸等生理信号来识别对应的情绪状态。美国麻省理工学院的 Picard 等人通过对人体自主神经系统的测量和分析,识别出了平静、生气、厌恶、忧伤、愉悦、浪漫、开心和畏惧等 8 种不同的情绪[20]。这些自主神经系统的生理信号虽然无法伪装,能 够 得 到 真 实 的 数 据,但 是 由 于 准 确率低且缺乏合理的评价标准,因此不太适合于实际应用。基于
中枢神经系统的识别方法,是指通过分析不同情绪状态下大脑发出的不同信号来识别相应的情绪。这种方法不易被伪装,并且与其他生理信号识别方法相比识别率较高,因此越来越多的被应用于情绪 识 别 研 究。