当前位置:首页 > 业内新闻

论文速递丨TPAMI 面向模态缺失场景的对话情感识别方法

来源:情感计算Affective Computing发布时间:2023-01-29


TPAMI 2023:面向模态缺失场景的对话情感识别方法

论文链接:https://ieeexplore.ieee.org/abstract/document/10008078

论文代码:https://github.com/zeroQiaoba/GCNet

论文作者:连政1、陈岚1、孙立才1、刘斌1、陶建华2

单位:1中国科学院自动化研究所,2清华大学

 

在真实交互场景中,人声混叠、背景噪声、面部遮挡等多种因素干扰会导致数据缺失,制约了情感识别算法的性能。针对模态缺失问题,现有方法主要针对静态图像数据或者单独句子,并未考虑交互场景下动态视频数据内部的时序关联模式以及情感表达的连续性在数据补偿过程中的重要作用,导致现有方法并不适用于面向交互场景的情感识别任务。针对上述问题,本文提出了一种面向模态缺失场景的对话情感识别框架。该方法研究结合时序与模态关联模式的缺失数据补偿方法,并进一步研究数据补偿与情感分析的协同建模架构,实现缺失条件下多模态情感信息补偿,增强交互场景下情感识别模型的抗干扰能力。

1 面向模态缺失场景的对话情感识别框架

 

相比于已有工作,本文较早关注于对话情感识别任务中数据缺失这一问题,并验证了对话数据中的时序信息和说话人信息不仅对于模态完备数据非常重要,对于模态缺失数据同样重要。并且随着缺失率的上升,两部分信息对于情感识别任务的重要度也在显著增加。

本文在多个基准数据集上验证了所提方法的有效性。在情感识别性能和数据补全性能两项核心指标上,所提方法在不同缺失率下相比于现有方法均取得了性能提升。并且缺失率越高,所提方法的优势更加明显。

2 情感识别性能比较

 

3 缺失补全性能比较

 

此外,本文对不同方法的隐层特征进行了可视化分析,可以看出所提方法能使不同情感类别隐层特征的边界更加清晰。

4 不同方法隐层特征可视化

 

 

引用信息:

Lian, Zheng, Lan Chen, Licai Sun, Bin Liu, and Jianhua Tao. "GCNet: Graph Completion Network for Incomplete Multimodal Learning in Conversation." IEEE Transactions on Pattern Analysis and Machine Intelligence (2023).




作者简介:


1712113968114.jpg

连政,助理研究员,2021年于中科院自动化研究所模式识别与智能系统专业获得工学博士学位。2021年7月至今在中科院自动化所模式识别国家重点实验室工作。研究方向为情感计算。参与多项国家自然科学基金以及华为、蚂蚁金服等多项企业合作。


1712113975185.jpg

刘斌,副研究员,硕士生导师。2007年毕业于北京理工大学获得学士学位,2009年毕业于北京理工大学获得硕士学位,2015年于中科院自动化研究所模式识别与智能系统专业获得博士学位。2015年7月至今在中科院自动化所模式识别国家重点实验室工作。研究方向为情感计算、音频处理等。


1712113983703.jpg
陶建华,清华大学长聘教授、博士生导师,国家杰出青年科学基金获得者,国家万人计划科技创新领军人才,享受国务院政府特殊津贴人员。完成多项国家和国际标准,论文和成果曾多次获国内外学术会议奖励。兼任中国计算机学会会士和常务理事、中国人工智能学会常务理事等职务。

Baidu
map