您的位置:首页

详情

中文情感语义计算技术与系统

2015-10-21

语言的深层次语义分析理解始终是困扰自然语言处理技术发展的瓶颈之一,而中文的语义处理,更因其特有的词形、语法、语义等多方面特点给计算机处理带来了巨大挑战。合肥工业大学承担的国家863计划信息技术领域“大规模中文语义信息处理技术与系统”项目“中文情感语义计算技术与系统”课题,以实现语言的深层次语义分析理解为目标,构建富含多层次语义信息的大规模汉语基础资源库和知识库,在中文的语义基础资源建设、知识表示、知识获取、语义分析技术以及文本理解等方面取得创新性成果。经过三年多的刻苦攻关,建立了大规模中文情感语义库,词规模达到了3200万条;以所提出的心状态转移网络理论为基础,发展了中文情感语义计算的理论和技术体系;将中文情感语义计算理论和技术扩展到多模态,搭建了具有自主知识产权的中文情感语义计算系统;将多模态的中文情感语义计算理论和技术与先进机器人技术相结合,研制出具有自主知识产权的中文情感护理机器人。

该课题于2015年7月3日通过验收,课题研究成果在老龄人口护理、残疾人护理、医疗护理等方面有较大市场需求,对中国的弱势人群护理、医疗事业等也将起到一定的推动作用。

一、课题完成情况

该课题构建了中文情感语义库。以文本情感表达的空间模型,从多粒度、多角度,采用机器学习、自动标注与人工校验相结合的方法,建立了大规模中文情感语义库。该库包含评论、会话、微博、博客等多种形式的语料。同时,为辅助人机会话的研究,课题构建了会话情感语料库、语音情感库和人脸表情库。搭建了具有自主知识产权的中文情感语义计算系统。提出并完善了心状态转移网络理论,获得了多模态情感能量的计算方法。围绕中文文本、中文语音以及多模态信息,研究中文情感语义分析、中文情感语义表达的核心技术,完成了句子多维复合情感的识别研究,进行了基于Ren-CECps的微博热点事件情感分析、基于视听觉的情感识别、行为识别与情感计算研究;建立了一整套中文情感语义计算的核心理论,将中文情感语义计算理论和方法的研究成果进行集成,完成了视频认知导览系统,基于POMDP模型的情感对话系统,人形机器人自动表情生成、表情识别和情感建模等几个系统。

将中文情感语义计算系统在先进智能机器人上进行了部署验证,研制了具有中文情感语义计算能力的智能导览机器人(图1)、情感陪护人形机器人(图2)、高级交互式代步机器人(图3)。

课题发表论文57篇,其中SCI论文13篇。获发明专利授权1项(设有信号反弹模块的3D-SIC过硅通孔的测试装置,ZL201210330159.0)。获得6项软件著作权。“情感计算·人工心理的理论及其应用”研究成果获得第二届“吴文俊人工智能科学技术奖”创新奖一等奖,“基于先进智能的高级交互式代步机器人”研究成果获得第四届“吴文俊人工智能科学技术奖”进步奖三等奖。

二、关键技术及创新点

1.以文本情感表达空间模型为框架,从多粒度、多角度出发构建了大规模情感语义库

综合机器学习和人工检校技术,建立大规模中文情感语料库和语义库。具体包括文本情感表达的空间模型、大规模中文情感语义库的标注知识、词语多维情感的自动标注、句子多维情感的自动标注等。标注分为三个层次:文本层、段落层、句子层。句子层的标注是整个情感语料标注的最基本层面,该层次的标注对象包括:八种基本情感类别强度、情感主或情感对象、情感词或情感短语、修辞、情感标点符号(“!”、“?”等)、主客观情感、情感极性等。句子层的上一级为段落层,段落层的标注对象包括:八种基本情感类别强度、反映该段落主题的主题词以及表达该段落主要思想的主题句数量。该语料库的最高标注层面为文本层,文本层的标注对象与段落层一致。标记好的文本文件被组织成XML格式的文档,标记属性中包括中文分词标记及词性标记。

前期的博客语料已经授权包括北京邮电大学、东京大学、哈佛大学、香港理工大学、香港中文大学、富士康公司等多所大学、科研单位和个人用于情感识别的研究。

2.中文情感语义计算核心理论

将中文情感语义计算理论和技术扩展到多模态,融合心状态转移网络理论,搭建了中文情感语义计算系统。围绕中文文本、中文语音以及多模态信息,研究中文情感语义分析、中文情感语义表达的核心技术。探究了情感的分类体系,完成了句子多维复合情感的识别研究,进行了基于Ren-CECps的微博热点事件情感分析。面向视觉、语音、行为的层面,进行了基于视听觉的情感识别、行为识别与情感计算研究。研究了多模态的情感计算。针对中文文本信息的正负情感识别准确率达到91.8%。基于以上研究建立了一整套中文情感语义计算的核心理论。

3.中文情感护理机器人

将中文情感语义计算理论和方法的研究成果进行集成,完成了视频认知导览系统,基于POMDP模型的情感对话系统,人形机器人自动表情生成、表情识别和情感建模等几个系统。并且,在先进智能机器人上进行了部署验证,研制了具有中文情感语义计算能力的护理机器人样机,由开发出的情感语音识别系统、智能身份识别与手势控制系统集成研发出情感机器人样机。

三、成果转化及效益情况

合肥工业大学搭建了智能情感语音会话系统、智能身份识别与手势控制系统,该系统已经在合肥工业大学内部进行了测试运行,受到好评。

合肥工业大学联合江西洪都航空工业集团有限责任公司(又名“中航工业洪都”)成立了“合肥工业大学-中航工业洪都”智能服务机器人联合实验室。应对老年化社会需求,基于先进智能理论研发了高级交互式代步机器人,具有高可靠性、高安全性、智能化自动化和强大的情感交互功能,以此改善老年人、病人、残障等人群自助和自给能力,大量减轻社会服务代价。高级交互代步机器人在2013年10月深圳智能博览会、2014年4月重庆高交会和2014年5月重庆渝洽会成功完成了技术功能展示、表演和市场推介,得到相关领导与行业专家的认可和较好的市场反响。目前正开展智能代步机器人的市场推广与产品研究,打造小批量产业。

课题团队的长期研究表明:无论是通信还是网络,都需要智能科学技术的突破;智能科学技术要双管齐下,即兼顾“自顶而下——理想的人工智能”和“自下而上——智能代理”;自然语言理解将贯穿于“数据” “信息” “知识”和“智能”转换过程的始终。因此,课题负责人、情感计算与先进智能机器安徽省重点实验室主任任福继教授在国际上大力推进“先进智能”(Advanced Intelligence)的研究。所谓“先进智能”就是把人工智能与自然智能结合起来、把传统人工智能与计算智能以及行为智能的研究结合起来进行的研究,这样才可以把智能科学技术的研究建筑在先进的“信息科学与系统科学的方法论”基础上。

课题完成单位及负责人简介

完成单位:情感计算与先进智能机器安徽省重点实验室依托合肥工业大学3个博士后科研流动站、3个一级学科博士点以及2个安徽省重点学科建立,是国内首个以情感计算命名的重点实验室。实验室以先进智能为导向,以情感计算为核心,以智能机器为载体,主要从事先进智能、情感计算、大规模知识获取的基础理论研究工作,并以具有情感的先进智能机器人作为核心应用点,系统开展情感计算与先进智能机器的研究。

课题负责人:任福继,1959年2月生,四川南充市人,工学博士,教授,博导,情感计算与先进智能机器安徽省重点实验室主任。本科和硕士毕业于北京邮电大学,博士毕业于日本北海道大学。是日本德岛大学教授,美国新墨西哥州立大学访问教授,先进信息研究院长,中国人工智能学会副理事长,日本工程会首届院士,“长江学者奖励计划”讲座教授,日本大川信息通信基金评审专家,日本科学技术振兴机构等评审专家,中国科学院海外评审专家,中国科协海智专家,网络与交换技术国家重点实验室学术委员。主要从事人工智能、情感计算、智能机器人、自然语言理解以及社会计算研究等。曾获日本源内奖、中国吴文俊人工智能科学技术奖创新一等奖等奖励。