您的位置:首页

详情

开拓语言智能评测 助力人工智能发展——首都师范大学周建设教授创新成果

2018-01-08

当前,世界各国纷纷把发展人工智能作为国家重大战略。作为人工智能重要组成部分的语言智能,业已成为各国重点发展的科技前沿领域之一。人工智能不仅仅是计算,更需要有交互、记忆等关键技术的支撑,因此语言智能不仅是人工智能的亮点,更是人工智能的创新点。“一带一路,语言铺路”,语言智能对于我国科技实力和国际地位的提升、国际影响力的扩大以及“走出去”战略的实现意义重大。

中国语言智能研究中心在首都师范大学副校长、中心主任周建设教授的带领下,汇集了70多位国内外顶级科学家,在语言智能领域深耕细作,形成了一个具有开拓、创新能力的团队,建立了多个高层次平台——中国语言智能研究中心、中国人工智能学会语言智能专业委员会和语言智能博士点等,提出了三个前沿基础理论——全信息评测模型、情感分析四维模型和主题聚合度分析模型,在语言智能评测方面取得了一些成果,并研发了2类产品——汉语作文智能评测系统和英语作文智能评测系统。

一、建设高层次平台

中国语言智能研究中心在北京市语委的科研基地北京语言智能协同研究院的基础上发展起来的,现已发展成为语言智能国际联合实验室和全球汉语教育中心,实现了从人文社会研究到与自然科学研究的交叉融合,是国家语言智能领域的智库。

(一)北京语言智能协同研究院

2013年,基于首都师范大学在语言智能领域取得的科研成果以及语言智能在人工智能领域的发展前景成立了北京语言智能协同研究院。作为研究院创始人和第一任院长,周建设教授带领研究团队开展人工智能领域前沿研究,组织国内外相关学科专家联合攻关,研究了“语言理解-表达-评价模型”和“智能技术应用”,并转化为语言智能产品。

(二)北京多源成像工程中心

2015年,北京市在首都师范大学设立了成像技术高精尖创新中心。语言智能成为该高精尖创新中心建设重点之一,并成立了多源成像智能模式识别与数据可视化工程中心,集中研究连续语音、动态图像数据的识别、分析与合成等关键技术,研发智能学习系统、语音交互、多媒体信息搜索引擎等先进应用产品。周建设教授担任北京成像技术高精尖创新中心副理事长,并出任多源成像智能模式识别与数据可视化工程中心主任。

(三)中国语言智能研究中心

2016年,中国语言智能研究中心建立,周建设教授担任中国语言智能研究中心主任。该中心将自然科学和人文科学研究相结合、语言智能学术研究和应用研究相结合,围绕国家语言文字工作的主线,将学术研究成果服务国家战略,服务社会发展。

(四)语言智能专业委员会

2016年,在中国人工智能学会第七届理事会第三次全体会议上,批准成立了中国人工智能学会语言智能专业委员会。周建设教授出任中国人工智能学会语言智能专业委员会主任。该专业委员会的成立有利于形成相对稳定的高水平研究群体与学术共同体,为国内语言智能领域专家、高校和科研机构以及业内企业沟通交流、合作发展提供了良好平台,对加深语言智能领域研究、加快推进我国语言智能事业的发展、促进多学科间的深度交叉融合、打造中国语言智能高水平研究平台、推动国家基础教育智能化和均衡化发展具有重要作用。

(五)语言智能博士点

2016年,为了加强学科建设和人才培养,基于首都师范大学语言智能科研、人才队伍和学科建设成绩,首都师范大学获批在语言文学一级学科下增设语言智能博士点。这是我国首个语言智能博士点,是语言智能学科建设取得的里程碑式成果,也是语言智能学科进一步发展壮大、引领人工智能发展、服务国家战略的新的起点。

(六)语言智能国际联合实验室和全球汉语智能教育中心

语言智能国际联合实验室是中国语言智能研究中心与国际顶级科研院所美国哈佛大学语言和脑信息工程中心、德国汉堡大学模式识别研究所、日本德岛大学先进智能研究院进行充分协商,逐一确定了合作框架协议而成立的,并以此为基础全面启动了全球汉语智能教育中心建设。语言智能国际联合实验室和全球汉语智能教育中心的建设对于增强我国科技领域的国际话语权和汉语的国际地位具有重要意义。

二、三个前沿基础理论

周建设教授带领的研究团队已经在语言智能领域提出了三个前沿基础理论:全信息评测模型、情感分析四维模型和主题聚合度分析模型。

(一)全信息评测模型

全信息语言评测模型包含词汇、句法、语义、篇章等多种维度,提出了文本语义离散度表示和多知识融合方法,实现了词汇级、句子级、段落级和篇章级等不同粒度的点评、建议和综合评分,解决了机器评测与人工评测拟合度不高的难题。

该模型首先对待评作文进行词汇分析、句子分析、篇章结构分析和内容分析,得到关于词汇、句子、篇章结构和内容的子维度,分别对这些子维度进行划分,最终得到全方位评测特征描述,每个维度与作文的最终评分结果具有线性相关性、单调性、独立性、牵制性和平衡性;然后根据每一个维度,对待评分文章进行评分计算,得到多个评分结果;接着对多个评分结果进行加权处理,获得待评分作文的最终评分结果。从每一个句子中提取语言点,将语言点与语料库中的语言点进行匹配,给出针对句子中该语言点的点评。根据多个句子的点评给出所述段落的点评,根据多个段落的点评给出整篇文章的点评。当给出最终评分结果时,给出的相关点评(包括句评、段评和总评)也是实时持续更新的,这样有利于学习者根据这些点评提高语言能力。

(二)情感分析四维模型

情感计算系统包括表情识别、姿态识别、人体跟踪、情感语音识别和情感语音合成五大部分。情感建模包括情感测量及量化方法、情感特征挖掘、情感识别与合成模型、认知与情绪的关系等四方面。具体的情感分析计算包括文本情感分析、语音情感分析、生理信号情感分析和面部表情情感分析等。情感分析四维模型包括“读音知情”“读文知情”“读脸知情”和“读波知情”。情感分析成果可以应用到课堂教学过程中。通过对学生做心电、心率等情感相关的数据收集并进行情感分析,结果可以用来检测特定学生的听课状态或者学生整体的听课状态。

(三)主题聚合度分析模型

主题聚合度计算方法以论域主词为考察重点,针对作文整体内容和结构是否紧凑这一问题,借鉴主题词抽取和论域划定,探索构建论域主词的语义网络模型,设计篇章主题聚合度算法,进而判定文章与主题的契合度。

主题是作者在文章中借助各种材料表达的中心意思,往往表现为论域主词指称对象的集合,或者说,主题是论域主词的集中反映;论域主词以主题为核心,围绕主题,按照语义逻辑形成正态分布,结合谓语展开叙述。论域是论域主词的上位概念,是论域主词的义类抽象。因此,论域主词在主题实现上起着关键作用。一个段落的中心、一篇文章的主题,可以通过论域主词来表征。主题聚合度计算模型的提出为语言智能评测提供了一个重要的评价方法。

三、语言智能评测代表性成果

目前,中国语言智能研究中心研发的语言智能评测产品主要有两类:汉语作文智能评测系统和英语作文智能评测系统。

(一)汉语作文智能评测系统

汉语作文智能评测系统是为提高教师工作效率,提高学生汉语写作水平而打造的。该系统高度重视写作教学过程中的师生交互,重视写作过程的管理、监测和指导,能够客观高效、不受时空限制地提高汉语写作教学水平,目前可以对国内小学生汉语作文、海外华裔学生汉语作文和留学生汉语作文进行自动批改。

具体批改流程是:数据挖掘-评级-打分-纠错-提供范例。打分细则、评级参数、常用范式等要点可从语料库中挖掘得出,大数据的支撑使得批改结果更客观,更科学。数据来源上,汉语作文智能批改系统拥有30万篇中小学汉语作文、300套左右的语言汉语教材和30亿字的母语者语料库,分级大纲、题材库和语法规则库的确定都是在此基础上进行的数据挖掘。

汉语作文批改系统做了五个方面的探索:初步建立了作文能力测评体系和分级大纲、细则,包括字、词、语法的分级大纲;在字词语法查错、常用搭配发现方面做了尝试;提出了篇章层面的结构紧凑度、主题聚合度的计算方法以及语用修辞层面上语言艺术的评测方法;在个性化、针对性主题分类点评方面取得了突破。

主题聚合度领域是汉语智能评测探索的重点。周建设教授开创性地提出一种计算篇章聚合度的新方法,通过抽取论域主词来模拟人脑神经概念网络,构建论域主词语义关系模型,并跟据语义关系模型计算篇章主题的聚合度,依此判断文章主题是否聚合,结构是否紧凑。具体操作有论域主语提取、主题度计算、篇章与主题契合度计算和主语主题聚合度判断。在语言艺术风格计算领域,基于典雅词语句式库、辞格知识库、名言佳句知识库和优美词句知识库等四大知识库,综合判定作文的语言艺术风格。在个性化、针对性分类点评方面,不同题材、不同年级对学生的写作能力的要求是不一样的,评语的模式会有所不同。同时,在每一类模式的每一类特征中都会有各自具体的维度,总共有100多个维度。每一个维度又有详尽的操作规则。

(二)英语作文智能评测系统——批改网

“批改网”是北京语言智能协同研究院主导下自主研发的英语作文批改系统,以全国大中小学学生英语作文作为评测对象,提供全面有效服务。和传统英语教学模式相比,批改网具有评测实时化、客观化和个性化这三大特点。批改网拥有海量的标准语料库,能够从192个不同维度对每一篇英语作文进行点评。如今,批改网已经发展成为我国规模居首的英语写作学习平台。截至2017年8月,批改网已覆盖包含港澳台在内的90%的国内大学市场,并正在全面拓展到中小学领域,共拥有1 800万学生用户,6 000多所学校用户,累计批改英语作文3.43亿篇。在这样一个庞大的用户人群基础上,批改网可以实时获取真实的中国学生英语学习的相关数据,无论是从词汇、搭配,还是短语、句子层面都已实现在线实时反馈,并能够从不同层面给出修改建议和参考,提供实时化批改结果。

批改网具有六种主要功能:一是自动批改,提高效率;二是海量题库,一键布置;三是数据分析,因材施教;四是知识难点,在线查询;五是多次修改,不断提高;六是相似检测,防止抄袭。除此之外,批改网的功能还有:老师批量给分(群批)功能、学生匿名互评功能、师生实时互动功能、学期分析报告功能、一键导出作文功能和数据服务、培训服务、出版服务等。

目前,批改网以英语作文自动批改为特色,正在逐步成长为提供英语听说读写译全题型的智能学习和批改平台。

专家简介

周建设,教授,博士生导师。2000—2001年在美国堪萨斯大学、德克萨斯大学作高级访问学者,2002年获武汉大学哲学博士学位。首都师范大学副校长,教育部国家语委中国语言智能研究中心主任,中国人工智能学会语言智能专业委会主任委员,全国科技名词审定委员会语言学名词委员会委员,教育部课程资源建设专业委员会委员,国家社科重大项目首席专家,北京市科协、社科联两界协同创新基地——北京语言智能研究基地主任,北京市语委专家委员会主任委员,北京成像技术高精尖创新中心副理事长,语言智能国际联合实验室主任。首都师范大学应用语言学、语言智能学科负责人。

  主要从事形式句法与逻辑语义、数理逻辑与语言智能研究,主持国家重大项目、重点项目、北京市高精尖创新项目、重点项目等多项,发表学术论文100余篇,出版专著6部,获著作权30余项。提出“语言智能”概念,创立语言智能学科,强化语言理论与智能技术融合,创建语言智能表达、评测模型。获北京市哲学社会科学优秀成果二等奖、北京市优秀教学成果一等奖、国家教学成果二等奖。