您的位置:首页

详情

创新数据挖掘方法 推进生物信息应用——中国科学院尤著宏研究员

2018-04-27

生物信息学是一门信息科学与生物学交叉而形成的年轻学科,通过运用计算机科学、物理学、化学、数学及系统科学的理论和方法来研究生物系统和生物过程的信息流和信息量,其包含海量生物数据的获取、存储、分配、分析和解释等方面。近年来,随着生物数据的快速累积、人工智能技术的快速发展、崛起以及科学计算能力的大幅提高,极大地扩展了生物信息学研究的领域,为生物信息挖掘的发展注入了新的活力。中国科学院新疆理化技术研究所尤著宏研究员长期从事基于模式识别理论的生物信息数据挖掘研究,利用复杂网络、模式识别、深度学习、数据挖掘等方法对蛋白质组学和非编码RNA和药物靶标发现等生物信息学领域的多个重要问题进行探索和研究,取得了一系列重要进展。

一、创新生物数据建模方法

针对复杂生物信息数据具有的海量、高维、高冗余、高噪声、多类别、多标记等严重制约智能学习算法泛化能力和计算效率的特性,提出了一套完整表征生物数据的特征建模、特征提取及维数约简的新理论、新方法,并对其高维特征进行约减以筛选出最相关的特征,从而提高生物数据高效学习模型的精度和效率,为后续高效模式识别理论的设计奠定了基础。

二、建立高效机器学习理论

生物技术的不断发展对现有的机器学习理论提出挑战,而现有的机器学习理论或算法应用到复杂生物数据上时还存在很多未解决的问题。针对现有研究中所凸显的简单移植成熟算法来处理复杂生物信息数据所面临的挑战和遇到的瓶颈问题,建立了以复杂网络分析为核心的高效学习理论,使之能更好地处理多模态、动态、分层及关联的复杂生物数据。

三、提出药物-靶标预测体系

利用大数据、机器学习等智能计算方法对药物-靶标相互作用进行预测,针对当前药物与靶标蛋白相互作用预测研究所面临的挑战,系统性地提出一套氨基酸序列特征信息编码、药物化合物分子指纹设计、基于非均衡数据集的药物-靶标相互作用预测以及基于Hadoop 分布式平台的药物-靶标相互作用预测方法体系,最终形成一个可用于科学研究的大规模药物-靶标相互作用网络和注释的、开放的生物信息学支撑平台。开发的计算方法能够大大降低研究成本,缩短研究周期,同时,还能帮助理解药物的组合规律和作用机制,对实验方法进行有益补充。

面向后基因组学时代计算生物学家对计算机辅助药物设计的迫切需求,尤著宏研究员团队瞄准生物信息学发展的学科前沿,以“药物开发和设计提供高可信的药物作用的潜在靶标蛋白”为核心目标,针对当前药物-靶标相互作用预测研究所面临的挑战,系统性地提出一套蛋白质序列特征信息提取、药物复合物分子指纹表征、基于非均衡数据集的药物-靶标相互作用预测以及基于Hadoop分布式平台的药物-靶标相互作用预测方法体系,最终形成一个可用于科学研究的高可信、大规模药物-靶标相互作用预测系统及网上开放支撑平台。

专家简介

尤著宏,中国科学院新疆理化技术研究所研究员,中国科学院大学博士生导师。研究方向包括药物靶点预测、蛋白质相互作用预测、microRNA与疾病关系预测、lncRNA与疾病关系研究、疾病-微生物关联预测研究、药物组合研究等。作为第二完成人获得国家教育系统自然科学二等奖1项,获国家自然科学基金委“优秀青年基金”,入选第十四批国家“千人计划”新疆项目,入选中国科学院率先行动“百人计划”,入选“香江学者”计划,入选2016年度“新疆自治区高层次人才引进计划”。先后主持或完成国家自然科学基金面上项目、青年项目及博士后基金等9项科研项目。在国内外学术期刊及国际会议发表学术研究论文100余篇,其中论文被SCI收录82篇,入选ESI高被引论文7篇,累计影响因子超过300。