您的位置:首页

详情

专注网络大数据算法研究 助力国家网络安全防护——北京大学计算机系网络所杨仝副教授

2019-11-05

 网络大数据即是指“人、机、物”三者在网络空间中通过交互产生的、能够通过网络技术进行查询和进一步使用的大量数据。随着互联网规模飞速扩展、新型网络及其协议不断地涌现,人类越来越难以全面、准确地理解和认识互联网。网络流量作为最高速的数据流,如何感知、测量、利用这些网络大数据成为众多行业面临的难题。而网络测量作为认识和理解网络的一个重要手段,逐渐成为学者们探索科技前沿的研究热点。

北京大学信息科学技术学院网络与信息系统研究所杨仝副教授一直在网络大数据研究领域默默耕耘,他不惧挑战、敢于突破,在网络大数据高速数据流测量以及针对路由器的核心技术路由查找等方面开展了一系列的研究,取得了多项重要研究进展。在国际会议期刊(CCF A类)发表论文21篇,其中在SIGCOMM、SIGMOD、SIGKDD等发表会议论文5篇,被国家自然基金委网站报道2次。相关研究成果部署在华为网络设备、今日头条数据中心、Redis数据库中,为维护网络质量、实现国家网络安全防护提供了技术支撑。

 

1 专注科研创新,解决网络大数据难题

作为网络大数据领域一名年轻的探索者,进入北京大学信息科学技术学院网络与信息系统研究所后,杨仝在科研进程中坚持创新、锐意进取,先后负责了“新型大数据存储技术与平台”和“高时效、可扩展的大数据计算模型、优化技术与系统”两项国家重点研发计划子课题的研究工作,他凭借自身努力,为提高网络测量速度和精度、提升互联网性能、实现网络强国贡献出了一份力量。

1.1 开展网络测量研究,提高网络测量速度和精度

大数据时代,网络流速度太快易导致网络拥塞、中断,继而使譬如微信、网页等互联网应用出现掉线、卡顿的现象,同时也给准确测量带来巨大挑战。针对传统基于采样样本的网络测量方法导致较大的误差和信息遗漏以及多种软件流量测量平台速度慢,难以应对高速网络流量测量需求的现状,杨仝等人创新性地提出采用附加式框架、通用数据结构和频数估计专用数据结构等记录单个数据包信息,从而实现网络流量信息的精确记录。更进一步提出弹性网络测量方法,设计了弹性sketch概率数据结构,该数据结构对网络带宽、CPU利用率和网络流量特征的变化具有很好的适应性。与传统算法不同,提出的算法基于一种数据结构可同时支持六种网络测量任务,具有很好的通用性,相比现有专用算法,测量精度提高2到273倍、速度提高44倍,显著提高了网络测量的速度和精度。目前该团队已在6种软硬件平台上实现该弹性sketch。

1.2 开展路由表查找研究,提升互联网性能

互联网的核心是骨干网,骨干网由路由器连接而成,而路由器的性能瓶颈在于路由表查找速度。因此,路由表查找算法的性能决定了互联网性能。随着路由表的规模呈指数级增长,对其查找速度和扩展性提出了巨大的挑战。

杨仝和团队其他成员创新性地提出二维分割和关键层叶推、继承算法,不仅将IPv 4(互联网协议第四版)路由表查找速度提高一个数量级,而且实现了对大规模IPv 6(互联网协议第六版)路由表的高速查找和更新。理论和实验结果显示,较现有最新的IPv 4和IPv 6路由表查找算法而言,该算法框架的片内存储空间最大只需要4 MB,查找速度比常用路由表查找算法提高了760倍,具有显著的速度和内存占用优势,可同时支持多种软硬件平台。该算法部署到了华为公司的某项网络产品中,部署应用后,查找速度提高了一个数量级。

 

2 悉心教导,促进学科发展

在北京大学工作期间,杨仝组建了一个30多人的以本科生为主的研究团队,指导学生研究算法、写代码、做实验,心无旁骛地搞研究。由于本科生白天有课,所以都是利用晚上和周末的时间指导学生,得到了学生的一致好评。他善于从学生的角度思考,激发学生的学习兴趣,在和学生的讨论中用实验解决产生的分歧,进而激发学生思考,取得了良好的教学效果。在北京大学3年多时间里,指导本科生发表论文27篇,其中本科生一作论文11篇。凭借出色的科研能力和对学生们的悉心教导,杨仝连续两年在北京大学信息科学技术学院年终考核中被评为优秀,而且由他指导的两名本科生毕业设计论文也被评为了“信科十佳本科毕设论文”,一名本科生获得学术新星奖(信息学院300人中仅两人获该奖)。