您的位置:首页

详情

中国搜农——农业垂直搜索引擎成果介绍

2013-10-21

我国建有数万个涉农网站,这些网站由于信息资源缺少统一的形式化表达与操作标准,使得信息异质、异构、分散、重复现象严重,形成信息孤岛,很难发挥农业信息资源的集成效用。因此,建立专业化、个性化以及高度智能化的农业搜索模型意义重大。

 

 

在国家科技支撑计划、国家自然基金、国家863等项目资助下, 中国科学院合肥物质科学研究院的研究人员针对互联网开放性、层次性、演化性、巨量性等本质特性,从复杂适应系统这一全新的角度,以农业搜索服务为应用背景,建立个性化、专业化的复杂自适应搜索模型。基于该复杂自适应搜索模型,研究团队构建了中国搜农(http://www.sounong.net )——面向我国农业企业、农民大户、农业专业技术协会以及广大农业科技人员提供专业搜索服务的农业垂直搜索引擎。与传统的搜索引擎相比,它更加贴近农业领域的需求,能够提供更符合农业用户要求的信息。

一、中国搜农基于复杂自适应搜索模型,具有开放性、自适应、智能化、个性化等特点,以及在WEB环境下的学习与进化能力,获得了国家发明专利(用于农业复杂自适应搜索引擎系统的控制方法ZL 200710193957.2),查全率与查准率均大大高于通用搜索引擎。

二、中国搜农作为国内第一款农业垂直搜索引擎,持续稳定运行6年,获取了海量的农业信息,信息总量超过100TB,信息更新周期平均为30分钟,目前每周平均信息增长量3GB

三、中国搜农采用基于Hadoop的大规模分布式并行索引与检索技术,用户搜索响应时间小于0.5s

四、中国搜农每天监控3万多个农业网站发布的超过2万多个农产品批发、集贸市场的2万多个农产品品种的价格、供求等信息,与主流农业门户网站以及各农业专业网站保持信息同步更新。

五、中国搜农部署了超过8千多个软机器人承担WEB农业信息的采集、清洗、分类、聚类、排序、属性标注等任务,基本实现了信息处理工作的自动化,代替了农业信息服务采、编、发等系列繁重的人工劳动,大大降低了农村网络信息服务成本。

六、中国搜农采用异常数据监测技术,对互联网上的农业网站以及其所发布的农业信息进行权威度分析评价,提高了搜索结果的可信度。

七、基于农业本体技术,实现用户关键词查询扩充以及概念级检索,大大提高了搜索的查全率与查准率。

  中国搜农通过建立搜索信息庞大的数据仓库系统,为高级用户提供复杂时空数据挖掘与深度分析服务。目前,已建成国内规模首屈一指的农业WEB信息资源数据库,为农业管理部门及全国各省市提供农业市场、技术、政策、新闻等专业搜索服务,每天为12万多团体与个人会员提供农产品供求对接7万多宗。中国搜农——农业垂直搜索引擎已在安徽、山东、河南、青海等省得到推广应用,取得了良好的社会效益和经济效益。