农业Web信息获取系统的研究与设计

Research and Design of Agricultural Web Information Acquisition System

下载PDF

导出

摘要互联网有着浩瀚的信息,如何高效、准确获取想要的信息是一个重要的问题,本文将信息获取技术分两个部分来进行,即资源发现模块和信息抽取模块,并基于此构建了一个信息自动获取平台。对于资源发现模块,主要在如何能够从广度和深度两个方面去发现资源提出了一种新的搜索算法,同时利用了多Agent技术实现了分布式的资源发现。对于信息抽取模块,提出了一种新的抽取规则表示方法,提高了在信息抽取过程中规则的适应性。 Internet has a vast information, how to obtain the desired information efficiently and accurately is an important issue. Information acquisition has two tasks： resource discovery and information extraction. And an information automatic acquisition platform was implemented based on the above mentioned tasks. In the resource discovery, a novel search algorithm was proposed to find data resources in surface web and deep web. Multi-agent was exploited to discover distributed web resources. In terms of information extraction, a new expression method of extraction rules was proposed to improve the adaptability of the web data acquisition.

作者张英

机构地区中国科学院合肥智能机械研究所中国科学技术大学自动化系

出处《农业网络信息》 2009年第8期42-45,共4页 Agriculture Network Information

基金国家"十一五"科技支撑计划项目课题(2006BAD10A05)

关键词信息获取信息抽取多AGENT 资源发现抽取规则 information acquisition information extraction multi-agent resource discovery extraction rules

分类号 TP392 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1魏保子,王儒敬.基于多Agent技术的分布式信息抽取系统研究[J].微电子学与计算机,2008,25(6):18-21. 被引量：1
2李营,王儒敬,王大为,魏保子.基于用户兴趣的搜索结果动态聚类算法[J].计算机工程与应用,2008,44(4):187-189. 被引量：2
3郭太飞,何洁月.归纳学习XPATH Web信息提取规则[J].计算机技术与发展,2007,17(3):98-101. 被引量：7
4李保利,陈玉忠,俞士汶.信息抽取研究综述[J].计算机工程与应用,2003,39(10):1-5. 被引量：178

二级参考文献42

1李向阳,张亚非.一种基于自举原理的语义模式自动获取方法[J].微电子学与计算机,2005,22(2):188-192. 被引量：3
2王钊,耿蓉,王国仁.XPath的轴连接查询技术研究[J].小型微型计算机系统,2005,26(11):1942-1947. 被引量：2
3俞巍.XPath的两种解析技术[J].计算机时代,2006(1):49-51. 被引量：1
4宋春芳,石冰.一种基于关联规则的搜索引擎结果聚类算法[J].山东大学学报（理学版）,2006,41(3):68-72. 被引量：5
5康恺,林坤辉,周昌乐.基于主题词频数特征的文本主题划分[J].计算机应用,2006,26(8):1993-1995. 被引量：11
6[16]Hobbs J,Appelt D,Bear J et al.FASTUS:A Cascaded Finite-State Transducer for Extracting Information from Natural-Language Text[C].In:Roche,Schabes eds. Finite State Devices for Natural Language Processing, MIT Press,Cambridge MA, 1996
7[17]Appelt D E.Introduction to Information Extraction[J].AI COMMUNICATIONS, 1999; 12(3)
8[18]Yangarber R.Scenario Customization for Information Extraction[D].Ph D Thesis.New York University,2001-01
9[19]Cowie J, Lehnert W.Information Extraction[J].Communications of the ACM, 1996;39(1)
10[20]Grishman R Adaptive information extraction and sublangu age analysis[C].In:Proceedings of IJCAI-2001 Workshop on Adaptive Text Extraction and Mining,2001

共引文献184

1沈芳婷,于艳华,李志强,李劼.基于Attention-Comprehension OpenTag的人物属性抽取算法[J].新一代信息技术,2022,5(6):1-5.
2王睿,张洁,张由仪,于禛,姚天昉.基于混合模型的中文命名实体抽取系统[J].清华大学学报（自然科学版）,2005,45(S1):1908-1914. 被引量：10
3叶正,林鸿飞,苏绥,刘菁菁.基于支持向量机的人物属性抽取[J].计算机研究与发展,2007,44(z2):271-275. 被引量：11
4岳国伟,梁永全.基于Agent的Web页面结构化信息抽取[J].计算机研究与发展,2007,44(z2):344-349.
5张向喆,王明辉,赵洪波,王起山,潘玉春.生物医学文本中命名实体识别研究[J].上海交通大学学报（农业科学版）,2010,28(2):132-139. 被引量：6
6李万辉,林瑞明,张文德.台湾科技文献信息抽取与检索平台的设计与实现[J].图书馆学研究（应用版）,2010(6):71-75.
7宋远君,赵铭远,马静.基于本体的无人机情报获取与分析系统研究[J].计算机科学,2012,39(S3):215-219. 被引量：1
8李海涛.纯文本文档处理技术的研究与应用[J].现代图书情报技术,2004(10):33-35. 被引量：2
9马彦波,张蕾.一种创建事件模式的新方法[J].微机发展,2005,15(1):20-23. 被引量：2
10陈科,贾焰,杨树强,王永恒.汉语短文话题提取系统中SDTF*PDF算法的研究[J].计算机应用,2005,25(1):14-16. 被引量：1

1李剑波,李小华,董树明,杨科华.一种基于XML的Web信息抽取方法[J].情报杂志,2006,25(8):49-51. 被引量：7
2董旻,方曙.Deep Web信息抽取研究[J].图书情报工作,2007,51(10):25-28. 被引量：5
3万静,涂喆,冯晓.基于条件随机场的医药领域症状信息抽取[J].北京化工大学学报（自然科学版）,2016,43(1):98-103. 被引量：11
4于江德,樊孝忠,尹继豪.隐马尔可夫模型在自然语言处理中的应用[J].计算机工程与设计,2007,28(22):5514-5516. 被引量：14
5胡致涌,胡迎松.基于领域本体的信息抽取系统的设计与实现[J].价值工程,2010,29(14):158-159. 被引量：2
6胡军伟,秦奕青,张伟.正则表达式在Web信息抽取中的应用[J].北京信息科技大学学报（自然科学版）,2011,26(6):86-89. 被引量：39
7金燕,王志华.基于推理的语义网检索模型及关键技术研究[J].计算机工程与设计,2013,34(7):2585-2589. 被引量：9
8黄小瑜.智能Agent在电子商务中的应用[J].计算机时代,2003(6):1-2.
9高玉琢,任思佳,王恒,佘廉.基于数值编码规则的信息抽取方法[J].宁夏大学学报（自然科学版）,2009,30(1):46-49. 被引量：2
10季红洁,赵知纬,钱龙华.面向信息抽取的中文跨文本指代消解研究[J].福建电脑,2012,28(11):10-12. 被引量：1

农业网络信息

2009年第8期

浏览历史

内容加载中请稍等...

农业Web信息获取系统的研究与设计

参考文献4

二级参考文献42

共引文献184

相关作者

相关机构

相关主题

浏览历史