期刊文献+

基于蚂蚁算法的Deep Web页面信息抽取方法研究 被引量:3

Study on Deep Web Information Extraction Technology Based on Ant Algorithm
下载PDF
导出
摘要 针对煤炭监测数据的复杂多变性及Deep Web数据查询结果网页描述信息的特点,提出了一种基于蚂蚁算法和本体指导网页信息抽取的方法。首先构建基于简单本体的数据抽取系统,通过对结果页面中包含本体语义信息的数据的映像定位,结合蚂蚁算法分析信息素浓度在DOM树上的分布比较,实现数据块路径抽取规则算法及数据分割特征码的生成。以煤炭行业获取的数据进行抽取性能测试,数据实验表明,抽取算法结果具有较高的准确率。 Due to the complex of the coal monitoring data, a novel approach of web page information extraction guided by ant colony algorithm is proposed.The method first builded a simple ontology-based data extraction system. By positioning the image data on the result pages, and combined with ant algorithm, it creates extraction rules . The extraction performance test data obtained by the coal industry,and the experimental results indicate that the method gives a better accuracy according to the extraction.
作者 陈巧 施佺
出处 《煤炭技术》 CAS 北大核心 2013年第2期176-178,共3页 Coal Technology
基金 南通大学2011年自然科学课题(11Z065) 国家自然科学基金项目(61171132)
关键词 信息抽取 本体 语义 蚂蚁算法 information extraction ontology semantic ant algorithm
  • 相关文献

参考文献3

二级参考文献49

  • 1车海燕,孙吉贵,荆涛,白曦.一个基于本体主题的中文知识获取方法[J].计算机科学与探索,2007,1(2):206-215. 被引量:5
  • 2王海涛,曹存根,高颖.基于领域本体的半结构化文本知识自动获取方法的设计和实现[J].计算机学报,2005,28(12):2010-2018. 被引量:31
  • 3邓健爽,郑启伦,彭宏,林旭东.基于关键词聚类和节点距离的网页信息抽取[J].计算机科学,2007,34(4):213-216. 被引量:8
  • 4BERNERS-LEE T,HENDLER J,LASSILA O.The semantic Web[J].Scientific American,2001,284(5):34-43.
  • 5BENJAMINS V R,CONTRERAS J,CORCHO O,et al.Six challenges for the semantic Web[C]//Proc of Semantic Web Workshop.Berlin:Springer,2002.
  • 6STUDER R,BENJAMINS V R,FENSEL D.Knowledge enginee-ring:principles and methods[J].Data and Knowledge Enginee-ring,1998,25(1-2):161-197.
  • 7MANOLA F,MILLER E.RDF primer[BE/OL].(2004-02-10)[2008-09-20].http://www.w3.org/TR/rdf-primer/.
  • 8MILLER G A,BECKWITH R,FELLBAUM C,et al.Introduction to WordNet:an on-line lexical database[J].Journal of Lexicography,1990,3(4):235-312.
  • 9DONG Zhen-dong,DONG Qiang.HowNet[EB/OL].(2000)[2008-10-06].http://www.keenage.com/zhiwang/e_zhiwang.html.
  • 10COHEN W,HURST M,JENSEN L.A flexible learning system for wrapping tables and lists in HTML documents[C]//Proc of the 11th International World Wide Web Conference.New York:ACM Press,2002:232-241.

共引文献57

同被引文献63

引证文献3

二级引证文献2

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部