期刊文献+

一种基于自动WEB数据抽取生成黄页的方法

An Generate Business Yellow Page Method based on Web Automatic Text Extraction
下载PDF
导出
摘要 利用蜘蛛技术爬取相关行业网站的数据。通过基于一种基于新的定位与模式匹配抽取WEB数据的方法,将得到的数据分类后以XML文件保存;通过相应的信息处理、表现技术对分类后的行业URL地址进行展现。最后以林业行业网址的获取和黄页的生成为例进行了实现。 This paper mainly refers to make use of spiders crawling technology get industry website URL address。 Firstly extract web text base on location and pattern matching methods, then data will be classified ; by the information processing, performance technology industries classified URL address to show. Finally, the forestry Yellow Pages web site for the generation implemented as an example.
出处 《微计算机信息》 2010年第33期14-16,共3页 Control & Automation
关键词 行业黄页 WEB信息抽取 模式匹配 抽取规则 Business Yellow Pages Web Text Extraction Pattern Matching Extraction Rules
  • 相关文献

参考文献9

二级参考文献35

  • 1杨琨,孙平.MyLibrary:个性化图书馆的实现[J].情报资料工作,2003,24(3):25-28. 被引量:34
  • 2游丽贞,郭宇春,李纯喜.Ajax引擎的原理和应用[J].微计算机信息,2006,22(02X):205-207. 被引量:154
  • 3王星,潘郁.基于AJAX技术的Web模型在网站开发中的应用研究[J].微计算机信息,2006,22(09X):206-207. 被引量:50
  • 4Chang K C C, He B, Li C, et al. Structured databases on the web : observations and implications[ J]. Sigmod Record, 2004, 33(3) :61 -70.
  • 5Chen Peng, Li Tao, Wei Kun, et al. Research on automatic discovery of deep web [ J ]. Compute Science, 2007,34 ( 11A ) : 32 -35.
  • 6Chen Peng, Su Liliang, Wei Kun, et al. Towards automatic discovery of deep web based on machine learning [ J ]. Journal of Computational Information Systems ,2007,3 ( 3 ) : 1033 - 1042.
  • 7Chang K C C,He B,Zhang Z. Toward large-scale integration: building a metaquerier over databases on the web [ J ]. CIDR 2005 : 44 - 55.
  • 8Chang C H,Kayed M, Girgis M R, et al. A survey of web information extraction systems[ J]. IEEE Transacitons on Knowledge and Data Engineering, 2006,18(10) :1411 -1428.
  • 9B-S 软件超越C-S软件的优势在哪里.http://www.hur.cn.2006.4.
  • 10陈天河等编著.Struts,Hibemate,Spring集成开发宝典.北京:电子工业出版社,2006-1.

共引文献90

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部