期刊文献+

基于Web企业竞争对手情报自动搜集平台 被引量:12

Enterprise Competitor Intelligence Information Mining Platform based the Internet
下载PDF
导出
摘要 从互联网中准确有效及时地自动搜索出需要的信息,是Web信息处理中的一个重要研究课题。本文在所提出的基于搜索路径Web网页搜索和基于多知识网页信息抽取方法基础上,给出基于Web企业竞争对手情报自动收集平台的实现方法,该平台可以有效地从多个企业门户网站中,自动搜索出所需要的目标网页,并能够从目标网页中自动抽取其中多记录信息。本文利用该平台进行了企业人才招聘信息的自动搜索实验。实验结果证实了该平台在信息自动搜集方面的有效性和准确性。 Web Information mining effectively, accurately and in time is an important research problem in Web Information process. This paper puts forward one solution of the Enterprise Competitor Intelligence Mining Platform based on methods of web page search using search path heuristic and web page information extraction using multiple record data representation heuristic. This Platform can search out target HTML pages from many enterprises' portals intelligently, and also can extract multiple data records from those target automatically without human interfere. The experiments made through the Enterprise Competitor Intelligence Mining Platform to mining Job posts information from Enterprise Portals have demonstrated this Platform has power competitive intelligence ability in web information mining.
出处 《微计算机应用》 2004年第1期1-7,共7页 Microcomputer Applications
基金 国家自然科学基金(60075015)
关键词 企业门户网站 互联网 搜索引擎 WEB 情报自动搜集平台 企业信息化 目标网页 Web mining, information search, competitive intelligence
  • 相关文献

参考文献5

  • 1朱明,王俊普,蔡庆生.一种互联网信息智能搜索新方法[J].计算机研究与发展,2001,38(1):116-120. 被引量:9
  • 2朱明,黄云,蔡庆生.基于多知识的Web网页信息抽取方法[J].小型微型计算机系统,2001,22(9):1058-1061. 被引量:10
  • 3.[EB/OL].http: ∥www. flud. com,.
  • 4Hsinchun Chen, Ann M. Lally, Bin Zhu, and Michael Chau, HelpfulMed: Intelligent Searching for Medical Information over the Internet, JOURNAL OF THE AMERICAN SOCIETY FOR INFORMATION SCIENCE AND TECHNOLOGY, 54(7): 683- 694, 2003
  • 5Bing Liu,Robert Grossman and Yanhong Zhai,Mining Data Records in Web Pages,The Proceedings of SIGKDD.03,August 24-27,2003,Washington,DC,USA.

二级参考文献2

共引文献16

同被引文献76

引证文献12

二级引证文献44

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部