期刊文献+

面向开源社区的Web数据抽取方法研究

Research on the Method of Web Data Extraction from Open Source Communities
下载PDF
导出
摘要 由协同开发社区和知识分享社区所组成的开源社区中汇集海量的开源数据资源。如何从数量众多,页面结构各异的开源社区中准确、高效地获取这些数据是对开源数据资源进行全面分析,深度关联的前提。阐述面向开源社区的Web数据抽取方法研究过程,实现对开源社区中Web数据的精确抽取。 Open source community, which consists of collaborative development community and knowledge sharing community, assembles a huge amount of open-source data resources together. How to obtain these data precisely and efficiently from numerous open source communi- ties with various page structures is a prerequisite for comprehensive analysis and deep correlation. Describes the research process of web data extraction method and achieves the accurate extraction of Web data from open source communities.
出处 《现代计算机》 2017年第3期27-29,39,共4页 Modern Computer
关键词 开源社区 WEB数据抽取 协同开发社区 知识共享社区 Open Source Community Web Data Extraction Collaborative Development Community Knowledge Sharing Community
  • 相关文献

参考文献3

二级参考文献45

  • 1李胜利,李昌清,袁平鹏,刘英书.基于Web的电子期刊元数据信息抽取方法[J].华中科技大学学报(自然科学版),2007,35(12):13-15. 被引量:7
  • 2荆涛,左万利.基于可视布局信息的网页噪音去除算法[J].华南理工大学学报(自然科学版),2004,32(z1):84-87. 被引量:21
  • 3张志刚,陈静,李晓明.一种HTML网页净化方法[J].情报学报,2004,23(4):387-393. 被引量:57
  • 4常育红,姜哲,朱小燕.基于标记树表示方法的页面结构分析[J].计算机工程与应用,2004,40(16):129-132. 被引量:24
  • 5Horstmann CS.Java2核心技术[M].第5版.北京:机械工业出版社,2001.
  • 6卢睿.信息的抽取[D].大连:大连海事大学信息工程学院,2004.
  • 7Gaizauskas Robert, Yorick Wilks. Information Extraction: Beyond Document Retrieval Journal of Documentation[J], 1998, 54(1): 70-105.
  • 8Gibson D,Punera K,Tomkins A.The volume and evolution of web page templates.In:Proc.of the Special Interest Tracks and Posters of the 14th Int'l Conf.on World Wide Web(WWW 2005).New York:ACM Press,2005.830-839.[doi:10.1145/1062745.1062763].
  • 9Reis DC,Golgher PB,Silva AS,Laender AHF.Automatic Web news extraction using tree edit distance.In:Proc.of the 13th Int'l Conf.on World Wide Web(WWW 2004).New York:ACM Press,2004.502-511.[doi:10.1145/988672.988740].
  • 10Parapar J,Barreiro á.An effective and efficient Web news extraction technique for an operational NewsIR system.In:Proc.of the 12th Conf.of the Spanish Association for Artificial Intelligence,Vol.2.2007.319-328.

共引文献94

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部