期刊文献+

动态网页信息提取技术在求职搜索中的应用 被引量:2

Application of Dynamic Web Page Information Extraction Technology in Seeking-job Search
下载PDF
导出
摘要 针对传统搜索引擎难以提取客户端脚本生成信息的问题,结合求职搜索引擎的研发,运用HtmlUnit解析JavaScript动态网页,使用Selenium IDE提取动态元素的XPath,解决传统搜索引擎难以提取客户端动态生成信息的问题。实验结果证明,该技术是行之有效的。 Aiming at the problem that using the script of Web page widely,the traditional search engine is difficult to extract the information,this paper uses HtmlUnit to interpret JavaScript dynamic Web page,and uses Selenium IDE to extract XPath of dynamic element,the seeking-job search engine extracts successfully the information of Web page produced dynamically.Experimental results show that this technology is useful.
作者 方宏 吕太之
出处 《计算机工程》 CAS CSCD 北大核心 2009年第24期265-267,共3页 Computer Engineering
关键词 动态网页 信息提取 求职 搜索 dynamic Web page information extraction seeking-job search
  • 相关文献

参考文献5

二级参考文献81

  • 1苏杭,严建援.一种新的Web链接提取模型[J].清华大学学报(自然科学版),2006,46(z1):975-982. 被引量:4
  • 2张智雄.信息抽取技术及其在数字图书馆中的应用前景分析[J].现代图书情报技术,2004(6):1-5. 被引量:26
  • 3韩毅.基于DTD的XML文档内容检索研究[J].情报科学,2006,24(3):409-412. 被引量:1
  • 4.[EB/OL].http://www.cogsci.Princeton.edu,.
  • 5Michael K.Bergman.The Deep Web:Surfacing Hidden Value.http://www.press.umich.edu/jep/07-01/bergman.html (Accessed Sep.10,2006)
  • 6Nicholas Kushmerick.Wrapper Introduction:Efficiency and Expressiveness.Artificial Intelligence 118(2000)
  • 7Ling Liu,Calton Pu,Wei Han.An XML-Enabled Data Extraction Toolkit for Web Sources.Information Systems 26 (2001)
  • 8Patent Full-Text and Full-Page Image Databases.http://www.uspto.gov/patft/index.html (Accessed Jan.29,2007)
  • 9Document Object Model(DOM) Specification.http://www.w3.org/TR/2004/REC-DOM-Level-3-Core-20040407 (Accessed Sep.20,2006)
  • 10Dennis Sosnoski.XML and Java Technologies:Document Models,Part1:Performance.http://www-128.ibm.com/developerworks/xml/library/x-injava/index.html (Accessed Oct.1,2006)

共引文献154

同被引文献4

引证文献2

二级引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部