动态网页信息提取技术在求职搜索中的应用被引量：2

Application of Dynamic Web Page Information Extraction Technology in Seeking-job Search

下载PDF

导出

摘要针对传统搜索引擎难以提取客户端脚本生成信息的问题,结合求职搜索引擎的研发,运用HtmlUnit解析JavaScript动态网页,使用Selenium IDE提取动态元素的XPath,解决传统搜索引擎难以提取客户端动态生成信息的问题。实验结果证明,该技术是行之有效的。 Aiming at the problem that using the script of Web page widely,the traditional search engine is difficult to extract the information,this paper uses HtmlUnit to interpret JavaScript dynamic Web page,and uses Selenium IDE to extract XPath of dynamic element,the seeking-job search engine extracts successfully the information of Web page produced dynamically.Experimental results show that this technology is useful.

作者方宏吕太之

机构地区江苏海事职业技术学院信息工程系南京理工大学计算机科学与技术学院

出处《计算机工程》 CAS CSCD 北大核心 2009年第24期265-267,共3页 Computer Engineering

关键词动态网页信息提取求职搜索 dynamic Web page information extraction seeking-job search

分类号 TP393.09 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1金晓鸥,钟宝燕,李翔.基于Rhino的JavaScript动态页面解析研究与实现[J].计算机技术与发展,2008,18(2):1-4. 被引量：18
2吴敏琦,丁岳伟.基于Nutch的XML网站全文搜索引擎实现[J].计算机工程,2008,34(15):95-96. 被引量：5
3OpenQA org. Selenium Document[EB/OL]. (2008-09-23). http:// selenium.openqa.org/index.html.
4刘伟,孟小峰,孟卫一.Deep Web数据集成研究综述[J].计算机学报,2007,30(9):1475-1489. 被引量：136
5董旻,方曙,杨志萍.使用JTree和XPath构建动态网页信息抽取系统[J].情报杂志,2007,26(6):73-75. 被引量：1

二级参考文献81

1苏杭,严建援.一种新的Web链接提取模型[J].清华大学学报（自然科学版）,2006,46(z1):975-982. 被引量：4
2张智雄.信息抽取技术及其在数字图书馆中的应用前景分析[J].现代图书情报技术,2004(6):1-5. 被引量：26
3韩毅.基于DTD的XML文档内容检索研究[J].情报科学,2006,24(3):409-412. 被引量：1
4.[EB/OL].http://www.cogsci.Princeton.edu,.
5Michael K.Bergman.The Deep Web:Surfacing Hidden Value.http://www.press.umich.edu/jep/07-01/bergman.html (Accessed Sep.10,2006)
6Nicholas Kushmerick.Wrapper Introduction:Efficiency and Expressiveness.Artificial Intelligence 118(2000)
7Ling Liu,Calton Pu,Wei Han.An XML-Enabled Data Extraction Toolkit for Web Sources.Information Systems 26 (2001)
8Patent Full-Text and Full-Page Image Databases.http://www.uspto.gov/patft/index.html (Accessed Jan.29,2007)
9Document Object Model(DOM) Specification.http://www.w3.org/TR/2004/REC-DOM-Level-3-Core-20040407 (Accessed Sep.20,2006)
10Dennis Sosnoski.XML and Java Technologies:Document Models,Part1:Performance.http://www-128.ibm.com/developerworks/xml/library/x-injava/index.html (Accessed Oct.1,2006)

共引文献154

1魏勇刚,张国春,常勇,袁方.基于词性分析和领域知识的Deep Web语义标注[J].郑州大学学报（理学版）,2009,41(1):52-55. 被引量：7
2郑淑丽,韩江洪,程文娟,吴永忠.Deep Web查询接口自动识别方法[J].郑州大学学报（理学版）,2009,41(1):56-58. 被引量：1
3李颖,刘国华,佟冰,刘顺江.基于素数的多源模式匹配方法的研究[J].燕山大学学报,2009,33(2):141-145. 被引量：1
4李益民.一种基于关键词的大规模Deep Web信息检索系统[J].图书情报工作,2008,52(10):29-32.
5鲜学丰,方巍,赵朋朋,崔志明,胡鹏昱.一种Deep Web数据源质量评估模型[J].微电子学与计算机,2008,25(10):47-50. 被引量：6
6崔晓军,彭智勇,曾承.基于多标注源的Deep Web查询结果自动标注[J].计算机应用,2009,29(1):196-200. 被引量：3
7李益民,魏立新,解成俊.基于用户模式Deep Web检索系统的研究[J].计算机工程与设计,2009,30(3):767-769.
8马安香,张斌,高克宁,齐鹏,张引.基于结果模式的Deep Web数据抽取[J].计算机研究与发展,2009,46(2):280-288. 被引量：15
9李齐会.Deep Web查询接口的判定技术研究[J].计算机与数字工程,2009,37(3):131-134. 被引量：1
10高明,黄哲学.Deep Web研究现状与展望[J].集成技术,2012,1(3):47-54. 被引量：1

同被引文献4

1宋明秋,张瑞雪,吴新涛,李文立.网页正文信息抽取新方法[J].大连理工大学学报,2009,49(4):594-597. 被引量：20
2张卫明.ASP.NET2.0缓存技术在动态网页设计中的应用[J].软件导刊,2010,9(12):138-139. 被引量：2
3曲小纳.浅析ASP技术在动态网页中的应用研究[J].电脑知识与技术（过刊）,2015,21(1X). 被引量：3
4周肖彬,曹存根.基于本体的医学知识获取[J].计算机科学,2003,30(10):35-39. 被引量：35

引证文献2

1郑永爱,李凤盼.从招聘信息看IT人才需求[J].电脑知识与技术,2017,13(7):104-106. 被引量：1
2李亚娟,吴彦海,秦爽,陈岩,王瑶.探究ASP技术在动态网页中的运用[J].计算机产品与流通,2019,0(6):89-89.

二级引证文献1

1郑文军.需求分析/系统分析人才需求现状研究[J].电脑知识与技术,2018,14(4):253-255.

1李国新,罗省贤.一种自动化测试技术的研究与实现[J].电子测试,2008,19(8):9-12. 被引量：1
2焦红革,陈文,李泽民,焦鹏.基于XML的软件测试脚本生成[J].车辆与动力技术,2009(1):51-53. 被引量：1
3王宇纲,杨宗源,李玉茜.基于规则的脚本生成技术[J].微型电脑应用,1998,14(4):39-44. 被引量：1
4张佳荣.Java开源项目HtmIUnit在浏览器模拟方面的应用[J].电子制作,2015,23(8Z). 被引量：2
5一啸倾城.拒绝呆板让照片动起来[J].电脑迷,2011(10):58-58.
6高瑞,朱荣.Android开放平台应用程序的安全检测系统设计与实现[J].电脑迷,2016(7). 被引量：1
7聂琨琳,黄蔚,胡国超.基于Rhino引擎的低侵入式JavaScript内置对象扩展方法[J].计算机与现代化,2014(1):114-120.
8翟朗.网上购物系统的设计与实现[J].消费电子,2014(12):190-190.
9陈永江,仲兆满,陈宗华.HTMLUNIT在网络信息采集系统中的应用[J].淮海工学院学报（自然科学版）,2013,22(4):31-35. 被引量：1
10陈免慧,沈炜.HtmlUnit在网上招聘系统中的应用[J].电脑知识与技术（过刊）,2015,21(7X):61-63.

计算机工程

2009年第24期

浏览历史

内容加载中请稍等...

动态网页信息提取技术在求职搜索中的应用被引量：2

参考文献5

二级参考文献81

共引文献154

同被引文献4

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

动态网页信息提取技术在求职搜索中的应用 被引量：2

参考文献5

二级参考文献81

共引文献154

同被引文献4

引证文献2

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

动态网页信息提取技术在求职搜索中的应用被引量：2