期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于HtmlParser抽取动态异构Web信息的研究与实现 被引量:4
1
作者 桂林斌 《计算机与数字工程》 2009年第7期161-164,206,共5页
抽取动态异构Web信息以建立索引数据库供用户统一检索使用,是高校图书馆资源整合中的技术难点。通过对目标WEB站点表单提交方式和查询参数的研究和分析,使用Http模拟Post提交查询参数获得检索结果页面,基于开源项目HTMLParser包,以抽取C... 抽取动态异构Web信息以建立索引数据库供用户统一检索使用,是高校图书馆资源整合中的技术难点。通过对目标WEB站点表单提交方式和查询参数的研究和分析,使用Http模拟Post提交查询参数获得检索结果页面,基于开源项目HTMLParser包,以抽取CNKI文章检索结果入库为例,给出了算法及其实现的详细过程。 展开更多
关键词 动态异构 网页抽取 htmlparser
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部