期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于XPath比较的Web数据抽取方法 被引量:4
1
作者 陈晓锋 张凌 董守斌 《郑州大学学报(理学版)》 CAS 2007年第2期161-166,共6页
研究了从包含多个数据块的页面中抽取数据的方法.通过对比各个数据块的XPath,发现这些数据块具有相似的XPath,提出一种基于XPath比较的数据块抽取规则生成算法XERG.得到各个数据块抽取规则之后,块内的信息可以使用相对XPath或者正则表... 研究了从包含多个数据块的页面中抽取数据的方法.通过对比各个数据块的XPath,发现这些数据块具有相似的XPath,提出一种基于XPath比较的数据块抽取规则生成算法XERG.得到各个数据块抽取规则之后,块内的信息可以使用相对XPath或者正则表达式的方法来进行抽取.实验结果表明,该方法能够准确地获得各个数据块,正确抽取块内信息. 展开更多
关键词 WEB数据抽取 xpath比较 XERG 正则表达式
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部