期刊文献+

基于CSS选择器的HTML信息抽取研究 被引量:1

HTML Information Extraction Based On CSS Selectors
下载PDF
导出
摘要 基于网页结构特征的信息抽取是现阶段最为常用的抽取手段。为了将待抽取的信息从DOM树中准确地抽取出来,需要对欲抽取的信息进行准确地定位。本文提出了一种新的定位方法,在HTML DOM树的基础上,借助于CSS选择器,抽取所需要的信息。 Information extraction Webpage based on structural features is the most commonly used means for the present stage extraction. In order to be extracting accurate information from the DOM tree extract, the need for accurate positioning for information extraction. This paper presents a new method of positioning, based on HTML DOM tree, with the help of CSS selector, extracting the required information.
出处 《信息技术与信息化》 2015年第3期100-102,共3页 Information Technology and Informatization
关键词 DOM树 HTML信息抽取 CSS选择器 DOM tree Information extraction CSS selector
  • 相关文献

参考文献8

二级参考文献54

共引文献86

同被引文献4

引证文献1

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部