期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于XPath的新闻信息抽取系统设计与实现 被引量:3
1
作者 阮娟 《智能计算机与应用》 2015年第2期58-61,共4页
随着互联网技术的迅猛发展,因特网成为目前新闻信息最丰富最主要的来源。本文在分析新闻网页的基础上,分析了目前现有的信息抽取技术和XML技术,提出了一个基于XML技术的Web新闻抽取系统。本文主要是充分运用XML中的XPath技术在数据定位... 随着互联网技术的迅猛发展,因特网成为目前新闻信息最丰富最主要的来源。本文在分析新闻网页的基础上,分析了目前现有的信息抽取技术和XML技术,提出了一个基于XML技术的Web新闻抽取系统。本文主要是充分运用XML中的XPath技术在数据定位方面的优势,并提出一种基于DOM树的XPath生成算法,使用XSLT语言用于描述抽取规则,并使用路径表达式XPath定位待抽取的信息点。 展开更多
关键词 数据挖掘 信息抽取 新闻抽取系统 XPATH
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部