期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
网页新闻信息预处理中SST树正文提取方法研究
1
作者
刘林浩
《微计算机信息》
2012年第10期466-468,共3页
论文详细描述了在新闻信息挖掘和分析系统中的数据准备阶段中信息获取和信息处理模块的实现细节。从网页获取方式的采用开始,到网页获取的具体实现,再介绍了网页信息预处理实现的整个过程。其中,重点提到了网页正文信息的提取过程中,对...
论文详细描述了在新闻信息挖掘和分析系统中的数据准备阶段中信息获取和信息处理模块的实现细节。从网页获取方式的采用开始,到网页获取的具体实现,再介绍了网页信息预处理实现的整个过程。其中,重点提到了网页正文信息的提取过程中,对基于模板的SST树的正文提取方法的优化,通过优化从而使得对正文提取的准确度更高,对后续的分析过程也提供了帮助。接着描述了为了提高网页信息分析阶段效率而进行的索引建立的过程以及数据存储的方式。并在最后对整个实验进行了功能性的分析和展望。
展开更多
关键词
新闻信息预处理
网页抓取
基于模版的sst树提取方法
下载PDF
职称材料
题名
网页新闻信息预处理中SST树正文提取方法研究
1
作者
刘林浩
机构
湖南文理学院
出处
《微计算机信息》
2012年第10期466-468,共3页
文摘
论文详细描述了在新闻信息挖掘和分析系统中的数据准备阶段中信息获取和信息处理模块的实现细节。从网页获取方式的采用开始,到网页获取的具体实现,再介绍了网页信息预处理实现的整个过程。其中,重点提到了网页正文信息的提取过程中,对基于模板的SST树的正文提取方法的优化,通过优化从而使得对正文提取的准确度更高,对后续的分析过程也提供了帮助。接着描述了为了提高网页信息分析阶段效率而进行的索引建立的过程以及数据存储的方式。并在最后对整个实验进行了功能性的分析和展望。
关键词
新闻信息预处理
网页抓取
基于模版的sst树提取方法
Keywords
preprocessing of web news information
web capture
sst
tree extraction method based on a template
分类号
G250.73 [文化科学—图书馆学]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
网页新闻信息预处理中SST树正文提取方法研究
刘林浩
《微计算机信息》
2012
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部