期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
任意网页的主题信息抽取研究
被引量:
6
1
作者
张儒清
郭岩
+2 位作者
刘悦
俞晓明
程学旗
《中文信息学报》
CSCD
北大核心
2017年第5期127-137,共11页
目前大部分的网页信息抽取方法都局限于某一类网页的提取,并没有进一步深入到适用于任意网页的抽取。针对这一问题,该文提出了一种基于融合机制的任意网页主题信息抽取框架,特点是通过"模板库匹配—基于模板抽取—网页分类—全自...
目前大部分的网页信息抽取方法都局限于某一类网页的提取,并没有进一步深入到适用于任意网页的抽取。针对这一问题,该文提出了一种基于融合机制的任意网页主题信息抽取框架,特点是通过"模板库匹配—基于模板抽取—网页分类—全自动抽取"四个步骤实现对模板无关的全自动抽取算法和基于模板的抽取算法的融合。实验显示,这种融合机制能促进抽取准确率的有效提高,从而最终建立起一个适用于任意网页的、具有实用价值的信息抽取框架。
展开更多
关键词
任意网页
主题信息
网页
分类
实用价值
下载PDF
职称材料
题名
任意网页的主题信息抽取研究
被引量:
6
1
作者
张儒清
郭岩
刘悦
俞晓明
程学旗
机构
中国科学院计算技术研究所中国科学院网络数据科学与技术重点实验室
中国科学院大学
出处
《中文信息学报》
CSCD
北大核心
2017年第5期127-137,共11页
基金
国家重点基础研究发展计划("973"计划)(2014CB340401
2013CB329606)
+6 种基金
科技部重点研发计划(2016QY02D0405)
国家自然科学基金(61232010
61472401
61425016
61203298)
中国科学院青年创新促进会优秀会员项目(20144310
2016102)
文摘
目前大部分的网页信息抽取方法都局限于某一类网页的提取,并没有进一步深入到适用于任意网页的抽取。针对这一问题,该文提出了一种基于融合机制的任意网页主题信息抽取框架,特点是通过"模板库匹配—基于模板抽取—网页分类—全自动抽取"四个步骤实现对模板无关的全自动抽取算法和基于模板的抽取算法的融合。实验显示,这种融合机制能促进抽取准确率的有效提高,从而最终建立起一个适用于任意网页的、具有实用价值的信息抽取框架。
关键词
任意网页
主题信息
网页
分类
实用价值
Keywords
any page
theme information
web page classification
practical value
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
任意网页的主题信息抽取研究
张儒清
郭岩
刘悦
俞晓明
程学旗
《中文信息学报》
CSCD
北大核心
2017
6
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部