期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
一种自动发现、分割与标注引文元数据的方法
被引量:
2
1
作者
高良才
汤帜
+1 位作者
陶欣
房婧
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010年第6期893-900,共8页
在总结现有的引文元数据抽取方法的基础上,针对引文的排版惯例——引文在文档内部风格一致,提出了一种新的引文元数据抽取方法。重点描述了以往研究中很少涉及的引文元数据的自动发现和分割,探讨了风格一致性在引文元数据标注中的应用...
在总结现有的引文元数据抽取方法的基础上,针对引文的排版惯例——引文在文档内部风格一致,提出了一种新的引文元数据抽取方法。重点描述了以往研究中很少涉及的引文元数据的自动发现和分割,探讨了风格一致性在引文元数据标注中的应用。实验结果表明此方法在引文元数据发现、分割和标注方面均取得了较好的效果。
展开更多
关键词
引文元数据
风格一致性
元
数据
抽取
数字图书馆
下载PDF
职称材料
引文元数据的自动发现和标注方法研究——以外文引文为例
被引量:
3
2
作者
姜霖
王东波
《数据分析与知识发现》
CSSCI
CSCD
2017年第1期47-54,共8页
【目的】在总结当前引文元数据抽取方法的基础上,结合语义学知识和机器学习方法,对引文元数据的自动抽取方法进行探索。【方法】实验中采用神经网络模型对人工分割过的语料进行词向量训练。利用相同类型的元数据会相对集中地出现在向量...
【目的】在总结当前引文元数据抽取方法的基础上,结合语义学知识和机器学习方法,对引文元数据的自动抽取方法进行探索。【方法】实验中采用神经网络模型对人工分割过的语料进行词向量训练。利用相同类型的元数据会相对集中地出现在向量空间中某一位置的现象,通过支持向量机分类算法实现对元数据的自动归类和标注。【结果】在以外文引文数据作为测试集的实验中,本文方法取得了较高的准确率和召回率,特别是针对引文中含有多种语言和缩写的现象,具有较好的处理能力。【局限】在对于引文元数据时间内容的细粒度抽取中存在一定的局限性。【结论】实验结果表明,此方法在引文元数据的自动发现和标注上具有良好的效果,并能很大程度地提高方法的适用性和容错率。
展开更多
关键词
引文元数据
元
数据
抽取
机器学习
神经网络
原文传递
题名
一种自动发现、分割与标注引文元数据的方法
被引量:
2
1
作者
高良才
汤帜
陶欣
房婧
机构
北京大学计算机科学技术研究所
出处
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010年第6期893-900,共8页
基金
国家科技支撑计划(2006BAH02A21)资助
文摘
在总结现有的引文元数据抽取方法的基础上,针对引文的排版惯例——引文在文档内部风格一致,提出了一种新的引文元数据抽取方法。重点描述了以往研究中很少涉及的引文元数据的自动发现和分割,探讨了风格一致性在引文元数据标注中的应用。实验结果表明此方法在引文元数据发现、分割和标注方面均取得了较好的效果。
关键词
引文元数据
风格一致性
元
数据
抽取
数字图书馆
Keywords
bibliographic metadata
style consistency
metadata extraction
digital library
分类号
TP391.1 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
引文元数据的自动发现和标注方法研究——以外文引文为例
被引量:
3
2
作者
姜霖
王东波
机构
南京大学信息管理学院
江苏省数据工程与知识服务重点实验室
南京农业大学信息科学技术学院
出处
《数据分析与知识发现》
CSSCI
CSCD
2017年第1期47-54,共8页
文摘
【目的】在总结当前引文元数据抽取方法的基础上,结合语义学知识和机器学习方法,对引文元数据的自动抽取方法进行探索。【方法】实验中采用神经网络模型对人工分割过的语料进行词向量训练。利用相同类型的元数据会相对集中地出现在向量空间中某一位置的现象,通过支持向量机分类算法实现对元数据的自动归类和标注。【结果】在以外文引文数据作为测试集的实验中,本文方法取得了较高的准确率和召回率,特别是针对引文中含有多种语言和缩写的现象,具有较好的处理能力。【局限】在对于引文元数据时间内容的细粒度抽取中存在一定的局限性。【结论】实验结果表明,此方法在引文元数据的自动发现和标注上具有良好的效果,并能很大程度地提高方法的适用性和容错率。
关键词
引文元数据
元
数据
抽取
机器学习
神经网络
Keywords
Bibliographic Metadata
Metadata Extraction
Machine Learning
Neural Network
分类号
G254 [文化科学—图书馆学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
一种自动发现、分割与标注引文元数据的方法
高良才
汤帜
陶欣
房婧
《北京大学学报(自然科学版)》
EI
CAS
CSCD
北大核心
2010
2
下载PDF
职称材料
2
引文元数据的自动发现和标注方法研究——以外文引文为例
姜霖
王东波
《数据分析与知识发现》
CSSCI
CSCD
2017
3
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部