期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
科技文献关键词自动标注算法研究
被引量:
2
1
作者
倪娜
刘凯
李耀东
《计算机科学》
CSCD
北大核心
2012年第9期175-179,共5页
未标注或遗失关键词给科技文献的分类和导航工作带来一定困难,针对这一问题,提出了基于文献摘要内容的关键词自动标注算法。该算法使用标注过关键词的文献摘要作为训练文本,分别采用语言模型、LatentDirichletAllocation(LDA)模型、Prob...
未标注或遗失关键词给科技文献的分类和导航工作带来一定困难,针对这一问题,提出了基于文献摘要内容的关键词自动标注算法。该算法使用标注过关键词的文献摘要作为训练文本,分别采用语言模型、LatentDirichletAllocation(LDA)模型、ProbabilisticAuthor-Topic模型及语言模型+LDA模型的组合模型对训练集中的摘要文本和关键词建模,建立关键词和组成摘要文本特征词之间的关系,然后利用这些模型在未标注关键词的科技文献摘要上进行关键词的预测。在中英文数据上的实验结果表明,自动标注的关键词能较好地反映科技文献的内容;在所有模型中,语言模型+LDA组合模型的效果最佳。
展开更多
关键词
语言模型
标签预测
LATENT
DIRICHLET
ALLOCATION
PROBABILISTIC
Author-Topic
Model
下载PDF
职称材料
题名
科技文献关键词自动标注算法研究
被引量:
2
1
作者
倪娜
刘凯
李耀东
机构
中国
科学院自动化研究所复杂系统智能控制与管理国家重点实验室(筹)
中国民航信息网络股份有限公司研发中心分销产品研发部
出处
《计算机科学》
CSCD
北大核心
2012年第9期175-179,共5页
基金
973国家重点基础研究发展计划(2007CB311007)
国家自然科学基金(61072084)资助
文摘
未标注或遗失关键词给科技文献的分类和导航工作带来一定困难,针对这一问题,提出了基于文献摘要内容的关键词自动标注算法。该算法使用标注过关键词的文献摘要作为训练文本,分别采用语言模型、LatentDirichletAllocation(LDA)模型、ProbabilisticAuthor-Topic模型及语言模型+LDA模型的组合模型对训练集中的摘要文本和关键词建模,建立关键词和组成摘要文本特征词之间的关系,然后利用这些模型在未标注关键词的科技文献摘要上进行关键词的预测。在中英文数据上的实验结果表明,自动标注的关键词能较好地反映科技文献的内容;在所有模型中,语言模型+LDA组合模型的效果最佳。
关键词
语言模型
标签预测
LATENT
DIRICHLET
ALLOCATION
PROBABILISTIC
Author-Topic
Model
Keywords
Language model
Tag prediction
Latent dirichlet allocation
Probabilistic author-topic model
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
科技文献关键词自动标注算法研究
倪娜
刘凯
李耀东
《计算机科学》
CSCD
北大核心
2012
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部