期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于N元语法的英文学术文献聚类标签抽取算法
被引量:
3
1
作者
吴夙慧
成颖
+1 位作者
郑彦宁
潘云涛
《现代图书情报技术》
CSSCI
北大核心
2011年第7期68-75,共8页
提出一种基于N元语法的英文学术文献聚类标签抽取算法,该算法利用N元语法在大规模语料库上进行先期学习生成领域短语词表,再通过K-means算法进行聚类,从聚簇中抽取N元语法项计算TFIDF值,对出现在词表中的特征项赋以更高的权值,以得分最...
提出一种基于N元语法的英文学术文献聚类标签抽取算法,该算法利用N元语法在大规模语料库上进行先期学习生成领域短语词表,再通过K-means算法进行聚类,从聚簇中抽取N元语法项计算TFIDF值,对出现在词表中的特征项赋以更高的权值,以得分最高的特征项作为聚类标签。实验结果表明,该算法能获得更好的实验效果。同时,在抽取聚类标签时提出一种改进的TFIDF权重计算,在评价标签质量时提出一种新的标签评价方法R@N方法。
展开更多
关键词
聚类标签
n
元语法
学术文献聚类
原文传递
题名
基于N元语法的英文学术文献聚类标签抽取算法
被引量:
3
1
作者
吴夙慧
成颖
郑彦宁
潘云涛
机构
南京大学信息管理系
中国科学技术信息研究所
出处
《现代图书情报技术》
CSSCI
北大核心
2011年第7期68-75,共8页
基金
国家社会科学基金项目“中文学术信息检索系统相关性集成研究”(项目编号:10CTQ027)
教育部人文社会科学研究规划基金项目“面向用户的相关性标准及其应用研究”(项目编号:07JA870006)
中国科学技术信息研究所合作研究项目的研究成果之一
文摘
提出一种基于N元语法的英文学术文献聚类标签抽取算法,该算法利用N元语法在大规模语料库上进行先期学习生成领域短语词表,再通过K-means算法进行聚类,从聚簇中抽取N元语法项计算TFIDF值,对出现在词表中的特征项赋以更高的权值,以得分最高的特征项作为聚类标签。实验结果表明,该算法能获得更好的实验效果。同时,在抽取聚类标签时提出一种改进的TFIDF权重计算,在评价标签质量时提出一种新的标签评价方法R@N方法。
关键词
聚类标签
n
元语法
学术文献聚类
Keywords
cluster label n - gram paper clustering
分类号
G353 [文化科学—情报学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于N元语法的英文学术文献聚类标签抽取算法
吴夙慧
成颖
郑彦宁
潘云涛
《现代图书情报技术》
CSSCI
北大核心
2011
3
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部