期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
融合共现距离和区分度的短文本相似度计算方法
被引量:
9
1
作者
刘文
马慧芳
+1 位作者
脱婷
陈海波
《计算机工程与科学》
CSCD
北大核心
2018年第7期1281-1286,共6页
针对短文本内容简短、特征稀疏等特点,提出一种融合共现距离和区分度的短文本相似度计算方法。一方面,该方法在整个短文本语料库中利用两个共现词之间距离计算它们的共现距离相关度。另一方面通过计算共现区分度来提高距离相关度的准确...
针对短文本内容简短、特征稀疏等特点,提出一种融合共现距离和区分度的短文本相似度计算方法。一方面,该方法在整个短文本语料库中利用两个共现词之间距离计算它们的共现距离相关度。另一方面通过计算共现区分度来提高距离相关度的准确度,然后对每个文本中词项进行相关性加权,最后通过词项的权重和词项之间的共现距离相关度计算两个文本的相似度。实验结果表明,本文提出的方法能够提高短文本相似度计算的准确率。
展开更多
关键词
短文本
共现距离相关度
共
现
区分度
词项加权
相似度计算
下载PDF
职称材料
题名
融合共现距离和区分度的短文本相似度计算方法
被引量:
9
1
作者
刘文
马慧芳
脱婷
陈海波
机构
西北师范大学计算机科学与工程学院
桂林电子科技大学广西可信软件重点实验室
出处
《计算机工程与科学》
CSCD
北大核心
2018年第7期1281-1286,共6页
基金
国家自然科学基金(61762078
61363058)
+1 种基金
广西可信软件重点实验室研究课题(KX201705)
西北师范大学学生创新能力计划(CX2018Y054)
文摘
针对短文本内容简短、特征稀疏等特点,提出一种融合共现距离和区分度的短文本相似度计算方法。一方面,该方法在整个短文本语料库中利用两个共现词之间距离计算它们的共现距离相关度。另一方面通过计算共现区分度来提高距离相关度的准确度,然后对每个文本中词项进行相关性加权,最后通过词项的权重和词项之间的共现距离相关度计算两个文本的相似度。实验结果表明,本文提出的方法能够提高短文本相似度计算的准确率。
关键词
短文本
共现距离相关度
共
现
区分度
词项加权
相似度计算
Keywords
short text
co occurrence distance correlation
co occurrence discrimination
term weighting
similarity calculation
分类号
TP391 [自动化与计算机技术—计算机应用技术]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
融合共现距离和区分度的短文本相似度计算方法
刘文
马慧芳
脱婷
陈海波
《计算机工程与科学》
CSCD
北大核心
2018
9
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部