期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于加权Word2vec的文本分类方法研究
被引量:
23
1
作者
马思丹
刘东苏
《情报科学》
CSSCI
北大核心
2019年第11期38-42,共5页
【目的/意义】利用词向量的优点,提出一种加权Word2vec的文本分类方法,以期在文本分类时获得较高的分类效果。【方法/过程】首先对文本进行词向量训练,通过设置词语相似度阈值,将文本关键词划分为重叠部分和非重叠部分,随后分别计算两...
【目的/意义】利用词向量的优点,提出一种加权Word2vec的文本分类方法,以期在文本分类时获得较高的分类效果。【方法/过程】首先对文本进行词向量训练,通过设置词语相似度阈值,将文本关键词划分为重叠部分和非重叠部分,随后分别计算两部分加权相似度值,再采用参数化线性加权方式计算文本相似度,最后采用KNN进行分类。【结果/结论】实验结果表明文中提出的加权Word2vec方法比TF-IDF传统文本分类模型和均值Word2vec模型的分类效果有所提升,是一种有效的文本分类方法。
展开更多
关键词
文本相似度
TF-IDF
加权Word2vec
文本分类
原文传递
题名
基于加权Word2vec的文本分类方法研究
被引量:
23
1
作者
马思丹
刘东苏
机构
西安电子科技大学经济与管理学院
出处
《情报科学》
CSSCI
北大核心
2019年第11期38-42,共5页
基金
国家自然科学青年基金项目“大规模动态社交网络社团检测算法研究”(71401130)
文摘
【目的/意义】利用词向量的优点,提出一种加权Word2vec的文本分类方法,以期在文本分类时获得较高的分类效果。【方法/过程】首先对文本进行词向量训练,通过设置词语相似度阈值,将文本关键词划分为重叠部分和非重叠部分,随后分别计算两部分加权相似度值,再采用参数化线性加权方式计算文本相似度,最后采用KNN进行分类。【结果/结论】实验结果表明文中提出的加权Word2vec方法比TF-IDF传统文本分类模型和均值Word2vec模型的分类效果有所提升,是一种有效的文本分类方法。
关键词
文本相似度
TF-IDF
加权Word2vec
文本分类
Keywords
text similarity
TF-IDF
weighted Word2vec
text classification
分类号
G254 [文化科学—图书馆学]
原文传递
题名
作者
出处
发文年
被引量
操作
1
基于加权Word2vec的文本分类方法研究
马思丹
刘东苏
《情报科学》
CSSCI
北大核心
2019
23
原文传递
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部