期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于加权Word2vec的文本分类方法研究 被引量:23
1
作者 马思丹 刘东苏 《情报科学》 CSSCI 北大核心 2019年第11期38-42,共5页
【目的/意义】利用词向量的优点,提出一种加权Word2vec的文本分类方法,以期在文本分类时获得较高的分类效果。【方法/过程】首先对文本进行词向量训练,通过设置词语相似度阈值,将文本关键词划分为重叠部分和非重叠部分,随后分别计算两... 【目的/意义】利用词向量的优点,提出一种加权Word2vec的文本分类方法,以期在文本分类时获得较高的分类效果。【方法/过程】首先对文本进行词向量训练,通过设置词语相似度阈值,将文本关键词划分为重叠部分和非重叠部分,随后分别计算两部分加权相似度值,再采用参数化线性加权方式计算文本相似度,最后采用KNN进行分类。【结果/结论】实验结果表明文中提出的加权Word2vec方法比TF-IDF传统文本分类模型和均值Word2vec模型的分类效果有所提升,是一种有效的文本分类方法。 展开更多
关键词 文本相似度 TF-IDF 加权Word2vec 文本分类
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部