期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于LF-LDA和Word2vec的文本表示模型研究 被引量:4
1
作者 陈磊 李俊 《电子技术(上海)》 2017年第7期1-5,共5页
LDA(Latent Dirichlet Allocation)在训练的过程中没有结合词向量训练,而LF-LDA(Latent FeatureLDA)在训练过程中利用Word2vec词向量改善了文档的主题分布。但是,文档用主题分布进行表示,没有结合特征词的上下文信息。为此,本文提出利用... LDA(Latent Dirichlet Allocation)在训练的过程中没有结合词向量训练,而LF-LDA(Latent FeatureLDA)在训练过程中利用Word2vec词向量改善了文档的主题分布。但是,文档用主题分布进行表示,没有结合特征词的上下文信息。为此,本文提出利用LF-LDA生成的主题向量结合Word2vec词向量,对文本进行表示。另外,文章还提出了利用LF-LDA生成的主题向量对文档进行表示。在Stack Overflow短文本数据集上的分类结果表明,LF-LDA结合Word2vec的文本表示优于LDA结合Word2vec的文本表示和LF-LDA主题分布的文本表示。基于主题向量的文本表示模型优于LDA模型。 展开更多
关键词 文本表示 LDA Word2vec lf-lda 文本分类
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部