期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
基于词嵌入与概率主题模型的社会媒体话题识别 被引量:13
1
作者 余冲 李晶 +1 位作者 孙旭东 傅向华 《计算机工程》 CAS CSCD 北大核心 2017年第12期184-191,共8页
词嵌入技术能从大语料库中捕获词语的语义信息,将其与概率主题模型结合可解决标准主题模型缺乏语义信息的问题。为此,同时对词嵌入和主题模型进行改进,构建词-主题混合模型。在主题词嵌入(TWE)模型中引入外部语料库获得初始主题和单词表... 词嵌入技术能从大语料库中捕获词语的语义信息,将其与概率主题模型结合可解决标准主题模型缺乏语义信息的问题。为此,同时对词嵌入和主题模型进行改进,构建词-主题混合模型。在主题词嵌入(TWE)模型中引入外部语料库获得初始主题和单词表示,通过定义主题向量和词嵌入的条件概率分布,将词嵌入特征表示和主题向量集成到主题模型中,同时最小化新词-主题分布函数和原始词-主题分布函数的KL散度。实验结果表明,与Word2vec、TWE、LDA和LFLDA模型相比,该模型在词表示和主题检测方面性能更好。 展开更多
关键词 社会媒体 话题检测 特征表示 嵌入 话题模型 词-主题混合模型
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部