-
题名多原型词向量与文本主题联合学习模型
被引量:4
- 1
-
-
作者
曹中华
夏家莉
彭文忠
张志斌
-
机构
江西财经大学信息管理学院财政大数据中心
江西师范大学软件学院
-
出处
《中文信息学报》
CSCD
北大核心
2020年第3期64-71,106,共9页
-
基金
国家自然科学基金(41661083)。
-
文摘
常见的词嵌入向量模型存在每个词只具有一个词向量的问题,词的主题值是重要的多义性条件,可以作为获得多原型词向量的附加信息。在skip-gram(cbow)模型和文本主题结构基础上,该文研究了两种改进的多原型词向量方法和基于词与主题的嵌入向量表示的文本生成结构。该模型通过联合训练,能同时获得文本主题、词和主题的嵌入向量,实现了使用词的主题信息获得多原型词向量,和使用词和主题的嵌入式向量学习文本主题。实验表明,该文提出的方法不仅能够获得具有上下文语义的多原型词向量,也可以获得关联性更强的文本主题。
-
关键词
多原型词向量
多义词
主题模型
神经网络
-
Keywords
multi-prototype words embedding
polysemy words
topic model
neural network
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-