-
题名基于语义特征空间上下文的短文本表示学习
被引量:1
- 1
-
-
作者
脱婷
马慧芳
魏家辉
刘海姣
-
机构
西北师范大学计算机科学与工程学院
桂林电子科技大学广西可信软件重点实验室
-
出处
《计算机工程与科学》
CSCD
北大核心
2019年第2期378-384,共7页
-
基金
国家自然科学基金(61762078
61363058)
+1 种基金
广西可信软件重点实验室研究课题(kx201705)
西北师范大学"学生创新能力计划"2018年支持项目(CX2018Y048)
-
文摘
文本表示是自然语言处理中的基础任务,针对传统短文本表示高维稀疏问题,提出1种基于语义特征空间上下文的短文本表示学习方法。考虑到初始特征空间维度过高,通过计算词项间互信息与共现关系,得到初始相似度并对词项进行聚类,利用聚类中心表示降维后的语义特征空间。然后,在聚类后形成的簇上结合词项的上下文信息,设计3种相似度计算方法分别计算待表示文本中词项与特征空间中特征词的相似度,以形成文本映射矩阵对短文本进行表示学习。实验结果表明,所提出的方法能很好地反映短文本的语义信息,能对短文本进行合理而有效的表示学习。
-
关键词
语义特征空间
相似度计算
文本映射矩阵
短文本表示
-
Keywords
semantic feature space
similarity calculation
text mapping matrix
short text representation
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-