-
题名融合相似度图和随机游走模型的多标签短文本分类算法
被引量:4
- 1
-
-
作者
李晓红
王闪闪
马堉银
马慧芳
-
机构
西北师范大学计算机科学与工程学院
-
出处
《计算机工程与科学》
CSCD
北大核心
2021年第6期1081-1087,共7页
-
基金
国家自然科学基金(61762078,61967013)
高等学校创新创业基金(2020B-089)
+1 种基金
甘肃省科技计划(20JR5RA518)
甘肃省自然科学基金(20JR10RA076)。
-
文摘
提出一种融合相似度图和随机游走模型的多标签短文本分类算法。首先,以样本数据和标签为节点创建相似度图,借助外部知识库计算样本与标签之间的权重,得到预测样本与标签集合之间的匹配度。然后,将多标签数据映射成多标签依赖图,在图上进行重启随机游走,并将已获得的匹配度作为初始预测值,计算每个节点的概率分布,直到概率分布趋于稳定时,节点的概率分布即为标签的概率分布,进而确定预测文本的标签集。实验结果表明,本文提出的算法有较好的多标签文本分类性能,与同类算法相比较,分类性能显著提升。
-
关键词
多标签短文本分类
相似度图
重启随机游走
语义网WordNet
-
Keywords
multi-label short text classification
similarity graph
restart random walk
WordNet
-
分类号
TP301
[自动化与计算机技术—计算机系统结构]
-