-
题名基于主题模型的多示例多标记学习方法
被引量:1
- 1
-
-
作者
严考碧
李志欣
张灿龙
-
机构
广西师范大学广西多源信息挖掘与安全重点实验室
广西信息科学实验中心
-
出处
《计算机应用》
CSCD
北大核心
2015年第8期2233-2237,共5页
-
基金
国家自然科学基金资助项目(61165009
61262005
+5 种基金
61363035
61365009)
国家973计划项目(2012CB326403)
广西自然科学基金资助项目(2012GXNSFAA053219
2013GXNSFAA019345
2014GXNSFAA118368)
-
文摘
针对现有的大部分多示例多标记(MIML)算法都没有考虑如何更好地表示对象特征这一问题,将概率潜在语义分析(PLSA)模型和神经网络(NN)相结合,提出了基于主题模型的多示例多标记学习方法。算法通过概率潜在语义分析模型学习到所有训练样本的潜在主题分布,该过程是一个特征学习的过程,用于学习到更好的特征表达,用学习到的每个样本的潜在主题分布作为输入来训练神经网络。当给定一个测试样本时,学习测试样本的潜在主题分布,将学习到的潜在主题分布输入到训练好的神经网络中,从而得到测试样本的标记集合。与两种经典的基于分解策略的多示例多标记算法相比,实验结果表明提出的新方法在现实世界中的两种多示例多标记学习任务中具有更优越的性能。
-
关键词
主题模型
特征表达
多示例多标记学习
场景分类
文本分类
-
Keywords
topic model
feature expression
multi-instance multi-label learning
scene classification
text categorization
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-