-
题名一种结合LPA半监督学习的排序学习算法
被引量:3
- 1
-
-
作者
奚凌然
王小平
-
机构
同济大学电子与信息工程学院
-
出处
《计算机应用与软件》
CSCD
2016年第1期286-290,共5页
-
文摘
针对有监督排序学习所需训练集的大量标注数据不易获得的情况,引入基于图的标签传播半监督学习。利用有限的已标记数据和大量未标记数据来完成训练数据的自动标注工作,解决大量训练数据集标注工作耗时耗力的难题。首先以训练数据为节点建立εNN图模型实现标签传播算法进行训练数据的自动标注,再基于得到的训练集使用Ranking SVM实现排序学习,在OHSUMED数据集上衡量该方法在MAP和NDCG@n评价准则下的性能。实验结果表明,该方法的性能优于普通pointwise排序学习方法,略低于普通pairwise排序学习方法,能够在达到可用性要求的前提下节省接近60%的训练集标注工作量。
-
关键词
排序学习
LPA标签传播算法
图的半监督学习
排序支持向量机
-
Keywords
Ranking learning LPA (label propagation algorithm) Graph based semi-supervised learning RankingSVM
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-
-
题名一种结合众包的排序学习算法
被引量:1
- 2
-
-
作者
王小平
奚凌然
-
机构
同济大学电子与信息工程学院
-
出处
《计算机应用与软件》
2017年第6期277-283,291,共8页
-
文摘
针对有监督排序学习所需带标记训练数据集不易获得的情况,引入众包这种新型大众网络聚集模式来完成标注工作,为解决排序学习所需大量训练数据集标注工作耗时耗力的难题提供了新的思路。首先介绍了众包标注方法,着重提出两种个人分类器模型来解决众包结果质量控制问题,同时考虑标注者能力和众包任务的难度这两个影响众包质量的因素。再基于得到的训练集使用RankingSVM进行排序学习并在微软OHSUMED数据集上衡量了该方法在NDCG@n评价准则下的性能。实验结果表明该众包标注方法能够达到95%以上的正确率,所得排序模型的性能基本和RankingSVM算法持平,从而验证了众包应用于排序学习的可行性和优越性。
-
关键词
排序学习
众包
众包质量控制
排序支持向量机
-
Keywords
Learning to rank Crowdsourcing Crowdsourcing quality control Ranking SVM
-
分类号
TP181
[自动化与计算机技术—控制理论与控制工程]
-