主动协同半监督粗糙集分类模型被引量：7

A Semi-Supervised Rough Set Model for Classification Based on Active Learning and Co-Training

导出

摘要粗糙集理论是一种有监督学习模型,一般需要适量有标记的数据来训练分类器.但现实一些问题往往存在大量无标记的数据,而有标记数据由于标记代价过大较为稀少.文中结合主动学习和协同训练理论,提出一种可有效利用无标记数据提升分类性能的半监督粗糙集模型.该模型利用半监督属性约简算法提取两个差异性较大的约简构造基分类器,然后基于主动学习思想在无标记数据中选择两分类器分歧较大的样本进行人工标注,并将更新后的分类器交互协同学习.UCI数据集实验对比分析表明,该模型能明显提高分类学习性能,甚至能达到数据集的最优值. Rough set theory, as an effective supervised learning model, usually relies on the availability of an amount of labeled data to train the classifier. Howerer, in many practical problems, large amount of unlabeled data are readily available, and labeled ones are fairly expensive to obtain because of high cost. In this paper, a semi-supervised rough set model is proposed to deal with the partially labeled data. The proposed model firstly employs two diverse semi-supervised reducts to train its base classifiers on labeled data. The unlabeled ramified samples for two base classifiers are selected to be labeled based on the principle of active learning, and then the updated classifiers learn from each other by labeling confident unlabeled samples to its concomitant. The experimental results on selected UCI datasets show that the proposed model greatly improves the classification performance of partially labeled data, and even the bestperformance of dataset is obtained.

作者高灿苗夺谦张志飞刘财辉

机构地区同济大学电子与信息工程学院计算机科学与技术系同济大学嵌入式系统与服务计算教育部重点实验室

出处《模式识别与人工智能》 EI CSCD 北大核心 2012年第5期745-754,共10页 Pattern Recognition and Artificial Intelligence

基金国家自然科学基金项目(No.60970061 61075056 61103067) 中国博士后科学基金项目(No.2011M500626 2011M500815) 上海市重点学科建设项目(No.B004)资助

关键词粗糙集差别矩阵半监督约简主动学习协同训练 Rough Set, Discernibility Matrix, Semi-Supervised Reduction, Active Learning, Co-Training

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1龙军,殷建平,祝恩,赵文涛.主动学习研究综述[J].计算机研究与发展,2008,45(z1):300-304. 被引量：31

二级参考文献34

1[1]D Cohn,Atlas R Ladner.Improving generalization with active learning.Machine Learning,1994,5(2):201-221
2[2]Y Freund,H S Seung,E Shamir,et al.Selective sampling using the query by committee algorithm.Machine Learning,1997,28(2-3):133-168
3[3]M Kaariainen.Active learning in the non-realizable case.In:Proc of the 17th Int'l Conf on Algorithmic Learning Theory.Berlin:Springer,2006.63-77
4[4]M -F Balcan,A Beygelzimer,J Langford.Agnostic active learning.In:Proc of the 23rd Int'l Conf on Machine Learning.San Francisco,CA:Morgan Kaufmann,2006
5[5]S Dasgupta.Coarse sample complexity bounds for active learning.In:Proc of Advances in Neural Information Processing Systems.Cambridge,MA:MIT Press,2005
6[6]S Dasgupta,A T Kalai,C Monteleoni.Analysis of perceptron-based active learning.In:Proc of the 18th Annual Conf on Learning Theory.Berlin:Springer,2005
7[7]I Dagon,S Engelson.Committee-based sampling for training probabilistic classifiers.In:Proc of the 12th Int'l Conf on Machine Learning.San Francisco,CA:Morgan Kaufmann,1995.150-157
8[8]S Arganmon-Engelson,I Dagon.Committee-based sample selection for probabilistic classifiers.Journal of Artificial Intelligence research,1999,11:335-360
9[9]D D Lewis,W A Gail.A sequential algorithm for training text classifiers.In:Proc of the 17th ACM Int'l Conf on Research and Development in Information Retrieval.Berlin:Springer,1994.3-12
10[10]A K McCallum,K Nigam.Employing EM in pool-based active learning for text classification.In:Proc of the 15th Int'l Conf on Machine Learning.San Francisco,CA:Morgan Kaufmann,1998

共引文献30

1李恬,冯早,朱雪峰.基于主动学习和最优路径森林的管道故障分类识别方法[J].电子测量与仪器学报,2022,36(12):67-76. 被引量：1
2徐建良,姜亦宏,张巍,王秋红.一种基于Co-Training的海洋文献分类方法[J].中国海洋大学学报（自然科学版）,2010,40(2):105-110. 被引量：1
3刘君,熊忠阳,王银辉.图像多分类主动学习方法[J].计算机工程与应用,2010,46(13):11-14. 被引量：2
4汪婵,程玉虎,王雪松.基于局部稀疏K近邻密度的主动学习[J].中国科技论文在线,2011,6(7):507-511. 被引量：1
5章林柯,崔立林.潜艇机械噪声源分类识别的小样本研究思想及相关算法评述[J].船舶力学,2011,15(8):940-947. 被引量：6
6熊伟,周水庚,关佶红.网络数据分类研究进展[J].模式识别与人工智能,2011,24(4):527-537. 被引量：3
7张雁,吴保国,王冬.遥感影像分类方法研究动态[J].安徽农业科学,2012,40(28):14107-14110. 被引量：4
8武永成.一种基于泛化查询的主动学习算法[J].荆楚理工学院学报,2013,28(2):26-29.
9翟俊海,李畅,李塔,王熙照.基于概率神经网络和K-L散度的样例选择[J].计算机应用研究,2014,31(1):63-65. 被引量：2
10王玲,李琴,隋美玲,肖海军.基于支持向量机的主动学习方法及其实现[J].长沙大学学报,2014,28(2):35-38.

同被引文献105

1张海荣,朱信忠,赵建民,徐慧英.一种优化的基于用户聚类的过滤推荐策略[J].计算机系统应用,2008,17(11):95-97. 被引量：6
2赵卓翔,王轶彤,田家堂,周泽学.社会网络中基于标签传播的社区发现新算法[J].计算机研究与发展,2011,48(S3):8-15. 被引量：37
3于达仁,胡清华,鲍文.融合粗糙集和模糊聚类的连续数据知识发现[J].中国电机工程学报,2004,24(6):205-210. 被引量：70
4谢宏,程浩忠,牛东晓.基于信息熵的粗糙集连续属性离散化算法[J].计算机学报,2005,28(9):1570-1574. 被引量：134
5吴青,刘三阳,郑巍.基于乘性规则的支持向量机[J].智能系统学报,2007,2(2):74-77. 被引量：3
6Pawlak Z. Rough sets [J]. International Journal of Computer and Information Science, 1982, 11(5): 341-356.
7Pawlak Z. Rough sets: Theoretical Aspects of Reasoning about Data [M]. Dordrecht, Netherlands: Kluwer Academic Publishers, 1991.
8Ching J Y, Wong A K C, Chan K C C. Class-dependent discretization for inductive learning from continuous and mixed mode data [J]. IEEE Trans on Pattern Analysis and Machine Intelligence, 1995, 17(7): 641-651.
9Jensen R, Shen Q. Semantics-Preserving dimensionality reduction: rough and fuzzy-rough-based approaches [J]. IEEE Trans on Knowledge and Data Engineering, 2004, 16 (12): 1457-1471.
10Zhu Xiaojin. Semi-Supervised learning survey, TR1530 [R]. Madison: Department of Computer Sciences, University of Wisconsin, 2008.

引证文献7

1张晓伟.基于动态时间规整的局部分块匹配在面部遮挡人脸识别中的应用[J].科学技术与工程,2014,22(5):109-114. 被引量：3
2张维,苗夺谦,高灿,岳晓冬.邻域粗糙协同分类模型[J].计算机研究与发展,2014,51(8):1811-1820. 被引量：12
3刘建粉,史永昌.基于用户兴趣分类优化的聚类模型仿真[J].微电子学与计算机,2014,31(5):171-174. 被引量：2
4宋国平.低分辨率KINECT传感器采集三维点云的人脸识别[J].激光杂志,2014,35(10):51-56.
5尚耐丽,王骁力,沈鹍霄,卢玉领,马晓普,兰义华.半监督分类方法的研究[J].计算机应用与软件,2015,32(11):162-166. 被引量：4
6高灿,周杰,高天宇,赖志辉.不完备弱标记数据的粗糙协同学习模型[J].模式识别与人工智能,2018,31(10):950-957. 被引量：4
7刘慧婷,程雷,郭孝雪,赵鹏.实时个性化微博推荐系统[J].计算机科学,2018,45(9):253-259. 被引量：1

二级引证文献26

1刘持标,林金发,孙丽丽,吴美瑜,邱锦明.基于Android图像识别技术的失踪人员管理系统开发[J].三明学院学报,2014,31(4):17-23. 被引量：7
2董跃华,刘力.基于权衡因子的决策树优化算法[J].江西理工大学学报,2015,36(5):90-97.
3张培珍,王斌,欧触灵.动态时间归整算法抑制前向散射直达波干扰[J].广东海洋大学学报,2015,35(6):77-81.
4李凯凯,宋礼鹏.基于社交网络的用户行为记忆性研究[J].微电子学与计算机,2017,34(3):133-135. 被引量：4
5李智远,杨习贝,徐苏平,陈向坚,王平心.邻域决策一致性的属性约简方法研究[J].河南师范大学学报（自然科学版）,2017,45(5):68-73. 被引量：11
6张艳芹,窦慧莉.基于邻域分类AUC的属性选择方法[J].科技与创新,2017(24):43-45.
7王长宝,杨习贝,窦慧莉,陈向坚,王平心.邻域决策错误率的局部约简方法研究[J].计算机工程与应用,2018,54(6):95-99. 被引量：2
8张艳芹.基于邻域分类AUC的属性选择方法[J].天津理工大学学报,2018,34(3):30-33. 被引量：1
9余思成,杨习贝,陈向坚,窦慧莉,王平心.邻域决策的随机约简与集成分类研究[J].小型微型计算机系统,2018,39(6):1163-1167. 被引量：2
10吴伟志,杨丽,谭安辉,徐优红.广义不完备多粒度标记决策系统的粒度选择[J].计算机研究与发展,2018,55(6):1263-1272. 被引量：21

1李圣良,王城华.基于蜜网的主动协同防御系统[J].网络安全技术与应用,2013(1):7-9. 被引量：1
2贺晋兵,刘云霞.数据挖掘中无监督属性重要性的测度[J].统计与决策,2007,23(11):141-142. 被引量：1
3黄庆成,罗荣华.一种多移动机器人主动协同定位方法的研究[J].电子学报,2010,38(11):2644-2648. 被引量：10
4熊体凡,万立,钟毅芳.基于智能代理的主动式协同服务框架研究[J].机械科学与技术,2006,25(7):869-873. 被引量：1
5吴虎胜,张凤鸣,徐显亮,张超,杜继永.多变量时间序列的无监督属性选择算法[J].模式识别与人工智能,2013,26(10):916-923. 被引量：3
6郑超,陈杰,杨星,殷松峰,冯云松.基于优化协同训练理论的自适应融合跟踪[J].红外与毫米波学报,2016,35(4):496-504.
7毕秋敏,李明,曾志勇.一种主动学习和协同训练相结合的半监督微博情感分类方法[J].现代图书情报技术,2015(1):38-44. 被引量：5
8楼润瑜,王备战,王伟.大规模网络的主动协同防御模型研究[J].厦门大学学报（自然科学版）,2010,49(2):198-204. 被引量：6
9李雨,高中村.对速度滑冰几个重要问题的初步认识[J].冰雪运动,2006,28(2):6-7. 被引量：17
10赵琳琳,颜若愚,李奇胜.基于P2DER模型的网络安全主动协同防护系统框架[J].现代计算机,2010,16(2):93-97. 被引量：3

模式识别与人工智能

2012年第5期

浏览历史

内容加载中请稍等...

主动协同半监督粗糙集分类模型被引量：7

参考文献1

二级参考文献34

共引文献30

同被引文献105

引证文献7

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

主动协同半监督粗糙集分类模型 被引量：7

参考文献1

二级参考文献34

共引文献30

同被引文献105

引证文献7

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

主动协同半监督粗糙集分类模型被引量：7