基于数据密度的半监督自训练分类算法被引量：8

Self-training semi-supervised classification based on density of data

下载PDF

导出

摘要在实际的分类任务中,无标记样本数量充足而有标记样本数量稀少的情况经常出现,目前处理这种情况的常用方法是半监督自训练分类算法。提出了一种基于数据密度的半监督自训练分类算法,该算法首先依据数据的密度对数据集进行划分,从而确定数据的空间结构;然后再按照数据的空间结构对分类器进行自训练的迭代,最终得到一个新的分类器。在UCI中六个数据集上的实验结果表明,与三种监督学习算法以及其分别对应的自训练版本相比,提出的算法分类效果更好。 It is a common problem in many practical applications that unlabeled samples is sufficient but labeled ones is very rare.A successful method to tackle this problem is self-training semi-supervised classification.This paper introduced a self-training semi-supervised classification method,in which entire data was divided into three parts based on density of data,so that the real structure of data space could be found.And then,it proposed a framework for self-training semi-supervised classification,in which the structure of data space was integrated into the self-training iterative process to help train a better classifier.Experiments on 6 data sets from UCI show that the classifier gets from the proposed method has a better performance than the ones gets from supervised method with few labeled samples and standard self-training semi-supervised classification method.

作者艾震鹏王振友 Ai Zhenpeng;Wang Zhenyou(College of Applied Mathematics,Guangdong University of Technology,Guangzhou 510520,China)

机构地区广东工业大学应用数学学院

出处《计算机应用研究》 CSCD 北大核心 2019年第4期1072-1074,共3页 Application Research of Computers

基金广州市科技计划资助项目(201707010435) 广东省研究生教育创新改革项目(2014JGXM-MS17)

关键词半监督学习自训练密度分类 semi-supervised self-training density classification

分类号 TP181 [自动化与计算机技术—控制理论与控制工程] TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

同被引文献62

1程梦,洪宇,尉桢楷,姚建民.融合情感词交互注意力机制的属性抽取研究[J].中文信息学报,2021,35(10):90-100. 被引量：3
2刘颖超,张纪元.梯度下降法[J].华东工学院学报,1993(2):12-16. 被引量：43
3多滨,王旭峰.纸币识别系统设计与实现[J].哈尔滨理工大学学报,2008,13(4):10-13. 被引量：8
4刘伟涛,许信顺.一种使用未标记样本聚类信息的自训练方法[J].计算机应用研究,2010,27(9):3341-3344. 被引量：1
5马蕾,汪西莉.基于支持向量机协同训练的半监督回归[J].计算机工程与应用,2011,47(3):177-180. 被引量：13
6赵芳,马玉磊.自训练半监督加权球结构支持向量机多分类方法[J].重庆邮电大学学报（自然科学版）,2014,26(3):404-408. 被引量：10
7马茂源,吕佳.结合相似度的朴素贝叶斯半监督自训练方法[J].重庆师范大学学报（自然科学版）,2019,36(1):78-84. 被引量：3
8李蓉,叶世伟,史忠植.SVM-KNN分类器——一种提高SVM分类精度的新方法[J].电子学报,2002,30(5):745-748. 被引量：133
9刘建伟,刘媛,罗雄麟.半监督学习方法[J].计算机学报,2015,38(8):1592-1617. 被引量：127
10尚耐丽,王骁力,沈鹍霄,卢玉领,马晓普,兰义华.半监督分类方法的研究[J].计算机应用与软件,2015,32(11):162-166. 被引量：4

引证文献8

1马茂源,吕佳.结合相似度的朴素贝叶斯半监督自训练方法[J].重庆师范大学学报（自然科学版）,2019,36(1):78-84. 被引量：3
2罗云松,吕佳.结合密度峰值优化模糊聚类的自训练方法[J].重庆师范大学学报（自然科学版）,2019,36(2):94-100. 被引量：8
3王永财.基于半监督学习的计量运行数据协同检测技术[J].信息与电脑,2021,33(14):33-35.
4许敏.隐空间特征增强自标记半监督SVM分类新方法[J].统计与决策,2022,38(7):11-15. 被引量：3
5刘学文,王继奎,杨正国,易纪海,李冰,聂飞平.近亲结点图编辑的Self-Training算法[J].计算机工程与应用,2022,58(14):144-152. 被引量：1
6刘学文,王继奎,杨正国,李冰,聂飞平.密度峰值隶属度优化的半监督Self-Training算法[J].计算机科学与探索,2022,16(9):2078-2088. 被引量：1
7牟少霞,吕冰彩.融合注意力机制的人机交互信息半监督敏感数据抽取算法[J].计算技术与自动化,2023,42(3):85-89.
8姜晨,纪礼君,宋海滨.基于支持向量机的电商物资质量抽检数据分类算法设计[J].自动化技术与应用,2023,42(10):125-128.

二级引证文献14

1龚彦鹭,吕佳.结合主动学习和密度峰值聚类的协同训练算法[J].计算机应用,2019,39(8):2297-2301. 被引量：10
2李婷婷,吕佳,范伟亚.基于新型间谍技术的半监督自训练正例无标记学习[J].计算机应用,2019,39(10):2822-2828. 被引量：2
3龙建平,李德忠,江平,唐健.厂网协调模式下燃煤机组发电能力评测方法研究[J].热能动力工程,2020,35(10):153-160. 被引量：5
4郑淋文,周金治,黄静.一种基于LKDP-FCM的心电特征分类方法[J].制造业自动化,2021,43(6):31-36.
5刘伟,顾振辉.基于密度峰值的随机森林自训练算法[J].信息与电脑,2021,33(15):73-75.
6吕佳,李婷婷.半监督自训练方法综述[J].重庆师范大学学报（自然科学版）,2021,38(5):98-106. 被引量：5
7吕佳,傅屈寒.基于改进主动学习和自训练的联合算法[J].北京师范大学学报（自然科学版）,2022,58(1):25-32. 被引量：1
8龙建平.燃煤机组发电能力影响因素分析及其评估方法探讨[J].广西电力,2021,44(5):76-81. 被引量：5
9刘学文,王继奎,杨正国,易纪海,李冰,聂飞平.近亲结点图编辑的Self-Training算法[J].计算机工程与应用,2022,58(14):144-152. 被引量：1
10李帅军,吕佳.结合合成实例与adaboostENN密度峰值自训练算法[J].重庆师范大学学报（自然科学版）,2022,39(4):105-113. 被引量：1

1曹旭丽,李牛犇,武益州,牛默然,赵述鹏.基于5G技术的应用及发展前景[J].饮食科学,2018(11X):269-269.
2李梦君,李霖,李峰.DEM插值误差的分布及与地形因子的相关性研究——以黄土高原丘陵沟壑区的试验为例[J].国土与自然资源研究,2019(1):50-56. 被引量：2
3朱艳艳.基于乡村儿童学力发展的学习策略研究[J].小学教学参考,2019(8):60-61. 被引量：1
4张崇磊,辛自强,闵长俊,袁小聪.基于光学表面波的折射率传感成像技术[J].光学学报,2019,39(1):150-165. 被引量：4
5胡朝举,梁宁.基于深层注意力的LSTM的特定主题情感分析[J].计算机应用研究,2019,36(4):1075-1079. 被引量：30
6张璐,王路,李寿山.基于情绪图标的弱监督情绪分类[J].郑州大学学报（理学版）,2019,0(2):40-46. 被引量：2
7张振国,王超,温延龙,袁晓洁.基于相似性连接的时间序列Shapelets提取[J].计算机研究与发展,2019,56(3):594-610. 被引量：3
8宋宇,王志明.面向无人机三维航迹规划的改进粒子群优化算法[J].传感器与微系统,2019,38(3):144-146. 被引量：12
9饶竹一,赵少东,张云翔,秦毅.非侵入负荷分解技术验证平台的研究与应用[J].电子测量技术,2018,41(22):136-143. 被引量：2
10郭双乐,张建光,赵鑫,耿玉菊,石龙.无监督特征选择算法的分析与总结[J].电子技术与软件工程,2019(5):181-182.

计算机应用研究

2019年第4期

浏览历史

内容加载中请稍等...

基于数据密度的半监督自训练分类算法被引量：8

同被引文献62

引证文献8

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于数据密度的半监督自训练分类算法 被引量：8

同被引文献62

引证文献8

二级引证文献14

相关作者

相关机构

相关主题

浏览历史

基于数据密度的半监督自训练分类算法被引量：8