融合数据分布特征的保序学习机

Rank Preservation Learning Machine Based on Data Distribution Fusion

下载PDF

导出

摘要支持向量机(Support vector machine,SVM)作为一种经典的分类方法,已经广泛应用于各种领域中。然而,标准支持向量机在分类决策中面临以下问题:(1)未考虑分类数据的分布特征;(2)忽略了样本类别间的相对关系;(3)无法解决大规模分类问题。鉴于此,提出融合数据分布特征的保序学习机(Rank preservation learning machine based on data distribution fusion,RPLM-DDF)。该方法通过引入类内离散度表征数据的分布特征;通过各类样本数据中心位置相对不变保证全局样本顺序不变;通过建立所提方法和核心向量机对偶形式的等价性解决了大规模分类问题。在人工数据集、中小规模数据集和大规模数据集上的比较实验验证所提方法的有效性。 As a typical classification method,support vector machine(SVM)has been widely used in various fields.However,the standard SVM faces the following problems in the classification decision:First,it does not consider the distribution characteristics of the classification data;Second,it ignores the relative relationship between sample categories;Third,it can not solve the problem of large-scale classification.In view of this,the rank preservation learning machine based on data distribution fusion(RPLM-DDF)is proposed,in which within-class scatter is introduced to describe the distribution properties,and through the relatively constant position of all kinds of sample data centers,the global sample order remains unchanged.The large-scale classification problem is solved by certifying RPLMDDF and the duality of the core vector machine.The comparison experiments on the artificial datasets,small-scale datasets and large-scale datasets verity the effectiveness of the RPLM-DDF.

作者刘忠宝张志剑党建飞 LIU Zhongbao;ZHANG Zhijian;DANG Jianfei(School of Software,North University of China,Taiyuan,030051,China)

机构地区中北大学软件学院

出处《数据采集与处理》 CSCD 北大核心 2020年第3期431-440,共10页 Journal of Data Acquisition and Processing

基金国家社会科学基金(19BTQ012)资助项目。

关键词类内离散度支持向量机大规模数据集全局保序核心向量机 within-class scatter support vector machine(SVM) large-scale labeled datasets global rank preservation core vector machine(CVM)

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献5

1汪海燕,黎建辉,杨风雷.支持向量机理论及算法研究综述[J].计算机应用研究,2014,31(5):1281-1286. 被引量：206
2张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42. 被引量：2276
3李娜,孙乐,胡一楠,李笑,王亚南.模糊型支持向量机及其在入侵检测中的应用[J].科技创新与应用,2018,8(11):154-156. 被引量：1
4汪廷华,田盛丰,黄厚宽.特征加权支持向量机[J].电子与信息学报,2009,31(3):514-518. 被引量：56
5范昕炜,杜树新,吴铁军.可补偿类别差异的加权支持向量机算法[J].中国图象图形学报（A辑）,2003,8(9):1037-1042. 被引量：26

二级参考文献68

1庄东,陈英.基于加权近似支持向量机的文本分类[J].清华大学学报（自然科学版）,2005,45(S1):1787-1790. 被引量：16
2马立权,李维,蔡韩辉,路莹,李歆.手写数字识别中的预处理技术研究[J].仪器仪表学报,2001,22(z2):263-265. 被引量：12
3邬啸,魏延,吴瑕.改进的双隶属度模糊支持向量机[J].重庆师范大学学报（自然科学版）,2011,28(5):49-52. 被引量：5
4丁胜锋.一种改进的双支持向量机[J].辽宁石油化工大学学报,2012,32(4):76-79. 被引量：4
5赖苏,熊忠阳,江帆,唐蓉君.利用改进的多项式核函数支持向量机进行文本分类[J].重庆大学学报（自然科学版）,2012,35(S1):41-45. 被引量：2
6谢湘,匡镜明.Mandarin Digits Speech Recognition Using Support Vector Machines[J].Journal of Beijing Institute of Technology,2005,14(1):9-12. 被引量：2
7赵晖,荣莉莉.支持向量机组合分类及其在文本分类中的应用[J].小型微型计算机系统,2005,26(10):1816-1820. 被引量：7
8李洁,高新波,焦李成.基于特征加权的模糊聚类新算法[J].电子学报,2006,34(1):89-92. 被引量：114
9张翔,肖小玲,徐光祐.基于样本之间紧密度的模糊支持向量机方法[J].软件学报,2006,17(5):951-958. 被引量：84
10田新广,高立志,张尔扬.新的基于机器学习的入侵检测方法[J].通信学报,2006,27(6):108-114. 被引量：15

共引文献2547

1李曙光,张新泉.沙钢冷轧原料库行车无人化技术应用[J].冶金自动化,2021,45(S01):12-15. 被引量：1
2白岗岗,侯精明,史玉品,韩浩,郭凯华,李丙尧,付德宇.基于支持向量机的葫芦河流域径流变化的多因素贡献率分析[J].水土保持研究,2020,27(2):112-117. 被引量：2
3曾赟.第四种法学知识新形态——数据法学的研究定位[J].法制与社会发展,2023,29(1):41-59. 被引量：11
4乔丹,刘刚,杨执钧,钟韬,白雪.基于迁移学习的船舶目标识别[J].计算机应用研究,2020,37(S01):324-325. 被引量：1
5孟琮棠,赵银娣,向阳.基于卷积神经网络的遥感图像变化检测[J].现代测绘,2019,0(5):1-5. 被引量：3
6王增政,王岩松,郭辉,袁涛,郑立辉,孙裴.基于LS-SVR的高速列车车内声品质主观评价[J].智能计算机与应用,2022,12(2):191-195. 被引量：1
7田海军,门洪,郎世伟.基于LS-SVM的电厂过热汽温仿真研究[J].微计算机信息,2007,23(10):270-272. 被引量：2
8张磊,夏士雄,牛强.基于SVM二叉决策树方法的矿井提升机故障诊断[J].微计算机信息,2008,24(10):198-199. 被引量：4
9瞿伟廉,谭冬梅.基于小波分析和支持向量机的结构损伤识别[J].武汉理工大学学报,2008,30(2):80-82. 被引量：3
10郑树剑,刘冀伟,何积铨,韩旭.基于支持向量机的混凝土结构中钢筋腐蚀的判别[J].电子器件,2007,30(5):1935-1938.

1吴双,秦华明,叶锦韶.双氯芬酸钠对苏云金芽孢杆菌毒性的分子机制[J].中国环境科学,2017,37(12):4763-4770.
2王福杰.地理国情监测地表覆盖分类数据的质量控制[J].北京测绘,2020,34(5):657-660. 被引量：2
3管立新,彭中正.基于径向基函数神经网络预抽取的支持向量机[J].赣南师范大学学报,2018,39(6):33-38.
4石世英,胡鸣明.无废城市背景下项目经理垃圾分类决策行为意向研究——基于计划行为理论框架[J].干旱区资源与环境,2020,0(4):22-26. 被引量：25
5谈晶圩,杨敏.基于改进的全变分图像去噪算法研究[J].南京邮电大学学报（自然科学版）,2020,40(2):95-100. 被引量：6
6杨春玲,王晓波,郑安豫,张艳.优化LS-SVM在油浸式变压器故障诊断中的应用[J].长春师范大学学报,2020,39(4):71-74. 被引量：3
7宋中山,周玮瑜,孙翀,艾勇,刘越.一种具有保序性的带权多标记学习算法[J].中南民族大学学报（自然科学版）,2020,39(3):309-314. 被引量：1
8殷明.在线招投标系统中隐私数据自动加密仿真[J].计算机仿真,2020,37(5):128-131. 被引量：1
9张晓辉,刘涛.基于形式概念分析的灾害应急知识模型研究——以灾害应急专题图组为例[J].地理与地理信息科学,2020,36(1):7-15. 被引量：1
10徐振杰,陈庆奎.一种基于目标检测的偏斜图像校准方法[J].小型微型计算机系统,2020,41(5):1106-1111. 被引量：1

数据采集与处理

2020年第3期

浏览历史

内容加载中请稍等...

融合数据分布特征的保序学习机

参考文献5

二级参考文献68

共引文献2547

相关作者

相关机构

相关主题

浏览历史