SVM训练数据归一化研究被引量：56

RESEARCH ON DATA NORMALIZATION FOR SVM TRAINING

下载PDF

导出

摘要数据归一化是训练支持向量机（SVM）必须的数据预处理过程．常用的归一化方法有[-1，＋1]、N（0，1）等方法，但现有文献尚未发现关于这些常用归一化方法科学依据方面的研究．本文以经验性的实验对数据归一化的理由、归一化与不归一化对训练效率和模型预测能力影响等方面开展研究．论文选择标准数据集，对原始未归一化、不同方法归一化、人工逆归一化、任选数据属性列等情况下的数据分别进行了SVM训练，并记录目标函数值随迭代次数的变化、训练时间、模型测试及k-CV性能等信息．实验结果表明，将数据值限制在常规范围内的归一化方法，如[-0．5，＋0．5]-[-5，＋5]、N（0，1）-N（0，5）等均能在训练时间最短的情况下获得最佳的预测模型．本文工作为SVM以及一般机器学习算法的数据归一化提供了科学依据． Data normalization is a necessary training support vector machine （SVM） to the process of data preprocessing. The normalization method commonly used contains [-1, ＋ 1 ], N （0,1）, etc. However, the existing literature has not yet been found on the research of these commonly used normalization methods of scientific basis. This paper carries out research based on empirical experiments on data normalization, training efficiency and model prediction effect of normalization and non-normalization, etc. Standard data set being selected, this paper analyzed the original non-normalized data, data normalized by different method, artificial inverse normalization and optional attribute of the data by SVM training, recorded changes of objective function values with the number of iterations, training time, model test and k- CV performance information, etc. The experimental results show that the normalization method of limiting the data in the conventional range, such as [-0.5, ＋0.5] to [-5, ＋5], N （0, 1） - N （0,5） can obtain the best predictive model in the ease of short training time. This paper provides a scientific basis for the normalization of SVM data and learning algorithm of general machine.

作者汤荣志段会川孙海涛

机构地区山东师范大学信息科学与工程学院山东师范大学山东省分布式计算机软件新技术重点实验室山东师范大学实验室与设备管理处

出处《山东师范大学学报（自然科学版）》 CAS 2016年第4期60-65,共6页 Journal of Shandong Normal University(Natural Science)

关键词支持向量机数据归一化数据预处理交叉验证 SVM SMO data normalization data pre-processing cross validation

分类号 TP391.41 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1刘洛霞.基于SVM的多变量函数回归分析研究(英文)[J].电光与控制,2013,20(6):50-57. 被引量：4
2王成波,李勇平,王琳,张鸿洲.SVM与归一化方法结合的人脸和指纹融合识别[J].微计算机信息,2009,25(4):235-237. 被引量：9
3李秦渝.SVM入侵检测系统中数据预处理方法改进[J].交通科技与经济,2009,11(3):94-95. 被引量：1
4覃华,徐燕子.用LDL^T并行分解优化大规模SVM的训练效率[J].计算机工程与应用,2011,47(12):200-202. 被引量：2

二级参考文献28

1张琨,许满武,刘凤玉,张宏.基于支持向量机的异常入侵检测系统[J].计算机工程,2004,30(18):43-45. 被引量：7
2李昆仑,黄厚宽,田盛丰,刘振鹏,刘志强.模糊多类支持向量机及其在入侵检测中的应用[J].计算机学报,2005,28(2):274-280. 被引量：49
3汪晓妍,傅德胜.生物特征识别中的信息融合技术[J].微计算机信息,2005,21(10S):148-153. 被引量：17
4A. Ross, K. Nandakumar and A. Jain. Handbook of Multibiometrics. Springer-Verlag New York Inc, 2006.
5A. Jain, A. Ross and K. Nandakumar. Score normalization in multimodal biometric systems [J]. Pattern Recognition, 38 (2005) 2270-2285.
6http://bias.csr.unibo.it/fvc2002/
7K. Messer, J. Matas, J. Kittler, et al. XM2VTSDB: the extended M2VTS database. Proceeding of Audio and Video-based Biometric Person Authentication[C]. WashingtonDC, USA, pp.72-77, 1999.
8Sanderson C. and Paliwal K. Information Fusion and Person Verification using Speech and Face Information [C]. IDIAP-RR, 02-33,2002
9Dong J X,Krzyzak A,Suen C Y.A fast,parallel optimization for training support vector machine[C]//Proceedings of 3rd International Conference on Machine Learning and Data Mining,2003:96-105.
10Zanni L,Serafini T,Zanghirati G.Parallel software for training large scale support vector machines on multiprocessor systems[J].The Journal of Machine Learning Research,2006,7:1467-1492.

共引文献12

1孙宝刚,肖灵.计算机与数据库技术在舰船建造过程的节本与工时分析应用[J].舰船科学技术,2019,0(20):217-219. 被引量：2
2施媛,夏克文,杨勇,施宁宁.基于粗糙集和支持向量机的人耳识别[J].微计算机信息,2010,26(19):176-177. 被引量：1
3石业晨,韩建武,索林,付志辉,徐晓枫,张怡.一种基于指纹人脸的多生物特征身份认证方法[J].科技广场,2011(9):42-49.
4王煜,刘敏.基于支持向量机的规则零件检测技术研究[J].电子测量技术,2012,35(1):80-84. 被引量：7
5李雄,张东波.基于GMM-WSUM的多生物特征二级融合识别方法[J].计算机工程与应用,2014,50(2):179-182. 被引量：1
6黄江涛,周铸,刘刚,高正红,黄勇,王运涛.飞行器气动/结构多学科延迟耦合伴随系统数值研究[J].航空学报,2018,39(5):96-107. 被引量：20
7杨晋,金溢,马占飞.基于IQPSO算法的网络入侵检测研究[J].内蒙古科技大学学报,2018,37(1):96-102. 被引量：1
8林童,胡俊峰,黄怡鹤.基于“指纹+人脸”的个人计算机安全保护机制[J].电脑知识与技术,2017,13(10X):190-191.
9邓永春,徐跃,徐丹丹,贾雪,田先才.基于支持向量机的GNSS时间序列预测[J].全球定位系统,2019,44(2):70-75. 被引量：4
10杨恒,岳建平,周钦坤.利用SVM与ARIMA组合模型进行大坝变形预测[J].测绘通报,2021(4):74-78. 被引量：14

同被引文献505

1刘海祥,高立中,胡淼.我国车辆减速器技术研究现状与发展[J].铁道通信信号,2019,0(S01):119-124. 被引量：7
2张立亚,郝博南,孟庆勇,温良,吴文臻.基于HSV空间改进融合Retinex算法的井下图像增强方法[J].煤炭学报,2020(S01):532-540. 被引量：34
3黄清宝,李俊兴,宋春宁,徐辰华,林小峰.基于余弦控制因子和多项式变异的鲸鱼优化算法[J].控制与决策,2020,35(3):559-568. 被引量：31
4方匡南,吴见彬,朱建平,谢邦昌.信贷信息不对称下的信用卡信用风险研究[J].经济研究,2010,45(S1):97-107. 被引量：62
5张战廷,刘宇锋.ABAQUS中的混凝土塑性损伤模型[J].建筑结构,2011,41(S2):229-231. 被引量：89
6史波林,赵镭,支瑞聪,席兴军,朱大洲.应用电子鼻判别西湖龙井茶香气品质[J].农业工程学报,2011,27(S2):302-306. 被引量：40
7梁惠施,程林,苏剑.微网的成本效益分析[J].中国电机工程学报,2011,31(S1):38-44. 被引量：76
8林军志,赵明阶,杨洪武.改性混凝土声学参数与应力相关性试验研究[J].岩土力学,2009,30(S1):69-74. 被引量：5
9孙安全,张琳,王学智,王天一,张学礼.智能故障诊断IETM在导弹发射设备中的应用[J].中南大学学报（自然科学版）,2013,44(S1):227-231. 被引量：1
10李哲敏,任育锋,彭春燕.大数据时代的澳大利亚农业信息监测预警体系[J].世界农业,2015(10):21-26. 被引量：7

引证文献56

1李小波,刘威,李健.基于模糊聚类分析方法的高含水期油藏层系优化[J].当代化工,2019,0(11):2630-2633. 被引量：2
2沈桂莹,李国栋,李珊珊.基于人工神经网络对侧堰流量系数的预测研究[J].水动力学研究与进展（A辑）,2022,37(1):125-131. 被引量：2
3李曼,杨茂林,刘长岳,何仙利,段雍.基于图像的煤矸分选中图像照度调节方法[J].煤炭学报,2021,46(S02):1149-1158. 被引量：3
4牛岩.作物产量指标综合评价的数据标准化处理[J].农村经济与科技,2017,28(19):16-19. 被引量：8
5王海涛,王芳,田建艳,张聪.一种新的基于Hu不变矩的猪只姿态识别方法[J].黑龙江畜牧兽医,2017(12):14-17. 被引量：3
6陈春玲,杨天娇,郭雷,郭宇峰,周雅婷,刘栋.支持向量机在舍饲肉牛反刍行为分析中的应用[J].沈阳农业大学学报,2017,48(6):751-756. 被引量：6
7刘莹莹,邱崧,孙力,周梅,徐伟.基于多视角自步学习的人体动作识别方法[J].计算机工程,2018,44(2):257-263. 被引量：2
8周加乐,苟淞,刘宏.基于支持向量机的电火花加工TC4的盲孔深度预测模型[J].科技创新与应用,2018,8(21):24-26. 被引量：1
9张红梅,邹光宇,王淼森,肖焱中,田辉,王万章.基于传感器阵列多特征优化融合的茶叶品质检测研究[J].传感技术学报,2018,31(3):491-496. 被引量：8
10王程博,张新宇,田瑞杰,李瑞杰.基于残差分析优化BP神经网络的天津港船舶交通流量预测[J].船海工程,2018,47(A01):149-153.

二级引证文献149

1华子兴.国外扬声器概览[J].电子世界,2000(5):8-8. 被引量：1
2王煜,刘彤彤,郭磊.基于校园大数据的助学金获取关键因素分析——以某高校一卡通数据为例[J].中国教育信息化,2018,24(17):64-66. 被引量：2
3杨静.体育视频中羽毛球运动员的动作识别[J].自动化技术与应用,2018,37(10):120-124. 被引量：11
4王勋威,谢斱平,李旭,刘大为,王修善.可调间隙脱粒分离装置的设计与试验[J].湖南农业大学学报（自然科学版）,2019,45(2):205-211. 被引量：9
5李培,牛智有,谭鹤群,刘鸣,张伟健.便携式鱼粉品质检测装置的设计与参数优化[J].农业工程学报,2019,35(8):308-315. 被引量：1
6张天时,王印庚,黄滨,关长涛,朱泽闻,王浩,范玉华.海水养殖装备与工程技术标准化评价方法的研究[J].科技成果管理与研究,2019,0(4):24-28. 被引量：1
7任晓惠,刘刚,张淼,司永胜,张馨月,马丽.基于支持向量机分类模型的奶牛行为识别方法[J].农业机械学报,2019,50(B07):290-296. 被引量：23
8李培,牛智有,谭鹤群,张伟健,皇甫季璇.鱼粉品质检测电子鼻传感器阵列的多特征数据融合优化[J].农业工程学报,2019,35(12):313-320. 被引量：4
9杨红,李丹宁,王雅洁.基于离群点检测(LOF)的K-means算法[J].通信技术,2019,52(8):1884-1888. 被引量：7
10卞莹莹,鄢海燕,邹纯才.瓜蒌缓释微丸的制备及体外释放度研究[J].国际药学研究杂志,2019,46(6):461-466. 被引量：7

1曾慧,邓小明,赵训坡,胡占义.基于线对应的单应矩阵估计及其在视觉测量中的应用[J].自动化学报,2007,33(5):449-455. 被引量：10
2范国华,曾黄麟.一种基于综合智能计算的模拟电路故障诊断方法[J].四川理工学院学报（自然科学版）,2009,22(4):94-96. 被引量：1
3范国华,曾黄麟,孙勇.一种基于综合智能计算的模拟电路故障诊断方法[J].四川理工学院学报（自然科学版）,2009,22(2):94-96. 被引量：2
4林书新.一种高效的动画生成技术[J].电视技术,2011,35(21):145-147.
5卢媛.3DGIS中可视化技术与二次开发应用研究[J].陕西师范大学学报（自然科学版）,2004,32(S1):168-170. 被引量：1
6柳小桐.BP神经网络输入层数据归一化研究[J].机械工程与自动化,2010(3):122-123. 被引量：147
7张宏亭,李学仁,孔韬.BP神经网络在缺失数据估计中的应用[J].计算机工程与设计,2007,28(14):3457-3459. 被引量：13
8蔡植善,陈木生.多传感器数据融合的火灾探测报警系统设计[J].泉州师范学院学报,2015,33(2):72-77. 被引量：2
9张立丰,胡海涛,陈德运.电容层析成像RBF神经网络图像重建算法的改进[J].哈尔滨理工大学学报,2008,13(6):5-8. 被引量：4
10顾孟钧,张志和,陈友.基于BP神经网络的国际黄金价格预测模型[J].商场现代化,2008(27):26-26. 被引量：3

山东师范大学学报（自然科学版）

2016年第4期

浏览历史

内容加载中请稍等...

SVM训练数据归一化研究被引量：56

参考文献4

二级参考文献28

共引文献12

同被引文献505

引证文献56

二级引证文献149

相关作者

相关机构

相关主题

浏览历史

SVM训练数据归一化研究 被引量：56

参考文献4

二级参考文献28

共引文献12

同被引文献505

引证文献56

二级引证文献149

相关作者

相关机构

相关主题

浏览历史

SVM训练数据归一化研究被引量：56