面向机器学习的相对变换被引量：10

Relative Transformation for Machine Learning

下载PDF

导出

摘要机器学习常常面临数据稀疏和数据噪音问题.根据认知的相对性规律提出了相对变换方法,证明了相对变换是非线性的放大变换,可提高数据之间的可区分性.同时在一定条件下相对变换还能抑制噪音,并使稀疏的数据变得相对密集.通过相对变换将数据的原始空间变换到相对空间后,在相对空间中度量数据的相似性或距离更加符合人们的直觉,从而提高机器学习的性能.理论分析和实践验证了所提方法的普适性和有效性. Recently developed machine learning approaches such as manifold learning and the support vector machine learning work well on the clean data sets even if these data sets are highly folded, twisted, or curved. However, they are much sensitive to noises or outliers contained in the data set, as these noises or outliers easily distort the real topological structure of the underlying data manifold. To solve the problem, the relative transformation on the original data space is proposed by modeling the cognitive relative laws. It is proved that the relative transformation is a kind of nonlinear enlarging transformation so that it makes the transformed data more distinguishable. Meanwhile, the relative transformation can weaken the influence of noise on data and make data relative denser. To measure the similarity and distance between data points in relative space is more consistent with the intuition of people, which can be then applied to improve the machine learning approach. The relative transformation is simple, general and easy to implement. It also has clear physical meaning and does not add any parameter. The theoretical analysis and conducted experiments validate the proposed approach.

作者文贵华

机构地区华南理工大学计算机科学与工程学院

出处《计算机研究与发展》 EI CSCD 北大核心 2008年第4期612-618,共7页 Journal of Computer Research and Development

基金广东省科技攻关基金项目(2007B030803006) 教育部留学回国人员科研启动基金项目

关键词机器学习认知规律相对变换噪音数据稀疏数据 machine learning cognitive laws relative transformation noisy data sparse data

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献15

1J B Tenenbaum, V de Silva, J C Langford. A global geometric framework for nonlinear dimensionality reduction [J]. Science, 2000, 290(5500) : 2319-2323
2M Balasubramanian, E L Schwartz. The ISOMAP algorithm and topological stability [J].Science, 2002, 295(5552) : 7
3Heeyoul Choi, Seungjin Choi. Robust kernel ISOMAP [J]. Pattern Recognition, 2007, 40(3): 853-862
4王和勇,郑杰,姚正安,李磊.基于聚类和改进距离的LLE方法在数据降维中的应用[J].计算机研究与发展,2006,43(8):1485-1490. 被引量：31
5S T Roweis, L K Saul. Nonlinear dimensionality reduction by locally linear embedding [J]. Science, 2000, 290(5500): 2323 -2326
6H S Sung, D D Lee. The manifold ways of perception [J]. Science, 2000, 290(5500): 2268-2269
7李德毅,刘常昱,杜鹢,韩旭.不确定性人工智能[J].软件学报,2004,15(11):1583-1594. 被引量：405
8Wen Guihua, Jiang Lijun, Wen Jun, et al. Generating creative ideas through patents [G]. In: LNAI 4099. Berlin: Springer, 2006. 681-690
9贺玲,吴玲达,蔡益朝.高维空间中数据的相似性度量[J].数学的实践与认识,2006,36(9):189-194. 被引量：20
10Wen Guihua, Jiang Liiun, Wen Jun, et al. Performing locally linear embedding with adaptive neighborhood size on manifold [G]. In: LNAI 4099. Berlin: Springer, 2006. 985-989

二级参考文献29

1汪祖媛,庄镇泉,王煦法.逐维聚类的相似度索引算法[J].计算机研究与发展,2004,41(6):1003-1009. 被引量：5
2李德毅,刘常昱.论正态云模型的普适性[J].中国工程科学,2004,6(8):28-34. 被引量：903
3王梓坤.论混沌与随机[J].北京师范大学学报（自然科学版）,1994,30(2):199-202. 被引量：16
4李德毅,孟海军,史雪梅.隶属云和隶属云发生器[J].计算机研究与发展,1995,32(6):15-20. 被引量：1261
5I T Jolliffe. Principal Component Analysis [M]. Berlin:Springer, 1986
6B Scholkopf, A Smola, K R Muller. Nonlinear component analysis as a kernel eigenvalue problem [J]. Neural Computation, 1998, 10(5): 1299-1319
7S Mika, G Ratsch, J Weston, et al. Fisher discriminant analysis with kernels [J]. Proceedings of IEEE Neural Networks for Signal Processing Workshop, 1999, 8(9) : 41-48
8I Borg, P Groenen. Modern Multidimensional Scaling: Theory and Applications [ M ]. New York: Springer-Verlag, 1997
9T Kohonen. The self-organizing map [J]. Proceedings of the IEEE, 1990, 78(9): 1464-1480
10J B Tenenbaum, Vin de Silva, C John. A global geometric framework for nonlinear dimensionality reduction [J]. Science,2000, 290:2319-2323

共引文献504

1周雪,左忠义,程伟.基于组合赋权云模型的铁路旅客运输安全评价[J].中国安全科学学报,2020(S01):158-164. 被引量：33
2何佳蔓.基于云模型的区间直觉模糊数多属性群决策[J].计算机系统应用,2022,31(12):405-411. 被引量：4
3任海芝,杨子慧.基于正态云模型的审计重大错报风险评价研究[J].辽宁工程技术大学学报（社会科学版）,2021,23(4):280-289. 被引量：2
4程承坪.科学对民主的排斥与支持[J].科学．经济．社会,2024,42(2):73-82. 被引量：1
5张光卫,康建初,李鹤松,刘常昱,李德毅.面向场景的协同过滤推荐算法[J].系统仿真学报,2006,18(z2):595-601. 被引量：27
6胡正平.基于模糊K近邻决策的柔性SVM分类算法[J].仪器仪表学报,2005,26(z2):384-386. 被引量：2
7李学勇,高国红,孙甲霞.基于互信息和K-means聚类的信息安全风险评估[J].河南师范大学学报（自然科学版）,2011,39(2):152-155.
8于新兴,周志刚,王德广.云模型在入侵检测的应用与研究[J].微型电脑应用,2011(11):1-5. 被引量：1
9吕凤英,孙利.基于云模型的文本数字水印算法设计与实现[J].魅力中国,2009,0(22):302-303.
10莫如海.在新课标背景下对中学美术素质教育的思考[J].福建教育学院学报,2005,2(5):54-55. 被引量：2

同被引文献99

1贺敏,王丽宏,杜攀,张瑾,程学旗.基于有意义串聚类的微博热点话题发现方法[J].通信学报,2013,34(S1):256-262. 被引量：12
2张彪,邢健峰,纪志成.基于优化SVM的反渗透脱盐水故障诊断[J].系统仿真学报,2015,27(5):1057-1063. 被引量：3
3李德毅,刘常昱,杜鹢,韩旭.不确定性人工智能[J].软件学报,2004,15(11):1583-1594. 被引量：405
4唐伟,周志华.基于Bagging的选择性聚类集成[J].软件学报,2005,16(4):496-502. 被引量：95
5何力,张军平,周志华.基于放大因子和延伸方向研究流形学习算法[J].计算机学报,2005,28(12):2000-2009. 被引量：24
6董敏,刘才.板带轧机HAGC系统基于小波变换的传感器故障诊断[J].钢铁研究学报,2006,18(12):54-58. 被引量：5
7邵超,黄厚宽,赵连伟.一种更具拓扑稳定性的ISOMAP算法[J].软件学报,2007,18(4):869-877. 被引量：20
8CHAPELLE O, SCHOLKOPF B, ZIEN A. Semi-supervised learn- ing [ M]. Cambridge: MIT Press, 2006.
9ZHU X J, GOLDBERG A B. Introduction to semi-supervised learn-ing [ J]. Synthesis Lectures on Artificial Intelligence and Machine Learning, 2009, 3(1): 1-130.
10ZHOU D Y, BOUSQUET O, LAL T, et al. Learning with local and global consistency [ C]//Advances in Neural Information Processing Systems 16. Cambridge: MIT Press, 2004:321 - 328.

引证文献10

1文贵华,陆庭辉,江丽君,文军.基于相对流形的局部线性嵌入[J].软件学报,2009,20(9):2376-2386. 被引量：5
2易淼,刘小兰.基于相对变换的半监督分类算法[J].计算机应用,2011,31(10):2793-2795. 被引量：2
3石怀涛,刘建昌,张羽,李龙.基于相对变换PLS的故障检测方法[J].仪器仪表学报,2012,33(4):816-822. 被引量：23
4汪海涛,花静.基于相对变换距离的半监督分类算法[J].计算机应用与软件,2013,30(6):178-181. 被引量：2
5唐勇波,彭涛,熊印国,江风云.相对变换主元分析的变压器油击穿电压预测[J].仪器仪表学报,2015,36(7):1640-1645. 被引量：8
6唐勇波,熊印国.相对变换主元分析特征提取的变压器故障诊断[J].系统仿真学报,2018,30(3):1127-1133. 被引量：2
7熊印国.相对变换KPCA的变压器油击穿电压预测建模[J].系统仿真学报,2018,30(5):1657-1664. 被引量：1
8石怀涛,王雨桐,李颂华,刘建昌,岳国栋,孙宏辉.基于多块相对变换独立主元分析的故障诊断方法[J].控制与决策,2018,33(11):2009-2014. 被引量：1
9熊印国.相对变换KFCM的变压器油击穿电压预测[J].控制工程,2018,25(11):2035-2040. 被引量：2
10冯旭鹏,马震,谢波,刘利军,黄青松.基于聚类集成的微博话题发现方法[J].计算机工程与应用,2017,53(8):81-86.

二级引证文献42

1钱叶魁,陈鸣.因特网流量矩阵的流形结构[J].电子与信息学报,2010,32(12):2981-2986. 被引量：5
2陶剑文,王士同.L_1范局部线性嵌入[J].中国图象图形学报,2011,16(10):1802-1811. 被引量：5
3刘康,钱旭,王自强.基于流形主动学习的遥感图像分类算法[J].计算机应用,2013,33(2):326-328. 被引量：4
4严鲁明,梁华国,黄正峰.基于时-空冗余的集成电路老化失效防护方法[J].电子测量与仪器学报,2013,27(1):38-44. 被引量：10
5汪海涛,花静.基于相对变换距离的半监督分类算法[J].计算机应用与软件,2013,30(6):178-181. 被引量：2
6刘吉臻,高萌,吕游,杨婷婷.过程运行数据的稳态检测方法综述[J].仪器仪表学报,2013,34(8):1739-1748. 被引量：37
7SHI Huai-Tao,LIU Jian-Chang,XUE Peng,ZHANG Ke,WU Yu-Hou,ZHANG Li-Xiu,TAN Shuai.Improved Relative-transformation Principal Component Analysis Based on Mahalanobis Distance and Its Application for Fault Detection[J].自动化学报,2013,39(9):1533-1542. 被引量：8
8吕游,刘吉臻,杨婷婷,孙伟毅.基于PLS特征提取和LS-SVM结合的NOx排放特性建模[J].仪器仪表学报,2013,34(11):2418-2424. 被引量：59
9赵小强,薛永飞.基于核T-PLS的化工过程故障检测算法[J].化工学报,2013,64(12):4608-4614. 被引量：9
10常鹏,王普,高学金,齐咏生,张亚潮.基于统计量模式分析的MKPLS间歇过程监控与质量预报[J].仪器仪表学报,2014,35(6):1409-1416. 被引量：12

1易淼,刘小兰.基于相对变换的半监督分类算法[J].计算机应用,2011,31(10):2793-2795. 被引量：2
2唐勇波,彭涛,熊印国,江风云.相对变换主元分析的变压器油击穿电压预测[J].仪器仪表学报,2015,36(7):1640-1645. 被引量：8
3文贵华,陆庭辉,江丽君,文军.基于相对流形的局部线性嵌入[J].软件学报,2009,20(9):2376-2386. 被引量：5
4梁建武,周媛媛,施荣华.应用相对变换的无线传感器网络分簇算法[J].计算机工程与设计,2011,32(1):78-81.
5汪海涛,花静.基于相对变换距离的半监督分类算法[J].计算机应用与软件,2013,30(6):178-181. 被引量：2
6石怀涛,刘建昌,张颖伟,张羽.基于相对变换的主元分析故障诊断[J].华中科技大学学报（自然科学版）,2009,37(S1):70-73. 被引量：1
7文贵华,朱劲锋,陆庭辉.基于认知几何的支持向量机分类[J].华南理工大学学报（自然科学版）,2008,36(9):1-5. 被引量：3
8龚瑞昆.模糊控制器在线算法的改进[J].河北理工学院学报,1999,21(1):42-45. 被引量：4
9石怀涛,刘建昌,张羽,李龙.基于相对变换PLS的故障检测方法[J].仪器仪表学报,2012,33(4):816-822. 被引量：23
10张云飞,张晔.二维直方图创建的新方法实现图像自动分割[J].光电工程,2007,34(1):76-79. 被引量：5

计算机研究与发展

2008年第4期

浏览历史

内容加载中请稍等...

面向机器学习的相对变换被引量：10

参考文献15

二级参考文献29

共引文献504

同被引文献99

引证文献10

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

面向机器学习的相对变换 被引量：10

参考文献15

二级参考文献29

共引文献504

同被引文献99

引证文献10

二级引证文献42

相关作者

相关机构

相关主题

浏览历史

面向机器学习的相对变换被引量：10