一种块增量偏最小二乘算法被引量：3

A chunk increment partial least square algorithm

导出

摘要增量学习模型是一种有效挖掘大规模数据的数据处理技术。增量式偏最小二乘(incremental partial least square, IPLS)模型是一种基于增量技术的偏最小二乘算法改进模型,具有不错的数据降维效果,但是,IPLS模型每新增1个样本都需要对模型进行增量更新,导致模型的训练时间较长。针对这一问题,基于数据分块更新的思想提出了一种块增量偏最小二乘算法(chunk incremental partial least square, CIPLS)。CIPLS算法将样本数据划分为数个的数据块(chunk),然后再以数据块为单位对模型进行增量更新,从而大幅减少了模型的更新频率,提高了模型的学习效率。在K8版本的p53蛋白数据集和路透文本分类语料库上的对比实验表明,CIPLS算法大幅度缩短了增量式偏最小二乘模型的训练时间。 For the data mining of large-scale data, incremental learning is an effective and efficient technique. As an improved partial least square(PLS) method based on incremental learning, incremental partial least square(IPLS) has a competitive dimension reduction performance. However, there is a drawback in this approach that training samples must be learned one by one, which consumes a lot of time on the issue of on-line learning. To overcome this problem, we propose an extension of IPLS called chunk incremental partial least square(CIPLS) in which a chunk of training samples is processed at a time. Comparative experiments on k8 cancer rescue mutants data set and Reuter-21578 text classification corpus show the proposed CIPLS algorithm is much more efficient than IPLS without sacrifice dimension reduction performance.

作者曾雪强叶震麟左家莉万中英吴水秀 ZENG Xue-qiang;YE Zhen-lin;ZUO Jia-li;WAN Zhong-ying;WU Shui-xiu(Information Engineering School, Nanchang University, Nanchang 330031, Jiangxi, China;School of Computer & Information Engineering, Jiangxi Normal University, Nanchang 330022, Jiangxi, China)

机构地区南昌大学信息工程学院江西师范大学计算机信息工程学院

出处《山东大学学报（理学版）》 CAS CSCD 北大核心 2019年第3期93-101,共9页 Journal of Shandong University(Natural Science)

基金国家自然科学基金资助项目(61463033 61866017) 江西省杰出青年人才资助计划(20171BCB23013) 江西省教育厅科学技术研究项目(GJJ150354)

关键词增量学习偏最小二乘数据块数据降维 incremental learning partial least square data chunk dimension reduction

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1李雪,蒋树强.智能交互的物体识别增量学习技术综述[J].智能系统学报,2017,12(2):140-149. 被引量：5
2卜范玉,陈志奎,张清辰.支持增量式更新的大数据特征学习模型[J].计算机工程与应用,2015,51(12):21-26. 被引量：7
3曾雪强,赵丙娟,向润,李岚.基于偏最小二乘的人脸年龄估计[J].南昌大学学报（工科版）,2017,39(4):380-385. 被引量：3

二级参考文献25

1Wu Xindong,Zhu Xingquan, Wu Gongqing, et al.Data mining with big data[J].IEEE Transactions on Knowledge and Data Engineering, 2014,26 ( 1 ) : 97-107.
2Zhang Qingchen, Chen Zhikui.A weighted kernel possi- bilistic c-means algorithm based on cloud computing for clustering big data[J].International Journal of Communi- cation Systems,2014,27(9) : 1378-1391.
3Chen Xuewen,Lin Xiaotong.Big data deep learning:chal- lenges and perspectives[J].IEEE Access, 2014,2 : 514-525.
4Hinton G E,Salakhutdinov R R.Reducing the dimension- ality of data with neural networks[J].Science, 2006,313 (5786) : 504-507.
5Bengio Y, Courville A,Vincent P.Representation learning: a review and new perspectives[J].IEEE Transactions on Pattern Analysis and Machine Intelligence,2013,35(8): 1798-1828.
6Liang N, Huang G, Saratchandran P, et al.A fast and accu- rate online sequential learning algorithm for feed-forward networks[J].IEEE Transactions on Neural Networks,2006, 17(6) : 1411-1423.
7Li Guang,Na Jing, Stoten D P, et al.Adaptive neural network feed-forward control for dynamically sub-struc- tured systems[J].IEEE Transactions on Control Systems Technology, 2014,22(3 ) : 944-954.
8Rumelhart D E,Hinton G E,Willian R J.Learning rep- resentations of back-propagation errors[J].Nature, 1986, 323.
9Schraudolph N N.Fast curvature matrix-vector products for second order gradient descent[J].Neural Computation, 2012,14(7).
10Cheng W, Juang C.A fuzzy model with online incre- mental SVM and margin-selective gradient descent learn- ing for classification problems[J].IEEE Transactions on Fuzzy Systems,2014,22(2) :324-337.

共引文献12

1杨丽萍.基于半结构特征分割的Web数据挖掘算法[J].微电子学与计算机,2015,32(8):154-157.
2龚健虎.引入深度遍历机制的分布式数据结构插值算法[J].微电子学与计算机,2016,33(6):157-160. 被引量：2
3叶卫华.多模态神经网络在复杂大数据特征学习中的应用[J].电子技术与软件工程,2018(11):178-179.
4黄伟楠,朱秋煜,王越,王嘉扬.基于典型样本的卷积神经网络增量学习研究[J].电子测量技术,2018,41(6):76-80. 被引量：3
5曾雪强,罗明珠,陈素芬,吴水秀,万中英.基于自适应多重多元回归的人脸年龄估计[J].江西师范大学学报（自然科学版）,2019,43(1):68-75. 被引量：8
6夏淑洁,杨朝阳,李灿东.智能化中医“治未病”健康管理模式探析[J].中华中医药杂志,2019,34(11):5007-5010. 被引量：30
7蓝燕.基于文本语义的SA-LDA增量爬取图书选择与推介[J].惠州学院学报,2020,40(3):71-75.
8周琴英,杨文正.推荐系统用户模型的研究热点及启示——基于近十年核心文献的知识图谱分析[J].情报科学,2020,38(9):166-173. 被引量：10
9赵萌.基于增量学习的图书文本分类方法[J].情报探索,2021(7):52-56. 被引量：3
10刘庆华,李智.一种基于HOG与LBP双特征融合模型的人脸年龄估计方法[J].江苏科技大学学报（自然科学版）,2021,35(3):50-55. 被引量：5

同被引文献15

1宗德才,王康康.一种混合局部搜索算法的遗传算法求解旅行商问题[J].计算机应用与软件,2015,32(3):266-270. 被引量：8
2胡金扣,邢红杰.鲁棒的光滑支持向量机[J].计算机科学,2015,42(10):235-238. 被引量：1
3刘季,陈秀宏,杭文龙.面向大规模数据的快速多代表点仿射传播算法[J].计算机科学与探索,2016,10(2):268-276. 被引量：1
4祝之友.《神农本草经》临床药学八原则[J].中国中医药现代远程教育,2018,16(10):114-114. 被引量：1
5孔祥玉,曹泽豪,安秋生,徐中英,罗家宇.偏最小二乘线性模型及其非线性动态扩展模型综述[J].控制与决策,2018,33(9):1537-1548. 被引量：19
6宋彦,武峥,罗川,景英川.基于加权支持向量机的多分类概率估计[J].统计与决策,2019,0(21):26-30. 被引量：7
7何云斌,董恒,万静,李松.基于密度峰值和近邻优化的聚类算法[J].计算机科学与探索,2020,14(4):554-565. 被引量：7
8夏鹏飞,马肖,杨蕊菁,王玉,王玉霞,杨飞霞,赵磊.甘肃不同产地黄管秦艽质量与气候因子的相关性[J].国际药学研究杂志,2020,47(1):51-56. 被引量：2
9曹杰,顾斌杰,熊伟丽,潘丰.增量式约简最小二乘孪生支持向量回归机[J].计算机科学与探索,2021,15(3):553-563. 被引量：6
10郭星晨,王青青,王亚.C4.5决策树算法在医疗数据分类中的应用研究[J].安庆师范大学学报（自然科学版）,2021,27(2):49-53. 被引量：5

引证文献3

1潘玉,陈晓红,李舜酩,李纪永.块增量典型相关分析[J].计算机科学与探索,2022,16(8):1809-1818. 被引量：1
2高振斌,秦轩.基于PLS-GA-SVR的区域经济预测模型及实证[J].统计与决策,2022(18):54-57. 被引量：5
3杨友,包彩银,丁跃武,李四海.基于回归算法与决策树思想的秦艽产地划分[J].亚太传统医药,2023,19(2):41-45.

二级引证文献6

1邓阳,董洪光.新冠疫情对江苏省经济发展的影响研究[J].中国商论,2022(24):18-20. 被引量：1
2李文平,朱荷蕾.面向群智感知隐私保护的联邦典型相关分析方法[J].系统科学与数学,2022,42(11):2859-2873.
3徐熊飞,周晓华,杨艺兴.改进CS优化支持向量回归的汽车热舒适性预测[J].自动化与仪表,2023,38(6):5-9.
4刘丽青,陈琦,王祥.经济运行预警预测系统设计[J].黑龙江工业学院学报（综合版）,2023,23(9):51-58.
5李佳颖,吴迪.基于元学习优化随机森林算法的区域经济预测[J].南通职业大学学报,2023,37(4):80-85.
6党世红,于东伟,李明辉.置换蒸煮终点Kappa值软测量的设计与实现[J].中国造纸学报,2024,39(1):100-106.

1乔东平,裴杰,肖艳秋,周坤.蚁群算法及其应用综述[J].软件导刊,2017,16(12):217-221. 被引量：29
2买书魁,吴镇君,陈红光,张福艳,李子文,李宗朋,王琼雅,尹建军,王健.基于近红外光谱技术的白酒原酒中关键成分的定量分析[J].食品与发酵工业,2018,44(11):280-285. 被引量：16
3贾秀娟.基于随机森林的支持向量机量化选股[J].区域金融研究,2019(1):27-30. 被引量：4
4陈潇潇,蔡迎归.云环境下基于Apriori算法的水政执法数据关联规则分析研究[J].科技经济导刊,2017(25):23-23.
5吴芳,李映雪,张缘园,张雪红,邹晓晨.基于机器学习算法的冬小麦不同生育时期生物量高光谱估算[J].麦类作物学报,2019,39(2):217-224. 被引量：15
6王文娟,李凤敏.核定位蛋白的结构域特征分析[J].内蒙古大学学报（自然科学版）,2018,49(1):70-76. 被引量：3
7丁丹丹,陈靖森,费加罗,佟骏超,潘志庚,姚争为.多特征增量学习的视频重建图像质量增强算法[J].华南理工大学学报（自然科学版）,2018,46(12):42-50. 被引量：1
8叶茂,刘文芬.一种适用于大规模数据的约束谱聚类框架[J].信息工程大学学报,2018,19(4):480-487.
9李旭,王士同.原信息与映射信息组合的多核学习降维方法[J].计算机科学与探索,2019,13(2):310-321. 被引量：3
10程豪,易丹辉.基于分位回归的偏最小二乘算法的应用[J].统计与决策,2019,35(2):17-19. 被引量：1

山东大学学报（理学版）

2019年第3期

浏览历史

内容加载中请稍等...

一种块增量偏最小二乘算法被引量：3

参考文献3

二级参考文献25

共引文献12

同被引文献15

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

一种块增量偏最小二乘算法 被引量：3

参考文献3

二级参考文献25

共引文献12

同被引文献15

引证文献3

二级引证文献6

相关作者

相关机构

相关主题

浏览历史

一种块增量偏最小二乘算法被引量：3