面向分布式在线学习的共享数据方法被引量：2

A sharing data approach oriented to distributed online learning

导出

摘要分布式数据流已成为现代数据驱动应用产生数据的主要形式,而局部节点的数据虽然独立存储,但彼此之间是相互关联的,因此如何高效地共享局部节点数据来构建全局学习器是分布式在线学习的关键问题.针对此问题,提出一种分布式在线学习的数据共享解决方案,包括基于指数损失的半监督聚类方法和基于协方差矩阵与均值向量的数据共享方法,并证明重构数据集的累计绝对误差小于给定绝对误差界的概率下界.实验表明:所提出的方法可以使节点间的共享数据量维持在一个较低的水平,同时保证基于重构数据训练得到的学习器具有很好的泛化学习能力. Distributed data stream generated by current data-driven applications has become a main data representation.Although distributed data stream is captured from different data sources,they are correlated to a common event.Hence,the key issue of distributed online learning is how to build global learners by sharing data of local node.For this problem,this paper proposes a sharing data solution for distributed online learning,containing the semi-supervised clustering approach based on exponential loss and the sharing data approach based on covariance matrixes and mean vectors,and proves the cumulative absolute error between the rebuilding data set and the original data set is bounded on the given threshold under some probability.Experimental study demonstrates that the proposed approach has lower network traffic between nodes,and gets the learner having better generalization capability.

作者张宇刘威邵良杉 ZHANG Yu;LIU Wei;SHAO Liang-shan(College of Science,Liaoning Technical University,Fuxin 123000,China;Research Centre in Management Science,Liaoning Technical University,Huludao 125105,China)

机构地区辽宁工程技术大学理学院辽宁工程技术大学管理科学研究中心

出处《控制与决策》 EI CSCD 北大核心 2021年第8期1871-1880,共10页 Control and Decision

基金辽宁省教育厅项目(LJ2019QL016) 国家自然科学基金项目(71771111)。

关键词分布式数据流全局学习器在线学习数据共享半监督聚类数据集重构 distributed data stream global learner online learning sharing data semi-supervised clustering rebuilding data set

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献1

1张宇,包研科,邵良杉,刘威.面向分布式数据流大数据分类的多变量决策树[J].自动化学报,2018,44(6):1115-1127. 被引量：17

二级参考文献3

1包研科,赵凤华.多标度数据轮廓相似性的度量公理与计算[J].辽宁工程技术大学学报（自然科学版）,2012,31(5):797-800. 被引量：9
2孙大为,张广艳,郑纬民.大数据流式计算:关键技术及系统实例[J].软件学报,2014,25(4):839-862. 被引量：311
3毛国君,胡殿军,谢松燕.基于分布式数据流的大数据分类模型和算法[J].计算机学报,2017,40(1):161-175. 被引量：54

共引文献16

1阳晖.浅谈“大数据”时代背景下提高高职学生信息素质的对策[J].信息记录材料,2018,19(8):216-219.
2李晓峰,李东.基于SOM聚类的多模态医学图像大数据挖掘算法[J].西安工程大学学报,2019,33(4):462-467. 被引量：8
3王艳,蒋天伦.融合决策树的分布式多工厂协同生产调度方法[J].系统仿真学报,2019,31(11):2181-2197. 被引量：3
4唐雅娜,袁琛.基于邻域相似的大数据流滞后相关性挖掘仿真[J].计算机仿真,2020,37(6):318-321.
5钟章生,陈世炉,陈志龙.利用并行惯性权重OOL-FA的大数据分类[J].计算机工程与设计,2020,41(10):2818-2824.
6王金焱.分布式网络混合云数据分类捕获方法研究[J].安阳工学院学报,2020,19(6):59-62. 被引量：1
7吴增源,周彩虹,刘畅,郑素丽.基于不平衡大数据的CS-AdaBoost-DT模型在家电产品质检中的应用[J].工业工程与管理,2020,25(5):42-49. 被引量：8
8袁焦,王珣,潘兆马,杨学锋,邹文露.基于机器学习的列车设备故障预测模型研究[J].计算机与现代化,2020(12):49-54. 被引量：4
9袁智勇,肖泽坤,于力,徐全,林跃欢,李培强,何西.智能电网大数据研究综述[J].广东电力,2021,34(1):1-12. 被引量：39
10龚健虎,张跃进.深度AWB结合改进DIT的高效大数据分类[J].计算机工程与设计,2021,42(2):468-474. 被引量：2

同被引文献8

1王玉秋,初承桢.虚拟学习社区研究及其创新共进STAMP模式探索[J].科学与管理,2019,39(2):78-87. 被引量：2
2武法提,黄石华.基于多源数据融合的共享教育数据模型研究[J].电化教育研究,2020,41(5):59-65. 被引量：36
3徐嘉懿,邓雪原.面向运维阶段的多源异构BIM数据存储方法研究[J].建筑技术,2020,51(5):529-533. 被引量：15
4张杨燚,谢辉,毛进,李纲.面向城市数据画像构建的多源数据需求与融合方法研究[J].情报理论与实践,2020,43(6):88-96. 被引量：16
5梁有懿,凌捷,柳毅,赖琦.一种混合云环境下安全高效的群数据共享方法[J].计算机应用研究,2020,37(9):2789-2792. 被引量：12
6刘晶,董志红,张喆语,孙志刚,季海鹏.基于联邦增量学习的工业物联网数据共享方法[J].计算机应用,2022,42(4):1235-1243. 被引量：10
7费智涛,郭小东,王志涛.多源异构数据环境下不可移动文物灾害风险图构建方法研究[J].西北大学学报（自然科学版）,2022,52(4):700-709. 被引量：3
8吕奕静,张蓉.近十年国内外在线学习研究综述——基于CiteSpace的可视化分析[J].成人教育,2023,43(6):47-58. 被引量：4

引证文献2

1冯岩星,聂开勋,应依依.异构云计算海量多源数据在线共享方法[J].现代计算机,2023,29(5):57-60.
2张杰,肖佳琦,康孟飞,张鑫,张文馨,侯继鑫,杜海鹏,李睿.支持Web端的多场景学习模式的服务器控制方式及应用[J].中国有线电视,2023(12):35-39.

1钱红兵,李艳丽.中国人民大学数据共享中心演进之路[J].中国教育网络,2020(11):59-61. 被引量：2
2王召刚,聂凯.动机座发射条件初始参数误差对平台惯导影响评估[J].弹箭与制导学报,2020,40(5):31-34. 被引量：1
3谢磊,丁达理,魏政磊,汤安迪,张鹏.AdaBoost-PSO-LSTM网络实时预测机动轨迹[J].系统工程与电子技术,2021,43(6):1651-1658. 被引量：7
4周天墨,陈佳林.区块链技术驱动的安全生产应急管理系统设计研究[J].电脑知识与技术,2021,17(20):95-97. 被引量：3
5尹春勇,张帼杰.面向分布式漂移数据流的集成分类模型[J].计算机应用,2021,41(7):1947-1955. 被引量：5
6李芙蓉,易映萍,石伟.基于边缘计算的主动配电网配电大数据技术[J].软件导刊,2021,20(8):160-165. 被引量：2
7吴佳莹,张晓瑜,苗星星.移动群智感知中基于用户意愿的多任务分配模型[J].计算机科学与应用,2021,11(7):1941-1948.
8黄瑞,余敏琪,刘奕玹,夏向阳,周纲,刘谋海.基于Karrenbauer相模变换的低压供电线路阻抗量测方法[J].湖南大学学报（自然科学版）,2021,48(8):90-95. 被引量：2

控制与决策

2021年第8期

浏览历史

内容加载中请稍等...

面向分布式在线学习的共享数据方法被引量：2

参考文献1

二级参考文献3

共引文献16

同被引文献8

引证文献2

相关作者

相关机构

相关主题

浏览历史

面向分布式在线学习的共享数据方法 被引量：2

参考文献1

二级参考文献3

共引文献16

同被引文献8

引证文献2

相关作者

相关机构

相关主题

浏览历史

面向分布式在线学习的共享数据方法被引量：2