面向移动终端智能的自治学习系统被引量：6

Autonomous Learning System Towards Mobile Intelligence

下载PDF

导出

摘要在移动终端设备中部署机器学习模型已成为学术界和产业界的研究热点,其中重要的一环是利用用户数据训练生成模型.然而,由于数据隐私日益得到重视,特别是随着欧洲出台GDPR、我国出台《个人信息保护法》等相关法律法规,导致开发者不能任意从用户设备中获取训练数据(特别是隐私数据),从而无法保证模型训练的质量.国内外学者针对如何在隐私数据上训练神经网络模型展开了一系列研究,对其进行了总结并指出其相应的局限性.为此,提出了一种新型的面向移动终端隐私数据的机器学习模型训练模式,将所有与用户隐私数据相关的计算任务都部署在本地终端设备,无需用户以任何形式上传数据,从而保护用户隐私.这种训练模式被为自治式学习(autonomous learning).为了解决自治式学习面临的移动终端数据量不足与计算能力不足两大挑战,设计实现了自治学习系统AutLearn,通过云(公共数据,预训练)和端(隐私数据,迁移学习)协同的思想,以及终端数据增强技术,提高了终端设备上模型的训练效果.进一步地,通过模型压缩、神经网络编译器优化、运行时缓存等一系列技术,AutLearn可以极大地优化移动终端上的模型训练计算开销.基于AutLearn在两个经典的神经网络应用场景下实现了自治式学习,实验结果表明,AutLearn可以在保护隐私数据的前提下,训练模型达到甚至超过传统的集中式/联邦式模式,并且极大地减小了在移动终端上进行模型训练的计算和能耗开销. How to efficiently deploy machine learning models on mobile devices has drawn a lot of attention in both academia and industry,among which the model training is a critical part.However,with increasingly public attention on data privacy and the recently adopted laws and regulations,it becomes harder for developers to collect training data from users and thus cannot train high-quality models.Researchers have been exploring approaches of training neural networks on decentralized data.Those efforts will be summarized and their limitations be pointed out.To this end,this work presents a novel neural network training paradigm on mobile devices,which distributes all training computations associated with private data on local devices and requires no data to be uploaded in any form.Such training paradigm autonomous learning is named.To deal with two main challenges of autonomous learning,i.e.,limited data volume and insufficient computing power available on mobile devices,the first autonomous learning system AutLearn is designed and implemented.It incorporates the cloud(public data,pre-training)—client(private data,transfer learning)cooperation methodology and data augmentation techniques to ensure the model convergence on mobile devices.Furthermore,by utilizing a series of optimization techniques such as model compression,neural network compiler,and runtime cache reuse,AutLearn can significantly reduce the on-client training cost.Two classical scenarios of autonomous learning are implemented based on AutLearn and carried out a set of experiments.The results showed that AutLearn can train the neural networks with comparable or even higher accuracy compared to traditional centralized/federated training mode with privacy preserved.AutLearn can also significantly reduce the computational and energy cost of neural network training on mobile devices.

作者徐梦炜刘渊强黄康刘譞哲黄罡 XU Meng-Wei;LIU Yuan-Qiang;HUANG Kang;LIU Xuan-Zhe;HUANG Gang(Institute of Software,School of Electronics Engineering and Computer Science,Peking University,Beijing 100871,China;Key Laboratory of High Confidence Software Technologies of Ministry of Education(Peking University),Beijing 100871,China;Linggui Tech,Beijing 100094,China)

机构地区北京大学信息科学技术学院软件研究所高可信软件技术教育部重点实验室(北京大学) 领规科技北京有限公司

出处《软件学报》 EI CSCD 北大核心 2020年第10期3004-3018,共15页 Journal of Software

基金国家杰出青年科学基金(61725201) 广东省重点领域研发计划(2020B010164002)。

关键词机器学习移动计算边缘计算分布式系统 machine learning mobile computing edge computing distributed system

分类号 TP311 [自动化与计算机技术—计算机软件与理论]

引文网络
相关文献

参考文献3

1熊平,朱天清,王晓峰.差分隐私保护及其应用[J].计算机学报,2014,37(1):101-122. 被引量：175
2雷杰,高鑫,宋杰,王兴路,宋明黎.深度网络模型压缩综述[J].软件学报,2018,29(2):251-266. 被引量：45
3庄福振,罗平,何清,史忠植.迁移学习研究进展[J].软件学报,2015,26(1):26-39. 被引量：466

二级参考文献88

1Ben-David S,Blitzer J,Crammer K,Pereira F.Analysis of representations for domain adaptation.In:Platt JC,Koller D,Singer Y,Roweis ST,eds.Proc.of the Advances in Neural Information Processing Systems 19.Cambridge:MIT Press,2007.137-144.
2Blitzer J,McDonald R,Pereira F.Domain adaptation with structural correspondence learning.In:Jurafsky D,Gaussier E,eds.Proc.of the Int’l Conf.on Empirical Methods in Natural Language Processing.Stroudsburg PA:ACL,2006.120-128.
3Dai WY,Xue GR,Yang Q,Yu Y.Co-Clustering based classification for out-of-domain documents.In:Proc.of the 13th ACM Int’l Conf.on Knowledge Discovery and Data Mining.New York:ACM Press,2007.210-219.[doi:10.1145/1281192.1281218].
4Dai WY,Xue GR,Yang Q,Yu Y.Transferring naive Bayes classifiers for text classification.In:Proc.of the 22nd Conf.on Artificial Intelligence.AAAI Press,2007.540-545.
5Liao XJ,Xue Y,Carin L.Logistic regression with an auxiliary data source.In:Proc.of the 22nd lnt*I Conf.on Machine Learning.San Francisco:Morgan Kaufmann Publishers,2005.505-512.[doi:10.1145/1102351.1102415].
6Xing DK,Dai WY,Xue GR,Yu Y.Bridged refinement for transfer learning.In:Proc.of the Ilth European Conf.on Practice of Knowledge Discovery in Databases.Berlin:Springer-Verlag,2007.324-335.[doi:10.1007/978-3-540-74976-9_31].
7Mahmud MMH.On universal transfer learning.In:Proc.of the 18th Int’l Conf.on Algorithmic Learning Theory.Sendai,2007.135-149.[doi:10,1007/978-3-540-75225-7_14].
8Samarth S,Sylvian R.Cross domain knowledge transfer using structured representations.In:Proc.of the 21st Conf.on Artificial Intelligence.AAAI Press,2006.506-511.
9Bel N,Koster CHA,Villegas M.Cross-Lingual text categorization.In:Proc.of the European Conf.on Digital Libraries.Berlin:Springer-Verlag,2003.126-139.[doi:10.1007/978-3-540-45175-4_13].
10Zhai CX,Velivelli A,Yu B.A cross-collection mixture model for comparative text mining.In:Proc.of the 10th ACM SIGKDD Int’l Conf.on Knowledge Discovery and Data Mining.New York:ACM,2004.743-748.[doi:10.1145/1014052.1014150].

共引文献681

1李坪.大数据赋权正当性证成[J].中山大学法律评论,2020(1):3-21. 被引量：1
2康文杰,田苗,林岚,孙珅,吴水才.深度卷积生成对抗网络对神经影像通用数据特征的学习[J].智慧健康,2020(31):1-4. 被引量：2
3张小玉,沈国华,杨阳.基于属性分割的差分隐私异构多属性数据发布[J].计算机系统应用,2022,31(10):225-235.
4李昱.“去识别化的个人信息”不受刑法保护吗?[J].刑事法评论,2019(1):656-692. 被引量：2
5张政,严哲,顾汉明.基于残差网络与迁移学习的断层自动识别[J].石油地球物理勘探,2020(5):950-956. 被引量：23
6董晓,刘雷,李晶,冯晓兵.面向稀疏卷积神经网络的GPU性能优化方法[J].软件学报,2020(9):2944-2964. 被引量：3
7陈曙,叶俊民,刘童.一种基于领域适配的跨项目软件缺陷预测方法[J].软件学报,2020,31(2):266-281. 被引量：15
8吴锐帆,代海洋,杨坦,江颖,蔡志杰.直肠癌淋巴结转移的智能诊断研究[J].数学建模及其应用,2019,8(4):30-37. 被引量：2
9刘世晶,刘阳春,钱程,郑浩君,周捷,张成林.基于CycleGAN和注意力增强迁移学习的小样本鱼类识别[J].农业机械学报,2023,54(S01):296-302. 被引量：3
10张璐,黄琳,李备备,陈鑫,段青玲.基于多尺度融合与无锚点YOLO v3的鱼群计数方法[J].农业机械学报,2021,52(S01):237-244. 被引量：16

同被引文献49

1麦红,钟育彬.FRP+GA在适应性学习系统中的应用[J].辽宁工程技术大学学报（自然科学版）,2020(5):459-464. 被引量：2
2张星洲,鲁思迪,施巍松.边缘智能中的协同计算技术研究[J].人工智能,2019,0(5):55-67. 被引量：32
3曹伶丽,梁振辉.基于移动终端的手术作业管理系统功能设计及实现[J].电脑知识与技术,2015,0(4):65-66. 被引量：1
4张林.基于WEB和移动设备的学生安全平台设计[J].计算技术与自动化,2016,35(3):99-104. 被引量：1
5胡莹,黄勇,陈宝玲.基于智能移动终端的教育软件用户体验设计与实现[J].计算技术与自动化,2016,35(3):132-136. 被引量：4
6李昭婷.面向移动终端的信息技术微课程教学平台的设计与应用研究[J].教育信息技术,2017(4):66-69. 被引量：1
7刘晶.基于Android平台高校业余党校移动终端软件的开发[J].辽宁师专学报（自然科学版）,2017,19(4):21-23. 被引量：1
8王晨,宋亮,李少昆.工业互联网平台:发展趋势与挑战[J].中国工程科学,2018,20(2):15-19. 被引量：72
9陈瑞.基于HTML5技术的移动学习平台设计与实现[J].信息技术与信息化,2018(6):120-122. 被引量：7
10李肯立,刘楚波.边缘智能:现状和展望[J].大数据,2019,5(3):69-75. 被引量：24

引证文献6

1黄福昌.依靠技术创新赶超世界先进水平——兖矿集团煤炭生产技术的发展方向和科研重点[J].煤矿现代化,2000(2):9-11.
2陈刘浏,倪仁杰,倪良泽.机器学习在商圈运用管理中的应用[J].海峡科技与产业,2021,34(1):40-46.
3任姚丹珺,戚正伟,管海兵,陈磊.工业互联网边缘智能发展现状与前景展望[J].中国工程科学,2021,23(2):104-111. 被引量：15
4郭峰.基于JavaScript程序的移动终端在线学习平台设计[J].信息与电脑,2021,33(4):114-116.
5张冠萍.基于VR的英语互动学习系统设计[J].信息与电脑,2022,34(16):111-113.
6胡宇飞,谢莉.面向移动终端的异常用户信息资源整合仿真[J].计算机仿真,2023,40(7):472-476.

二级引证文献15

1胡红,孔晓阳,代真虎.一种智能工厂平台运维系统的设计与实现[J].冶金自动化,2023,47(S01):489-493.
2任晓旭,仇超,邓辉,戴子明,刘泽军,王晓飞.边缘智能融合区块链:研究现状、应用及挑战[J].信息与控制,2024,53(1):1-16. 被引量：2
3王宪坤.试析工业互联网平台研究知识结构与拓展[J].新一代信息技术,2022,5(4):99-101.
4张建波,王宇,聂雪军,吴国庆,刘久军,严俊.智慧渔业时代的深远海养殖平台控制系统[J].物联网学报,2021,5(4):120-136. 被引量：3
5游小荣,顾剑柳,邓丰.工业互联网环境下边缘计算网关软件设计与实现[J].信息技术与信息化,2022(1):29-32. 被引量：1
6李凌,陈曦,沈维捷,熊汉武,蔡冉冉.面向电工装备智能监造的边缘缓存策略[J].计算机与现代化,2022(5):61-67.
7彭程晖,邓娟,吴建军,刘哲,李芳芳,刘光毅,孙韶辉,杨旸,张宏纲,李荣鹏.6G通算融合网络架构[J].无线电通信技术,2022,48(4):583-591. 被引量：3
8张敬伟,耿庆,熊汉武,陈曦,王胜,常少南.考虑电工装备数据隐私的任务卸载策略[J].电气自动化,2023,45(1):5-8.
9戴喜生,马鑫,何剑.基于工业互联网的螺蛳粉智能工厂[J].自动化与信息工程,2023,44(2):41-47.
10梁靓,魏亚星,李义鑫,贾云健.基于非线性跨代差分进化的花授粉优化算法及其应用研究[J].电子学报,2023,51(9):2445-2456.

1李涵,易园园.高校“青椒”如何成为研究型教师[J].文学少年,2020(33):0181-0181.
2王萍,陈楚寒.西南少数民族传统村落文化建档式保护模式研究——基于传统村落文化保护模式比较的视野[J].民族学刊,2020,11(4):96-102. 被引量：9
3ZHANG Xin,LONG Shaoyun.Investigating the Strategy Investment and Self-Confidence in Second Language Learning[J].US-China Foreign Language,2020,18(5):156-160.
4Ying Zhang.Possible Ways to Make Interpretation Teaching More Effective[J].Journal of Contemporary Educational Research,2020,4(7):39-42.
5荀长庆,陈照云,文梅,孙海燕,马奕民.以编译为导向的Matrix-DSP程序分析与优化[J].计算机工程与科学,2020,42(10):1791-1800. 被引量：2
6莫非.新媒体传播中的“蝴蝶效应”及其应对措施探讨[J].传播力研究,2020,4(22):48-49. 被引量：4
7卞冬夏.“互联网+”背景下高校计算机基础课程移动教学模式探究[J].电脑知识与技术,2020,16(30):134-135. 被引量：5
8薛建彬,刘星星.基于PD-BPSO算法的计算卸载策略[J].传感器与微系统,2020,39(11):103-106. 被引量：2
9王毓.网络环境下隐私权法律保护的困境与出路——以《民法典》编纂为视角[J].山东青年政治学院学报,2020,36(6):79-87. 被引量：6
10陈玉宛,贾向东,纪澎善,吕亚平.基于泊松簇过程的毫米波异构网络频谱分析[J].计算机工程,2020,46(11):194-200. 被引量：2

软件学报

2020年第10期

浏览历史

内容加载中请稍等...

面向移动终端智能的自治学习系统被引量：6

参考文献3

二级参考文献88

共引文献681

同被引文献49

引证文献6

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

面向移动终端智能的自治学习系统 被引量：6

参考文献3

二级参考文献88

共引文献681

同被引文献49

引证文献6

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

面向移动终端智能的自治学习系统被引量：6