自优化转导支持向量机并行化被引量：1

Parallelization of self-optimization transductive SVM

下载PDF

导出

摘要针对自优化转导支持向量机(So TSVM)无法高效处理大规模训练数据的问题,为了将其拓展到海量数据处理领域同时缩短So TSVM算法运行时间,提出了一种基于消息传输接口(MPI)的并行化So TSVM算法。首先,通过分析So TSVM串行算法得到具有高耗时的预测可信度判定模块;其次,进一步将该模块划分成相互独立的距离计算和可信度判定子模块;最后,通过MPI将距离计算模块中每个计算任务按轮流分配的方式分配给进程处理,同时用并行化排序算法处理可信度判定模块来达到算法并行化。通过仿真实验证明So TSVM并行算法相比串行算法缩短了90%的运行时间,同时程序的并行效率在0.8以上,因此可以将So TSVM并行算法应用在具有海量数据的半监督学习分类中。 Since the Self-optimization Transductive SVM（ So TSVM） algorithm cannot efficiently process large scale data,the parallelization based on MPI（ Message-Passing Interface） was proposed to apply the algorithm to big data processing, and shorten the program running time. Firstly, the major time-consuming module was obtained by the analysis of serial algorithm;secondly, this module was divided into independent sub-modules including distance calculation and confidence determination;Finally, each task of distance calculation module was alternately assigned to the process through MPI, and parallel sorting was employed to confidence determination for algorithm parallelization. Simulation results show that the parallel algorithm can save more than 90% running time compared with the serial algorithm and keep the parallel efficiency above 0. 8. Therefore, it is suitable to utilize the parallel So TSVM for semi-supervised learning classification on massive data.

作者王海涛谢江张武

机构地区上海大学计算机工程与科学学院

出处《计算机应用》 CSCD 北大核心 2017年第A02期27-31,56,共6页 journal of Computer Applications

基金国家重点研发计划项目(2017YFB0701501) 上海市自然科学基金资助项目(17ZR1409900)

关键词半监督学习支持向量机机器学习并行化分类 semi-supervised learning Support Vector Machine （SVM） machine learning parallelization classification

分类号 TP301.6 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献2

1梁吉业,高嘉伟,常瑜.半监督学习研究进展[J].山西大学学报（自然科学版）,2009,32(4):528-534. 被引量：32
2刘建伟,刘媛,罗雄麟.半监督学习方法[J].计算机学报,2015,38(8):1592-1617. 被引量：134

二级参考文献16

1苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：389
2李和平,胡占义,吴毅红,吴福朝.基于半监督学习的行为建模与异常检测[J].软件学报,2007,18(3):527-537. 被引量：30
3郑海清,林琛,牛军钰.一种基于紧密度的半监督文本分类方法[J].中文信息学报,2007,21(3):54-60. 被引量：11
4杨剑,王珏,钟宁.流形上的Laplacian半监督回归[J].计算机研究与发展,2007,44(7):1121-1127. 被引量：15
5邓超,郭茂祖.基于Tri-Training和数据剪辑的半监督聚类算法[J].软件学报,2008,19(3):663-673. 被引量：30
6门昌骞,王文剑.一种基于多学习器标记的半监督SVM学习方法[J].广西师范大学学报（自然科学版）,2008,26(1):186-189. 被引量：9
7罗晓清,王士同.基于双近邻测度的半监督聚类方法[J].计算机应用与软件,2008,25(4):219-220. 被引量：2
8张亮,李敏强.半监督聚类中基于密度的约束扩展方法[J].计算机工程,2008,34(10):13-15. 被引量：7
9尹学松,胡思良,陈松灿.基于成对约束的判别型半监督聚类分析[J].软件学报,2008,19(11):2791-2802. 被引量：51
10肖宇,于剑.基于近邻传播算法的半监督聚类[J].软件学报,2008,19(11):2803-2813. 被引量：165

共引文献162

1麻瓯勃,刘雪娇,唐旭栋,周宇轩,胡亦承.基于半监督学习的恶意URL检测方法[J].计算机系统应用,2020(11):11-20. 被引量：4
2刘蓉.半监督学习的Co-training算法研究[J].电脑编程技巧与维护,2010(14):4-5. 被引量：1
3梁军,陈龙,周卫琪,陶文倩,姚明,胥正川.基于马尔科夫随机场和鲁棒误差函数的半监督分类研究[J].山东大学学报（理学版）,2010,45(11):1-4.
4姚林朋,王辉,钱勇,黄成军,郑文栋,江秀臣.基于半监督学习的XLPE电缆局部放电模式识别研究[J].电力系统保护与控制,2011,39(14):40-46. 被引量：19
5黄霜明,谢丽聪.协同训练半监督学习二次伪迭代算法[J].广西师范大学学报（自然科学版）,2011,29(3):110-114.
6陈康,向勇,喻超.大数据时代机器学习的新趋势[J].电信科学,2012,28(12):88-95. 被引量：37
7郭涛,李贵洋,兰霞.基于图的半监督协同训练算法[J].计算机工程,2012,38(13):163-165. 被引量：5
8王岩,于明,翟玉欣,陈冀川.加权成对约束半监督局部维数约减算法[J].计算机工程与设计,2013,34(4):1302-1306. 被引量：2
9张雁,吕丹桔,吴保国.基于Tri-Training半监督分类算法的研究[J].计算机技术与发展,2013,23(7):77-79. 被引量：9
10闫祖臣,李永忠.基于属性约简与半监督协同训练的入侵检测算法[J].计算机应用与软件,2013,30(8):120-122. 被引量：1

同被引文献11

1于艳艳,黄倩,王磊,杨军,赵征鹏.基于FPGA的动态优先轮询策略在Ad Hoc网络数据采集系统中的研究与应用[J].云南大学学报（自然科学版）,2014,36(1):16-20. 被引量：10
2余东平,张剑峰,王聪,李宁.多路并行传输中数据调度算法的优化[J].计算机应用,2014,34(5):1227-1231. 被引量：9
3杨志军,丁洪伟,陈传龙.完全服务和门限服务两级轮询系统E(x)特性分析[J].电子学报,2014,42(4):774-778. 被引量：21
4赵继军,谷志群,薛亮,李志华,关新平.WSN中层次型拓扑控制与网络资源配置联合设计方法[J].自动化学报,2015,41(3):646-660. 被引量：19
5张顺淼,黄德根.基于概率母函数的无线传感器网络功率控制研究[J].小型微型计算机系统,2015,36(4):739-743. 被引量：1
6余淼,胡占义.高阶马尔科夫随机场及其在场景理解中的应用[J].自动化学报,2015,41(7):1213-1234. 被引量：23
7黄业文,邝神芬,杨荣领,杨春侠.非强占有限优先权M/G/1排队系统[J].计算机应用,2016,36(7):1779-1783. 被引量：6
8李佳佳,刘晓静,刘向宇,夏秀峰,朱睿.基于动态选择启发值的改进TD-FTT算法[J].计算机应用,2018,38(1):120-125. 被引量：1
9鲁亮,于炯,卞琛,英昌甜,师康利,蒲勇霖.Storm环境下基于权重的任务调度算法[J].计算机应用,2018,38(3):699-706. 被引量：15
10孙洋洋,杨志军.依据站点状态的完全服务轮询控制系统[J].云南师范大学学报（自然科学版）,2018,38(4):31-35. 被引量：4

引证文献1

1杨志军,孙洋洋.区分站点状态的两级轮询控制系统[J].计算机应用,2019,39(5):1416-1420. 被引量：2

二级引证文献2

1包晓安,聂凡杰,徐璐,张娜,吴彪.基于Reactor与非阻塞IO的服务端框架设计与实现[J].浙江理工大学学报（自然科学版）,2020,43(4):520-526. 被引量：3
2杨志军,寇倩兰,丁洪伟.适应于WSN的具有差错重传的轮询服务性能研究[J].现代电子技术,2022,45(9):13-20. 被引量：1

1弓雪茹,朱冬梅,曹玉琴.护理干预改善1型糖尿病患儿治疗依从性的效果分析[J].疾病监测与控制,2017,11(12):1024-1025. 被引量：2
2罗建华.基于改进提升模型的视频目标跟踪算法[J].计算机应用与软件,2018,35(1):261-263. 被引量：5
3汤利民.《大数据网优平台应用专题》序[J].电信工程技术与标准化,2017,30(11):71-71.
4邢翀.云框架下的文本挖掘算法并行化研究[J].设备管理与维修,2017(19):43-44.
5熊伟丽,薛明晨,李妍君.基于EM算法的半监督局部加权PLS在线建模方法[J].系统仿真学报,2018,30(1):8-17. 被引量：3
6冯磊,周伟,王彦佐,刘若溪.基于时间金字塔模型的国产资源卫星数据统计分析[J].国土资源遥感,2017,29(B10):171-174. 被引量：2
7吕佳,黎隽男.结合半监督聚类和数据剪辑的自训练方法[J].计算机应用,2018,38(1):110-115. 被引量：6
8李秋妮,杨任农,李浩亮,张欢,冯超.非合作博弈的多机协同压制IADS攻防策略分析[J].西安电子科技大学学报,2017,44(6):129-137. 被引量：2
9赵才文.消息驱动的机器学习微服务架构探析[J].电脑编程技巧与维护,2017(24):68-69. 被引量：2
10骆文亮.基于异步消息处理的RabbitMQ运行原理探讨[J].数码世界,2017,0(11):400-400. 被引量：4

计算机应用

2017年第A02期

浏览历史

内容加载中请稍等...

自优化转导支持向量机并行化被引量：1

参考文献2

二级参考文献16

共引文献162

同被引文献11

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

自优化转导支持向量机并行化 被引量：1

参考文献2

二级参考文献16

共引文献162

同被引文献11

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

自优化转导支持向量机并行化被引量：1