基于新拟牛顿方程解决分类问题被引量：2

Classification problem based on new quasi-Newton equation

下载PDF

导出

摘要逻辑回归和线性支持向量机是解决大规模分类问题的有效方法,然而它们的分布式实现问题到现在也没有得到更好的研究.近年来,由于分布式计算框架在迭代算法中低效率性的原因,一种基于内存的集群计算平台Spark已经被提出来,并正在成为应用于大规模数据处理和分析的一个普遍框架.在本研究中,使用了新拟牛顿方程用于解决逻辑回归以及线性支持向量机的问题,并且在Spark框架中进行了实现.实验表明该方法显著提高了大规模分类问题的准确性和效率. Logistic regression and linear support vector machine（SVM）are the effective method to solve the problem of large-scale classification,but there has been no better research on their distributed implementation issues up to now. In recent years,the Spark platform based on the memory has been put forward,being the common framework in the mass data processing and analysis due to the inefficient willfulness of the distributed computing framework in the iterative algorithm. In this paper,the new quasi-Newton equation is used to solve the logistic regression and linear support vector machine and realized in the Spark framework. Experiments show that this method significantly improves the accuracy and efficiency of the large-scale classification problem.

作者丁东亮于福利吴东月

机构地区天津理工大学自动化学院

出处《天津理工大学学报》 2017年第5期19-23,共5页 Journal of Tianjin University of Technology

关键词逻辑回归线性支持向量机 Spark框架新拟牛顿方程 logistic regression linear support vector machine Spark framework new quasi-Newton equation

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献6

1董新华,李瑞轩,周湾湾,王聪,薛正元,廖东杰.Hadoop系统性能优化与功能增强综述[J].计算机研究与发展,2013,50(S2):1-15. 被引量：70
2陈薇,杨昕.基于HDFS的云存储安全技术分析[J].计算机光盘软件与应用,2014,17(8):27-28. 被引量：1
3孟永伟,黄建强,曹腾飞,王晓英.Hadoop集群部署实验的设计与实现[J].实验技术与管理,2015,32(1):145-149. 被引量：20
4赵丹.一个新的拟牛顿信赖域方法[J].贵州师范大学学报（自然科学版）,2012,30(2):65-67. 被引量：2
5景书杰,于俊霞.一个新的BFGS信赖域算法[J].数学杂志,2015,35(1):131-134. 被引量：2
6陈侨安,李峰,曹越,龙明盛.基于运行数据分析的Spark任务参数优化[J].计算机工程与科学,2016,38(1):11-19. 被引量：22

二级参考文献65

1袁亚湘.信赖域方法的收敛性[J].计算数学,1994,16(3):333-346. 被引量：60
2Zhang J Z,Deng N Y,Chen L H.New quasi-Newton e-quation and related methods for unconstrained optimization[J].J Optim Theory Appl,1999,102:147-167.
3Jjmor E,Burtonsgarbo W,Kennethehillstrom.Testing un-constrained optimization software[J].ACM Trans MathSoftware,1981,7:17 -41.
4Zhuo Tang,Junqing Zhou,Kenli Li,Ruixuan Li.A MapReduce task scheduling algorithm for deadline constraints[J]. Cluster Computing . 2013 (4)
5Pengsen Cheng,Junxiu An.The Key as Dictionary Compression Method of Inverted Index Table under the Hbase Database[J]. Journal of Software . 2013 (5)
6Abhishek Verma,Brian Cho,Nicolas Zea,Indranil Gupta,Roy H. Campbell.Breaking the MapReduce stage barrier[J]. Cluster Computing . 2013 (1)
7Yingyi Bu,Bill Howe,Magdalena Balazinska,Michael D. Ernst.The HaLoop approach to large-scale iterative data analysis[J]. The VLDB Journal . 2012 (2)
8Yanfeng Zhang,Qixin Gao,Lixin Gao,Cuirong Wang.iMapReduce: A Distributed Computing Framework for Iterative Computation[J]. Journal of Grid Computing . 2012 (1)
9Zhiwei Xu,Bo Yan,Yongqiang Zou.Beyond Hadoop: Recent Directions in Data Computing for Internet Services[J]. International Journal of Cloud Applications and Computing (IJCAC) . 2011 (1)
10Carstoiu, Dorin,Lepadatu, Elena,Gaspar, Mihai.Hbase - non SQL Database, Performances Evaluation[J]. International Journal of Advancements in Computing Technology . 2010 (5)

共引文献111

1高荣贵.基于OBE-CDIO理念的《Hadoop大数据平台构建》课程“对分课堂”教学模式研究[J].内蒙古石油化工,2021,47(8):52-54. 被引量：2
2林子孟,葛欣竹,曹若麟.面向电信应急系统的Spark性能预测与参数调优方法探究[J].电信快报,2020(12):26-30. 被引量：2
3王少锋,伍少成,刘涛,邓琨,黄兵.对Hadoop的用电信息大数据计算服务应用分析[J].自动化与仪器仪表,2016(4):221-222. 被引量：6
4赵丹.预处理混合割线法求解信赖域子问题[J].淮海工学院学报（自然科学版）,2013,22(3):8-10. 被引量：1
5谢彦祥,刘天琪,苏学能.Hadoop架构下基于分布式粒子群算法的暂态稳定评估特征量选择[J].电网技术,2018,42(12):4107-4115. 被引量：7
6沈楠.云平台下电磁感应带钢稳定系统的自动化部署[J].消费电子,2014(16):171-171.
7任桂禾,王晶.浅谈大数据处理技术架构的演进[J].信息通信技术,2014,8(6):47-51. 被引量：3
8李冰利,刘钊远,贾威威.基于NBD的弹性云存储研究与设计[J].计算机与数字工程,2015,43(2):343-346. 被引量：2
9戴中华,盛鸿彬,王丽莉.基于Hadoop平台的大数据分析与处理[J].通讯世界（下半月）,2015(3):59-60. 被引量：7
10刘青,鲍爱华,倪桂强.大数据技术专题讲座(二) 第3讲面向大数据处理的MapReduce优化技术[J].军事通信技术,2015,36(2):81-87. 被引量：1

同被引文献18

1李清泉,高德荃,杨必胜.基于模糊支持向量机的城市道路交通状态分类[J].吉林大学学报（工学版）,2009,39(S2):131-134. 被引量：26
2文贵华,向君,丁月华.基于商空间粒度理论的大规模SVM分类算法[J].计算机应用研究,2008,25(8):2299-2301. 被引量：8
3马京华,王怀彬.一种基于支持向量机和主成分分析的多光谱图像的分类方法[J].天津理工大学学报,2008,24(6):55-57. 被引量：1
4王文剑,郭虎升.粒度支持向量机学习模型[J].山西大学学报（自然科学版）,2009,32(4):535-540. 被引量：9
5张文修,吴伟志.粗糙集理论介绍和研究综述[J].模糊系统与数学,2000,14(4):1-12. 被引量：234
6叶国阳,徐科军.基于色谱重叠峰相似性原理的双重叠峰分峰新方法[J].仪器仪表学报,2015,36(2):439-445. 被引量：18
7毋雪雁,王水花,张煜东.K最近邻算法理论与应用综述[J].计算机工程与应用,2017,53(21):1-7. 被引量：68
8高文清,张俊良,王艳,刘蔓,Hu JunJack,俞建成,Tang keqi.基于前后向拟合的色谱重叠峰分峰方法[J].质谱学报,2018,39(5):607-614. 被引量：5
9张鹏程,王爱民.小波特征提取和随机森林模型解析色谱重叠峰[J].测控技术,2019,38(5):31-35. 被引量：8
10黄华娟,韦修喜,周永权.基于模糊核聚类粒化的粒度支持向量机[J].智能系统学报,2019,14(6):1271-1277. 被引量：2

引证文献2

1马旭,施佳乐,张旭.恶臭气相色谱信号的分类算法研究[J].天津理工大学学报,2024,40(3):32-40.
2贾川邈,肖迎元,姜涛.粒度支持向量机研究综述[J].天津理工大学学报,2024,40(3):57-66.

1解洪胜.Linear SVM在大数据分类中的应用[J].信息技术与信息化,2017(9):81-83. 被引量：1
2徐秀梅,张晓军.几种选择性培养基检测沙门氏菌的效果比较[J].河南预防医学杂志,2017,28(10):764-766. 被引量：5
3常书娜.建构问题意识提升有效教学[J].都市家教（下半月）,2017,0(8):24-24.
4陈锦铎.夯实概念才能破解难题[J].物理教学探讨（中学教学教研版）,2017,35(10):38-40. 被引量：1
5朱向东.对一道网传题目的变式研究[J].山东教育,2017,0(7):87-88.
6唐磊.基于Ambari的Hadoop集群部署实验的设计与实现[J].信息记录材料,2017,18(11):98-101. 被引量：1
7罗永恩,胡继承,徐茜.基于超图的多模态关联特征处理方法[J].计算机工程,2017,43(1):226-230. 被引量：8
8高瞻宇,顾营迎,刘宇航,徐振邦,吴清文.采用简化Brown模型及改进BFGS法的相机自标定[J].光学精密工程,2017,25(9):2532-2540. 被引量：8
9肖生柱,覃燕琼,李姣红.AGV小车在叉车装配线物料配送中的研究与应用[J].装备制造技术,2017(7):212-213. 被引量：3
10肖强宏,周强,王莹,薛敏涛,高乐乐.一种基于敲击声时-频分析的陶瓷结构缺陷检测方法研究[J].中国陶瓷,2017,53(9):47-53. 被引量：5

天津理工大学学报

2017年第5期

浏览历史

内容加载中请稍等...

基于新拟牛顿方程解决分类问题被引量：2

参考文献6

二级参考文献65

共引文献111

同被引文献18

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于新拟牛顿方程解决分类问题 被引量：2

参考文献6

二级参考文献65

共引文献111

同被引文献18

引证文献2

相关作者

相关机构

相关主题

浏览历史

基于新拟牛顿方程解决分类问题被引量：2