基于逻辑回归算法的乳腺癌诊断数据分类研究被引量：5

Research on Classification of Diagnosis Data of Breast Cancer Based on Logistic Regression Algorithm

下载PDF

导出

摘要乳腺癌是世界范围内妇女死亡的主要原因之一,准确的诊断是乳腺癌治疗中最重要的步骤之一。本文详细讲解了逻辑回归模型的原理知识,结合Sklearn机器学习库的Logistic Regression算法对乳腺癌威斯康辛(诊断)数据集进行了数据分类。由于该数据集分类标签划分为两类(恶性、良性),能够很好地适用于逻辑回归模型。用基于两个特征的逻辑回归模型得到的分类结果表明,当选取平均半径和最大周长两个特征时,分类精度最高(95.72%)。与以往的方法相比,该方法在性能上有所提高。 Breast cancer is one of the major causes of death for women worldwide,and accurate diagnosis is one of the most important steps in the treatment of breast cancer.This paper explains the knowledge of the logistic regression model in detail,and classifies the data set of breast cancer by using the Logistic Regression algorithm of Sklearn machine learning library.The classification label of the data set is divided into 2 classes(malignant and benign),which is appropriate for the logistic regression model.The classification results based on the logistic regression model with two features show that the classification accuracy is the highest(95.72%)when the two characteristics of the mean radius and the largest perimeter are selected.In comparison to previous methods,the performance has been improved to some extent.

作者刘蕾 LIU Lei(Dalian Neusoft Information University,Dalian 116023,China)

机构地区大连东软信息学院

出处《软件工程》 2018年第2期21-23,17,共4页 Software Engineering

关键词乳腺癌数据集逻辑回归分类算法预测 breast cancer data set logistic regression classification algorithm prediction

分类号 TP393 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1毛林,陆全华,程涛.基于高维数据的集成逻辑回归分类算法的研究与应用[J].科技通报,2013,29(12):64-66. 被引量：8
2谢忠红,张颖,张琳.基于逻辑回归算法的微博水军识别[J].微型机与应用,2017,36(16):67-69. 被引量：6

二级参考文献17

1韩忠明,许峰敏,段大高.面向微博的概率图水军识别模型[J].计算机研究与发展,2013,50(S2):180-186. 被引量：10
2Menard, Scott.Applied logistic regression nalysis. Vol. 106 [M]. Sage Publications, Incorporated, 2001.
3Breiman,Leo.Random forests[J].Machine earning,2001,45 (1): 5-32.
4Liu, Yong, and Xin Yao. Ensemble learning via negative correlation[J].Neural Networks,1999,12 (10): 1399-1404.
5杜翠红,李晓峰,简冲.SVC在无线信道传输中的非均衡差错保护[J].电子技术应用,2010,36(8):130-133. 被引量：1
6方洁,龚立群,魏疆.基于利益相关者理论的微博舆情中的用户分类研究[J].情报科学,2014,32(1):18-22. 被引量：22
7王越,张剑金.一种应用SAVBP神经网络的僵尸粉判别方法[J].重庆理工大学学报（自然科学）,2014,28(4):72-76. 被引量：3
8莫倩,杨珂.网络水军识别研究[J].软件学报,2014,25(7):1505-1526. 被引量：56
9张良,朱湘,李爱平,王志华,鲁鹏.一种基于逻辑回归算法的水军识别方法[J].信息安全与技术,2015,6(4):57-62. 被引量：10
10陶永才,王晓慧,石磊,卫琳,曹仰杰.基于用户粉丝聚类现象的微博僵尸用户检测[J].小型微型计算机系统,2015,36(5):1007-1011. 被引量：8

共引文献12

1王青,谭良.基于用户主题精确感知大数据群体计算任务分配算法[J].计算机应用,2016,36(10):2777-2783. 被引量：6
2梁平,陈艳芬.基于Logistic回归分析的中药注射剂不良反应预测研究[J].中国民族民间医药,2016,25(22):115-119. 被引量：1
3汤坚,杨骥,宫煦利.面向电网巡检的多旋翼无人机航测系统关键技术研究及应用[J].测绘通报,2017(5):67-70. 被引量：27
4刘姝雯,徐扬,王冰璐,高铭,邓佳琪.基于用户表示学习的微博水军识别研究[J].情报杂志,2018,37(7):95-100. 被引量：7
5王淑琪,王未央.基于支持向量机的微博水军账号识别[J].现代计算机,2018,24(6):27-31. 被引量：3
6张伟,陈建峡,李超,黄煜俊,徐欣雨.输电线路故障分析多分类模型研究及应用[J].湖北工业大学学报,2019,34(2):5-9. 被引量：1
7张雷,崔嘉欣,韩美蓉,郑鹏垒.基于逻辑回归的大学生生活质量评价模型研究[J].运城学院学报,2019,37(3):59-63. 被引量：1
8杨昊,吴爱华,屈青英.一种基于深度神经网络的水军识别模型[J].现代计算机,2019,25(18):24-29. 被引量：3
9沈飞,陈超,徐佳文,严如强.谱质心迁移在变工况轴承故障诊断的应用[J].仪器仪表学报,2019,40(5):99-108. 被引量：10
10邓煜,李明,周稻祥.基于两阶段随机森林的螺丝锁附结果判别研究[J].太原理工大学学报,2020,51(2):198-205. 被引量：2

同被引文献19

1王惠文,孟洁.多元线性回归的预测建模方法[J].北京航空航天大学学报,2007,33(4):500-504. 被引量：241
2胡小生,张润晶,钟勇.基于聚类分析的改进堆叠算法[J].计算机与数字工程,2013,41(11):1725-1728. 被引量：1
3朱孟星,孔薇,牟晓阳.基于互信息分析系统性红斑狼疮与乳腺癌的发病机理[J].基因组学与应用生物学,2016,35(5):1071-1080. 被引量：1
4谢忠红,张颖,张琳.基于逻辑回归算法的微博水军识别[J].微型机与应用,2017,36(16):67-69. 被引量：6
5侯爱华,高伟,汪霖.基于逻辑回归模型的流量异常检测方法研究[J].工程数学学报,2017,34(5):479-489. 被引量：17
6王楠楠.新媒体对大学生价值观的影响[J].现代教育科学,2018(4):28-33. 被引量：4
7金海月.逻辑斯蒂回归模型在电信领域中的应用[J].沈阳理工大学学报,2018,37(2):34-38. 被引量：4
8赵可扬,杨沐月,朱静妤,王泽淇,沈炜炜.机器学习辅助肿瘤诊断[J].肿瘤,2018,38(10):987-991. 被引量：4
9桂州,陈建国,王成彬.基于GEP-逻辑回归的地质异常信息分类预测——以东天山地区化探数据为例[J].桂林理工大学学报,2018,38(1):34-40. 被引量：3
10沈倩倩,邵峰晶,孙仁诚.基于XGBoost的乳腺癌预测模型[J].青岛大学学报（自然科学版）,2019,32(1):95-100. 被引量：14

引证文献5

1张雷,崔嘉欣,韩美蓉,郑鹏垒.基于逻辑回归的大学生生活质量评价模型研究[J].运城学院学报,2019,37(3):59-63. 被引量：1
2岳鹏,侯凌燕,杨大利,佟强.基于XGBoost特征选择的疾病诊断XLC-Stacking方法[J].计算机工程与应用,2020,56(17):136-141. 被引量：19
3常鈺迪.基于稀疏逻辑回归的链接模型在分类问题的应用[J].软件工程,2021,24(6):2-5. 被引量：2
4郑明钊,张建强,王方旭,马福坛,宋国兴.基于回归分析的软件研发项目生产效率模型[J].信息技术与信息化,2021(5):136-137.
5任志伟,王玉德,陈婷.基于深度随机森林的新型组合分类算法[J].通信技术,2021,54(12):2614-2620.

二级引证文献22

1赵珂雨,陈婉莹.一种基于stacking集成学习的DGA域名检测方法[J].数据通信,2020(6):19-24.
2汤怀.基于逻辑回归模型的校园个性化学习资源推荐系统[J].电子技术与软件工程,2019,0(22):164-165. 被引量：2
3王晓晖,张亮,李俊清,孙玉翠,田捷,韩睿毅.基于遗传算法与随机森林的XGBoost改进方法研究[J].计算机科学,2020,47(S02):454-458. 被引量：29
4龚奎,孙宇.基于增益统计的XGBoost提升方法研究[J].电子技术与软件工程,2021(11):154-157.
5王娟,赵吉祥,单春芝,高晓慧.基于集成学习的海岸带变化检测方法研究[J].海洋开发与管理,2021,38(7):48-54. 被引量：1
6李春雷,王文生,郭雷风,陈桂鹏.基于集成学习算法的返贫人口识别模型--以H省F县贫困户建档立卡数据为例[J].江苏农业科学,2021,49(17):231-237. 被引量：3
7封晓斌,徐明江,汤易兵,吴增源.基于Stacking多模型融合的工业产品质量预测[J].数学的实践与认识,2021,51(22):267-276. 被引量：2
8曹立源,范勤勤,黄敬英.基于特征选择和XGBoost优化的术中低体温预测[J].数据采集与处理,2022,37(1):134-146. 被引量：12
9蒋文萍,蒋珍存,董正心.基于XGBoost的心力衰竭死亡风险评价模型及其应用[J].现代电子技术,2022,45(8):155-158. 被引量：3
10李雪松,李劲华,吕智涵.基于改进深度残差收缩网络的轴承故障诊断[J].青岛大学学报（自然科学版）,2022,35(2):38-43. 被引量：3

1高忠媛.榄香烯同步放疗治疗宫颈癌不良反应的临床研究[J].国际肿瘤学杂志,2017,44(8):638-639. 被引量：2
2程晖.核磁共振和乳腺钼靶对早期乳腺癌诊断对比[J].影像研究与医学应用,2017,1(10):188-189. 被引量：1
3安顺,鲁清月,李振红,杜美.HPV检测方法及其在宫颈癌筛查中应用的研究进展[J].临床检验杂志（电子版）,2017,6(4):809-810. 被引量：9
4史宝鹏,段迅,孔广黔,吴云.应用分类模型研究迟发性颅脑损伤的影响因素[J].计算机技术与发展,2018,28(3):201-204. 被引量：1
5王雪梅,张华东,王小皙,邓华欣,金楠,邱翠娟.2015年重庆市噪声职业危害行业分析[J].职业卫生与病伤,2017,32(4):199-202. 被引量：11
6Günay Y1ld1zer,Emre Bilgin,Ezel Nur Korur,Dario Novak,GIyasettin Demirhan.The association of various social capital indicators and physical activity participation among Turkish adolescents[J].Journal of Sport and Health Science,2018,7(1):27-33.
7李一,蔡礼渊.ATM交易状态特征分析与异常检测[J].成都工业学院学报,2018,21(1):50-57. 被引量：2
8郭姝彦,刘瑞雅,吕家富,鲁勇兵.数模视角下“拍照赚钱”任务定价的分析与探讨——以广州、佛山、东莞和深圳为例[J].商讯（公司金融）,2017,0(20):61-62.
9张倩文,刘怡,刘梦彧.思维可视化工具教学应用研究新进展[J].教育信息技术,2018(1):103-107. 被引量：4
10王凤丽,闫海利.血清βHCG、孕酮及雌二醇对宫外孕的诊断意义[J].现代医学与健康研究电子杂志,2017,1(7):69-69. 被引量：2

软件工程

2018年第2期

浏览历史

内容加载中请稍等...

基于逻辑回归算法的乳腺癌诊断数据分类研究被引量：5

参考文献2

二级参考文献17

共引文献12

同被引文献19

引证文献5

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于逻辑回归算法的乳腺癌诊断数据分类研究 被引量：5

参考文献2

二级参考文献17

共引文献12

同被引文献19

引证文献5

二级引证文献22

相关作者

相关机构

相关主题

浏览历史

基于逻辑回归算法的乳腺癌诊断数据分类研究被引量：5