C4.5和CART算法在医学数据挖掘中的对比研究
被引量:4
摘要
本文通过实验对决策树中的C4.5算法和CART算法进行了对比,认为C4.5算法所建立的医疗诊断决策树具有较好的性能,在基本保证精度的同时可以控制决策树的规模,提高生成树的可理解性,方便医疗工作者进一步评估和诊断。
出处
《电子技术与软件工程》
2013年第10期47-48,共2页
ELECTRONIC TECHNOLOGY & SOFTWARE ENGINEERING
参考文献3
-
1赵紫奉,李韶斌,孔抗美.基于决策树算法的疾病诊断分析[J].中国卫生信息管理杂志,2011,8(5):67-69. 被引量:12
-
2王剑,刘殿武,曹国玉,李伟勇,李金奎.树模型在慢性乙肝与肝硬化和肝癌临床诊断中的应用[J].第四军医大学学报,2008,29(12):1135-1137. 被引量:3
-
3朱凌云,吴宝明,曹长修.医学数据挖掘的技术、方法及应用[J].生物医学工程学杂志,2003,20(3):559-562. 被引量:37
二级参考文献34
-
1于晓辉,赵连三,张秀辉,谭明珍,吴雄志,许倩,马颖,熊中华.慢性乙型肝炎病理与临床诊断的一致性[J].胃肠病学和肝病学杂志,2005,14(1):71-73. 被引量:9
-
2张文宏,翁心华,庄辉.《慢性乙型肝炎防治指南》专家讨论会纪要[J].中华肝脏病杂志,2006,14(5):390-392. 被引量:16
-
3刘杰,王吉耀,陆晔.血清纤维化指标对肝纤维化诊断价值的研究[J].中华内科杂志,2006,45(6):475-477. 被引量:45
-
4张晓东.数据挖掘技术在肺癌生存期预测中的应用探讨[J].中国医院统计,2006,13(4):324-328. 被引量:6
-
5骆盈盈,王柯玲,陈川,毛云芳.结合递增式学习的CART算法改进[J].计算机工程与设计,2007,28(7):1520-1522. 被引量:10
-
6李大锋,罗林开,岑涌.基于PCA与分类回归树的疾病诊断应用研究[J].计算机与数字工程,2007,35(5):184-187. 被引量:4
-
7赵振宇 徐用懋.模糊理论和神经网络的基础与应用[M].北京,南宁:清华大学出版社,广西科学技术出版社,1997.105-106.
-
8Coulter DM, Bate A, Meyboom RH, et al. Antipsychotic drugs and heart muscle disorder in international pharmacovigilances data mining study. BMJ,2001, 322(7296): 1207.
-
9Dokur Z O, lines T. ECG beat classification by a novel hybrid neural network. Computer Methods and Programs in Biomedicine, 2001, 66: 167.
-
10Vefghl L, Linkens DA. Dynamic monitoring and control of patient anaesthetic and dose levels s time-delay, moving-average neural networks, and principal components analysis. Computer Methods and Programs in Biomedicine, 1999, 59 : 91.
共引文献49
-
1时钢,王兴梅,黄志民,洪松林,闫妍,高伟伟,门天男.大数据时代医学生物信息的挖掘和利用[J].医学信息(医学与计算机应用),2014,0(9):1-2. 被引量:5
-
2谭颖,殷国富,李贵兵,陈建英.Mining Compatibility Rules from Irregular Chinese Traditional Medicine Database by Apriori Agorithm[J].Journal of Southwest Jiaotong University(English Edition),2007,15(4):288-293.
-
3刘佳,袁中凡,林大全.数据挖掘在辐照人体模型等效性判断中的应用探讨[J].中国科技信息,2009(3):40-41.
-
4李雯娟,曾照芳,陈睿.医学信息数据仓库模型的构建与数据挖掘[J].生物数学学报,2009,24(2):347-354. 被引量:1
-
5樊敏.数据挖掘在医院信息系统中的应用探讨[J].科技资讯,2009,7(27):191-191. 被引量:3
-
6朱玉颖,吴斌.医院信息OLAP技术研究[J].电脑知识与技术,2009,5(10):7845-7847.
-
7陈建,徐雅斌.基于XML的电子病历系统的设计与实现[J].北京信息科技大学学报(自然科学版),2009,24(3):68-71. 被引量:10
-
8方胜吉.浅谈医学数据挖掘技术[J].硅谷,2010,3(20):180-180.
-
9王玫,张兰华,张月东.电子病历中可视化数据挖掘技术的应用[J].微计算机信息,2011,27(7):239-240. 被引量:9
-
10刘炳麟,王志萍.Microsoft时序挖掘模型在门诊挂号预测中的应用[J].中国卫生统计,2012,29(4):605-606. 被引量:1
同被引文献50
-
1Jinn-Vi Yeh, Tai-Hsi Wu, Chuan-Wei Tsao. Using data mining techniques to predict hospitalization of hemodialysis patients [J]. dsionSupport Systems, 2011, 50 (1): 439-448.
-
2Zerina Maetic, Abdulhamit Subasi. Detection of congestive heart failure using CA. 5 decision [J]. Southeast Europe Journal of Soft Computing, 2013, 2 (2): 74-77.
-
3MevlutTure, FusunTokatli, Imran Kurt. Using Kaplan-Meier analysis together with decision tree methods (CART, CHAID,QUEST, C4.5 and ID3) indetermining recurrence-free survi-val of breast cancer patients [J]. Expert Systems with Applica- tions, 2009, 36 (2): 2017-2026.
-
4Chawla NV, Bowyer K, Hall L, et al. SMOTE: Synthetic minority over-sampling technique [J]. Journal of Artificial In- telligence Research, 2002, 16 (1): 321-357.
-
5Tang Y, Zhang YQ, Chawla NV, et al. SVMs modeling for highly imbalaneed classifications [J]. IEEE Transaction on Systems, Man, and Cybemeties, Part B: Cybernetics, 2009, 39 (1).. 281-288.
-
6Wang K J, Makond B, Chen KH, et al. A hybrid c|assifier combining SMOTE with PSO to estimate 5-year survivability of breast cancer patients [J]. Applied Soft Computing, 2014, 20 (3): 15-24.
-
7Zhong L, Wang B, Wang Z, et al. Research and application of massive data processing technology [C] //8th International Conference on Computer Science Education. IEEE, 2013.. 829-833.
-
8孙爱东,朱梅阶,涂淑琴.基于属性值的ID3算法改进[J].计算机工程与设计,2008,29(12):3011-3012. 被引量:26
-
9刘永.数字档案管理中的知识发现与知识服务[J].档案学研究,2008(5):51-53. 被引量:20
-
10李楠,段隆振,陈萌.决策树C4.5算法在数据挖掘中的分析及其应用[J].计算机与现代化,2008(12):160-163. 被引量:43
引证文献4
-
1曹艳,殷旭.基于均衡分类的脑卒中风险预测模型[J].计算机工程与设计,2015,36(9):2508-2513. 被引量:1
-
2焦会英,辛存生,刘俊艳.大数据技术在国网电商平台的应用[J].软件,2019,40(1):82-84. 被引量:3
-
3罗计根,杜建强,聂斌,李欢,贺佳.融合GINI指数的ID3改进算法[J].南昌大学学报(工科版),2019,41(1):80-84. 被引量:9
-
4苗犇犇,张武,王志鸿,冯金磊,王瑞卿,江朝晖,饶元,金秀.基于CART算法的茶园精准灌溉方法[J].中国农业大学学报,2022,27(8):208-220. 被引量:1
二级引证文献14
-
1邵泽国,陈晨,陈炜.基于优化决策树的脑卒中日常生活习惯风险因素分析[J].现代预防医学,2018,45(15):2689-2693. 被引量:8
-
2郑焱.基于ID3算法的商务网站客户分类研究[J].软件工程,2020,23(3):35-37. 被引量:4
-
3李春生,焦海涛,刘澎,刘小刚.基于C4.5决策树分类算法的改进与应用[J].计算机技术与发展,2020,30(5):185-189. 被引量:17
-
4魏梦丽.大数据分析对电子商务营销的作用[J].信息记录材料,2020,21(6):83-84. 被引量:1
-
5王利军.决策树ID3算法的优化[J].菏泽学院学报,2020,42(5):15-19. 被引量:5
-
6黄位华,范欣.基于用户特征信息智能分析的精准营销推送系统[J].现代电子技术,2021,44(6):43-46. 被引量:2
-
7吕伟才.大学MOOC教学效果评价方法研究[J].内蒙古财经大学学报,2021,19(2):49-52.
-
8谢鑫,张贤勇,杨霁琳.融合信息增益与基尼指数的决策树算法[J].计算机工程与应用,2022,58(10):139-144. 被引量:11
-
9林军,郭志旭,李函,谢志翔.基于改进模糊决策树的医疗大数据分析研究[J].现代科学仪器,2022,39(3):173-178. 被引量:2
-
10荣菡,廖书嫣,刘欣宇,梅泽桐,李亮.近红外光谱与决策树算法联用快速鉴别苍耳掺伪[J].中成药,2022,44(8):2739-2743. 被引量:1
-
1任杰,王一婧,刘尚辉.数据挖掘在医学上的应用[J].电子世界,2014(3):85-86. 被引量:2
-
2刘莘,王飞.医学数据挖掘的现状分析[J].福建电脑,2010,26(5):62-62. 被引量:3
-
3何天宇,许艳萍,刘尚辉.医学数据挖掘解析[J].电子世界,2014(2):89-89.
-
4肇恒宇.数据挖掘技术在医学领域中的应用[J].中国科技信息,2009(15):129-130. 被引量:6
-
5杨岳.浅谈数据挖掘——以医学为例[J].电子世界,2014(13):67-67.
-
6侯洁,张希坤.数据挖掘技术在医学领域的应用[J].电脑知识与技术,2011,7(10X):7365-7366.
-
7汪菊琴.医学数据挖掘综述[J].电脑知识与技术,2011,7(5X):3495-3497. 被引量:6
-
8焦瑞,李祥生.粗糙集理论在医学数据挖掘中的应用[J].微计算机信息,2011,27(2):223-224. 被引量:1
-
9左翔,刘方,胡学钢.医学数据挖掘的探究与应用[J].中国农村卫生事业管理,2011,31(3):268-270. 被引量:6
-
10吴泾平.医院信息化首先是观念[J].中国信息化,2006(19):11-11.