数据挖掘技术在计算机辅助肺癌诊断中的应用被引量：7

Application of data mining in computer-aided diagnosis of lung cancer

下载PDF

导出

摘要目的:对数据挖掘中解决分类问题的常用方法进行分析,比较它们应用于计算机辅助诊断系统时的性能。方法:收集1998-06/2004-12在北京友谊医院和北京结核病院胸部肿瘤研究所经手术或穿刺活检病理证实的孤立肺节结200例(恶性135例,良性65例),观察2项临床指标(年龄及是否有痰中带血丝)和5项薄层CT指标,并按7∶3的比例将样本随机数字法分配到训练集和测试集中。分别用Fisher线性判别分析、Logistic回归分析、决策树和神经网络方法构建诊断分类器,并用测试样本验证各个分类器。利用诊断的敏感度、特异度评价分类器的准确性,用ROC曲线及曲线下面积比较各个分类器总体诊断性能。结果:①对60例样本进行诊断测试,4种方法的敏感度分别为84.6%,87.2%,87.2%和87.2%,特异度分别为85.7%,81.0%,76.2%和81.0%。②4种方法诊断的ROC曲线下面积分别为0.918,0.918,0.939和0.942,任何两种方法比较,曲线下面积的差异均无统计学意义(P值分别为0.8982,0.1576,0.3495,0.2857,0.4319和0.9868)。结论:从分类算法的分类准确性、分类器的可理解性以及对诊断的指导意义三方面进行比较,Logisitc回归和神经网络方法具有较高的诊断分类准确性,判别分析、Logistic回归分析和决策树方法具有较好的模型可理解性,基于BP算法的神经网络对实际诊断具有较好的指导作用。它们都可用于计算机辅助诊断系统中。 AIM： To analyze several classification methods in data mining and compare their diagnostic performance when used in computer-aided diagnosis system. METHODS： Two hundred cases of solitary pulmonary nodules confirmed by biopsy pathology with surgery operation or puncturation in Beijing Friendship Hospital and Beijing Institute of Tuberculosis and Thoracic Tumor between June 1998 and December 2004 were collected including 135 pedpheral lung cancers and 65 benign nodules. Two clinical features （ageand having blood streak in phlegm or not） and 5 thin-slice CT signs of each nodule were determined and quantified. 200 valid samples were randomly divided into training samples and examination samples at the radio of 7：3. Diagnostic classificators were established through Fisher linear discriminated function, Logistic regression function, decision tree and neural network model,and validated by examination samples. Index such as sensitivity and specialty were used to evaluate the accuracy of the classificators; and area under ROC curve were adopted to compare the diagnostic performance of these classificators. RESULTS：（1）ln the diagnosis of 60 cases, sensitivities of the four classificators were 84.6%, 87.2%, 87.2% and 87.2%, specialties of them were 85.7%, 81.0%, 76.2% and 81.0%, respectively. （2）Areas under ROC curve by four classificators were 0.918, 0.918, 0.939 and 0.942, no significant difference was found in the comparison between any two of them （P =0.898 2, 0.157 6, 0.349 5, 0.285 7, 0.431 9 and 0.986 8）. CONCLUSION： In terms of classified accuracy, understandability and helpfulness to clinical diagnosis, Logistic regression and BP neural network have higher diagnostic accuracy; discriminated analysis, Logistic regression and decision tree have higher understandabilities; BP neural network does better in actual diagnostic decision. All these methods can be applied in computer-aided diagnosis system.

作者陈卉王晓华

机构地区首都医科大学生物医学工程学院首都医科大学附属北京友谊医院放射科

出处《中国组织工程研究与临床康复》 CAS CSCD 北大核心 2007年第5期879-881,885,共4页 Journal of Clinical Rehabilitative Tissue Engineering Research

基金首都医科大学基础临床合作项目(2003JL03)~~

关键词诊断计算机辅助肺肿瘤分类法决策树神经网络(计算机) 回归分析判别分析

分类号 R318.04 [医药卫生—生物医学工程]

引文网络
相关文献

参考文献18

1Abe Y,Hanai K,Nakano M,et al.A computer-aided diagnosis (CAD)system in lung cancer screening with computed tomography.Anticancer Res 2005;25(1 B):483-488
2Yoshida H,Dachman AH.Computer-aided diagnosis for CT colonography.Semin Ultrasound CT MR 2004;25(5):419-431
3Kobashi S,Kondo K,Hata Y.Computer-aided diagnosis of intracranial aneurysms in MRA images with case-based reasoning.leice Transactions on Information and Systems 2006;E89D(1):340-350
4Abe H,Macmahon H,Shiraishi J,et al.Computer-aided diagnosis in chest radiology.Semin Ultrasound CT MR 2004;25(5):432-437
5Isgum I,van Ginneken B,Olree M.Automatic detection of calcifications in the aorta from CT scans of the abdomen.3D computer-aided diagnosis.Acad Radiol 2004;11(3):247-257
6马大庆.第90届北美放射学会年会2004年呼吸系统疾病影像诊断的进展[J].中华放射学杂志,2005,39(6):670-672. 被引量：4
7张碧云,陈自谦,赵政文,卢光明.计算机辅助检测系统对数字化胸片中肺结节诊断的应用价值[J].中华放射学杂志,2005,39(10):1092-1094. 被引量：7
8Li F,Arimura H,Suzuki K,et al.Computer-aided detection of peripheral lung cancers missed at CT:ROC analyses without and with localization.Radiology 2005;237(2):684-690
9Bornefalk H,Hermansson AB.On the comparison of FROC curves in mammography CAD systems.Med Phys 2005;32(2):412-417
10Kaiser S,Jorulf H,Soderman E,et al.Impact of radiologic imaging on the surgical decision-making process in suspected appendicitis in children.Acad Radiol 2004;11(9):971-979

二级参考文献27

1王晓华,马大庆,周新华.孤立性肺结节的临床与CT计量诊断[J].中国医学影像技术,2005,21(10):1512-1515. 被引量：10
2吴在德吴肇汉.外科学．第6版[M].北京:人民卫生出版社,2004,5..
3MacMahon H, Engelmann R , Behlen FM , et al. Computer-aided diagnosis of pulmonary nodules: rusults of a large-scale observer test.Radiology, 1999, 213:723-726.
4Kakeda S, Moriya J, Sato H, et al. Improved detection of lung nodules on chest radiographs using a commercial computer-aided diagnosis system. AJR , 2004 ,182:505-510.
5袁聿德冯树理.X线诊断影像质量评价进展[J].中华放射学杂志,1997,31:80-82.
6Obuchowski NA. Receiver operating characteristic curves and their use in radiology. Radiology , 2003,229:3-8.
7Shiraishi J, Abe H , Engelmann R , et al . Computer-aided diagnosis to distinguish benign from malignant solitary pulmonary nodules on radiographs: ROC analysis of radiologists′ performance--initial experience. Radiology, 2003,227:469-474.
8Johkoh T , Kozuka T , Tomiyama N, et al .Temporal subtraction for detection of solitary pulmonary nodules on chest radiographs: evaluation of a commercially available computer-aided diagnosis system. Radiology , 2002,223 :806-811.
9Swensen SJ,Brown LR, Colby TV, et al. Pulmonary nodules: CT evaluation of enhancement with iodinated contrast material [J].Radiology, 1995, 194 (1): 393-398.
10永友章,罔本浩明,国兼浩嗣,等.CT上长径2cm以下の小结节影の检讨[J].临床放射线,1997,42(1):39-54.

共引文献57

1邢宇翔,郑娟.断层影像系统性能的数值/解析计算研究进展[J].中国体视学与图像分析,2008,13(3):145-150. 被引量：1
2刘毅.X线双能量数字化平行板探测器的研究和设计[J].生物医学工程学进展,2011,32(2):85-87.
3章沛.基于数据挖掘技术的青少年健康心理状况研究[J].太原科技,2005(2):90-92.
4张勇 ,赵振杰 ,张德新 .数据挖掘及其在医学中的应用[J].西北医学教育,2005,13(3):240-241. 被引量：2
5程勇,陈卫国.医学影像CAD的研究和应用[J].医疗设备信息,2006,21(1):24-27. 被引量：5
6徐建军.医学影像数据挖掘中的人工神经网络方法研究[J].实用放射学杂志,2006,22(11):1416-1418. 被引量：5
7王曾礼.孤立性肺结节的近代认识[J].中华结核和呼吸杂志,2006,29(12):843-846. 被引量：17
8田军章,张雪林,江桂华,解播云,颜剑豪,黄大江.数据挖掘在医学影像储存与传输系统结构化报告中的应用[J].中国临床康复,2006,10(45):108-110. 被引量：1
9CHEN Hui,WANG Xiao-hua,MA Da-qing,MA Bin-rong.Neural network-based computer-aided diagnosis in distinguishing malignant from benign solitary pulmonary nodules by computed tomography[J].Chinese Medical Journal,2007(14):1211-1215. 被引量：13
10崔云,马大庆,杨静.肺结节胸膜凹陷征诊断价值的Meta分析[J].首都医科大学学报,2007,28(6):709-712. 被引量：22

同被引文献35

1来丹飞,陈雪东.基于决策树的门脉高压脾切术并发门脉血栓的早期诊断与预测[J].湖州师范学院学报,2013,35(6):69-74. 被引量：5
2周丽娟,李爽,耿海军.关联规则Apriori改进算法[J].首都师范大学学报（自然科学版）,2009,30(S1):1-6. 被引量：2
3冯志新,钟诚.基于FP-tree的最大频繁模式挖掘算法[J].计算机工程,2004,30(11):123-124. 被引量：18
4张志庸,郭峰,崔玉尚,李单青,李力,徐晓辉,戈烽,郭惠琴,李泽坚.北京协和医院外科治疗肺癌生存率变化分析[J].中国肺癌杂志,2005,8(2):124-128. 被引量：16
5秦亮曦,史忠植.关联规则研究综述[J].广西大学学报（自然科学版）,2005,30(4):310-317. 被引量：22
6王晶,卫金茂,由军平.支持向量机及其在癌症诊断中的应用[J].计算机工程与应用,2005,41(36):220-222. 被引量：4
7潘泓,刘德森,茅乃权,左传田,黄鼎铭,谢彤,黄耀元,潘琪.542例非小细胞肺癌外科治疗的预后因素分析[J].广西医科大学学报,2005,22(6):894-896. 被引量：1
8朱祥玉,侯德文,陈希.对关联规则挖掘Apriori算法的进一步改进[J].信息技术与信息化,2005(6):81-83. 被引量：7
9王晓华,陈卉,马大庆,高培毅,周新华.人工神经网络在孤立性肺结节CT诊断研究中的应用[J].中华放射学杂志,2006,40(4):377-382. 被引量：21
10杨健兵.数据挖掘中关联规则的改进算法及其实现[J].微计算机信息,2006(07X):195-197. 被引量：26

引证文献7

1吕优江,俞守义.肺癌辅助诊断系统的开发[J].南方医科大学学报,2009,29(7):1410-1412.
2陈伟,刘进康,李文政,熊曾,龙学颖,周晖.基于Bayes理论的计算机辅助诊断系统在孤立性肺结节CT诊断中的应用[J].第三军医大学学报,2008,30(20):1889-1892. 被引量：9
3黄肇明.Apriori算法的改进及其在单病种信息挖掘中的应用[J].广西科学院学报,2009,25(4):264-266.
4王辉,黄钢.肿瘤标志物检测结合支持向量机模型在胃癌诊断中的应用[J].中华核医学杂志,2010,30(2):87-89. 被引量：3
5强永乾,郭佑民,王秋萍,李雪.利用关联规则挖掘恶性孤立性肺结节影像诊断规则[J].中国数字医学,2010,5(11):52-55. 被引量：2
6赵力威,向光华,刘晓玲,郑虹蕾,武鸿文.支持向量机在大肠癌肿瘤标志物诊断中的应用[J].放射免疫学杂志,2012,25(5):519-520. 被引量：3
7李祥蓉,程琳,席家宁,李伟.三种模式识别模型诊断腰椎间盘突出症受压神经根的准确率[J].中国组织工程研究,2018,22(19):3005-3013. 被引量：6

二级引证文献23

1陈伟,刘进康,陈琼,李文政,熊曾,龙学颖.Bayes分析指导孤立性肺结节的临床决策[J].中南大学学报（医学版）,2009,34(5):401-405. 被引量：2
2陈伟,刘进康,李文政,熊曾,朱智明.似然比在孤立性肺结节CT定性诊断中的价值[J].放射学实践,2009,24(7):727-731. 被引量：5
3熊曾,刘进康,胡成平,陈伟,周漠玲,周晖,朱智明,夏宇.非小细胞肺癌CT灌注成像诊断价值综合评估[J].中国肿瘤临床,2009,36(22):1261-1265. 被引量：4
4熊曾,刘进康,胡成平,陈伟,周漠玲,周晖,朱智明,夏宇.肺内恶性结节多层螺旋CT扫描形态学的诊断价值[J].临床放射学杂志,2010,29(2):183-186. 被引量：10
5黄钢,盛世乐.高度重视标记免疫分析技术在核医学发展中的地位[J].中华核医学杂志,2010,30(2):73-74. 被引量：2
6强永乾,郭佑民,王秋萍,李雪.基于Web平台孤立性肺结节影像计算机辅助诊断的研究[J].西安交通大学学报（医学版）,2011,32(3):367-370. 被引量：3
7宋兵宝,马厚琴.医院计算机网络化经验谈[J].中国卫生经济,2000,19(6):57-57. 被引量：1
8陈玉桂,汤日杰.基于多层螺旋CT高级肺结节分析软件中直径参数的选择[J].广东医学,2013,34(3):445-447. 被引量：3
9李伟,汤日杰.CT肺结节分析软件在肺部筛查中的应用价值[J].中国中西医结合影像学杂志,2014,12(3):254-257. 被引量：1
10庞萍,吴山.64排CT肺结节实性成分定量分析判断良恶性病变的应用价值[J].山西医药杂志,2014,43(14):1656-1657. 被引量：3

1黄伟,李宝生.蛋白质组学在肺癌诊断和治疗中的应用[J].中华结核和呼吸杂志,2008,31(12):926-927.
2史家欣,李家树,李小民,王虹.微小RNA与肺部疾病关系的研究进展[J].广东医学,2015,36(18):2922-2924.
3陈伟,刘进康,李文政,熊曾,龙学颖,周晖.基于Bayes理论的计算机辅助诊断系统在孤立性肺结节CT诊断中的应用[J].第三军医大学学报,2008,30(20):1889-1892. 被引量：9
4杜瑞兰,张雄,姜宇,祁冬冬.肿瘤干细胞标志物CD147,CD133在肺癌诊断中的应用[J].中华临床医师杂志（电子版）,2016,10(11):294-295.
5骆梅青,卜庆,曹轶林,郑桂银,伍爱华.干细胞标志物Nanog基因检测在肺癌诊断中的意义[J].现代医药卫生,2013,29(13):1924-1925. 被引量：2
6杜万萍,谭利华,翟宁,周顺科,王锐,薛功世,肖安.颅内血肿体积个人计算机测量方法[J].中南大学学报（医学版）,2011,36(1):84-87. 被引量：2
7丁琦晨,郑敏.血液miRNA在肺癌诊断中作用的研究进展[J].中华胸部外科电子杂志,2015,2(2):94-97. 被引量：2
8李玄,杨媛.农村老年人心理一致感与主观幸福感的关系研究[J].医学理论与实践,2013,26(20):2683-2685. 被引量：3
9陈锋,项道满,毛娅妮,刘恬.计算机辅助间接检眼镜下早产儿视网膜形态发育特征[J].中华眼底病杂志,2010,26(3):236-239. 被引量：5
10陈品儒,马志明,吴桂峰,萧芃,陈华,黄冬生,黄雪敏.结核病院革兰阴性杆菌分布及耐药性分析[J].广东医学,2010,31(19):2541-2544. 被引量：3

中国组织工程研究与临床康复

2007年第5期

浏览历史

内容加载中请稍等...

数据挖掘技术在计算机辅助肺癌诊断中的应用被引量：7

参考文献18

二级参考文献27

共引文献57

同被引文献35

引证文献7

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

数据挖掘技术在计算机辅助肺癌诊断中的应用 被引量：7

参考文献18

二级参考文献27

共引文献57

同被引文献35

引证文献7

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

数据挖掘技术在计算机辅助肺癌诊断中的应用被引量：7