五种生物信息学软件对于错义突变预测性能的评估被引量：5

Evaluation of performance of five bioinformatics software for the prediction of missense mutations

导出

摘要目的对5种生物信息学软件（SIFT、PolyPhen2、Mutation Taster、Provean、Mutation Assessor）的预测性能进行评估。方法从自有突变数据库、中文数据库、人类基因突变数据库、dbSNP数据库中检索并收集121个具有明确功能学研究的错义突变以及121个家系分析提示具有致病性的错义突变作为阳性金标准，242个显性遗传病致病基因上最小等位基因频率〉5％的错义突变作为阴性金标准，用上述软件对其进行预测。用敏感度、特异度、阳性预测值、假阳性率、阴性预测值、假阴性率、错误发现率、准确度、受试者工作特征曲线等9个指标评估5种软件的预测性能。结果从敏感度、阴性预测值和假阴性率的指标进行评估，5种软件的排名依次为MutationTaster、PolyPhen2、Provean、SIFT、Mutation Assessor;从特异度和假阳性率指标进行评估，其排名依次为MutationTaster、Provean、MutationAssessor、SIFT、PolyPhen2；从阳性预测值和错误发现率指标进行评估，其排名依次为MutationTaster、Provean、MutationAssessor、PolyPhen2、SIFT；从曲线下面积值和准确度指标进行评估，其排名依次为MutationTaster、Provean、PolyPhen2、MutationAssessor、SIFT。结论各软件在使用不同指标参数进行评估时的性能有所不同，其中MutationTaster软件从9个指标参数评估性能为最佳。 Objective To study the prediction performance evaluation with five kinds of bioinformatics software （SIFT, PolyPhen2, MutationTaster, Provean, MutationAssessor）. Methods From own database for genetic mutations collected over the past five years, Chinese literature database, Human Gene Mutation Database, and dbSNP, 121 missense mutations confirmed by functional studies, and 121 missense mutations suspected to be pathogenic by pedigree analysis were used as positive gold standard, while 242 missense mutations with minor allele frequency （MAF）〉 5% in dominant hereditary diseases were used as negative gold standard. The selected mutations were predicted with the five software. Based on the results, the performance of the five software was evaluated for their sensitivity, specificity, positive predict value, false positive rate, negative predict value, false negative rate, false discovery rate, accuracy, and receiver operating characteristic curve （ROC）. Results In terms of sensitivity, negative predictive value and false negative rate, the rank was MutationTaster, PolyPhen2, Provean, SIFT, and MutationAssessor. For specificity and false positive rate, the rank was MutationTaster, Provean, MutationAssessor, SIFT, and PolyPhen2. For positive predict value and false discovery rate, the rank was MutationTaster, Provean, MutationAssessor, PolyPhen2, and SIFT. For area under the ROC curve （AUC） and accuracy, the rank was MutationTaster, Provean, PolyPhen2, MutationAssessor, and SIFT. Conclusion The prediction performance of software may be different when using different parameters. Among the five software,MutationTaster has the best prediction performance.

作者陈倩婷戴聪伶张前军杜娟李汶

机构地区中南大学生殖与干细胞工程研究所中信湘雅生殖与遗传专科医院

出处《中华医学遗传学杂志》 CAS CSCD 北大核心 2016年第5期625-628,共4页 Chinese Journal of Medical Genetics

关键词错义突变生物信息学软件性能评估 Missense mutation Bioinformatics software Performance evaluation

分类号 R394 [医药卫生—医学遗传学]

引文网络
相关文献

参考文献4

1谢云飞,解博红,杨子善.hRFT2基因单核苷酸多态性的生物信息学分析[J].生物技术通报,2012,28(5):138-143. 被引量：1
2韦修喜,周永权.基于ROC曲线的两类分类问题性能评估方法[J].计算机技术与发展,2010,20(11):47-50. 被引量：21
3都娟,黄建萍,赵晓艳,王硕,肖丽丽,张尼娜.儿童Alport综合征COL4A5基因4种新突变分析[J].中国循证儿科杂志,2013,8(1):27-30. 被引量：5
4Yongyi Yuan,Jianguo Zhang,Qing Chang,Jin Zeng,Feng Xin,Jianjun Wang,Qingyan Zhu,Jing Wu,Jingqiao Lu,Weiwei Guo,Xukun Yan,Hui Jiang,Binfei Zhou,Qi Li,Xue Gao,Huijun Yuan,Shiming Yang,Dongyi Han,Zixu Mao,Ping Chen,Xi Lin,Pu Dai.De novo mutation in ATP6V1B2 impairs lysosome acidification and causes dominant deafness-onychodystrophy syndrome[J].Cell Research,2014,24(11):1370-1373. 被引量：13

二级参考文献59

1孙长亮,何峻,肖怀铁.基于ROC曲线的目标识别性能评估方法[J].雷达科学与技术,2007,5(1):17-21. 被引量：17
2Alsing S G. The Evaluation of Competing Classification[D].US: Air Force Institure of Technology,2002.
3Provost F, Fawcett T. Robust Classification for Imprecise Environmeuts[ J ]. Machine Learning, 2001,42 ( 3 ) : 203 - 231.
4Swets J A. ROC Analysis Applied to the Evaluation of Medical Imaging Techniques [J]. Investigative Radiology, 1997, 14 (2) :109 - 121.
5de sa J P M.模式识别-原理、方法及应用[M].北京:清华大学出版社,2002.
6Marzban C. A Comment on the ROC Curve and the Area Under it as Performance Measures [EB/OL]. 2004. http:// www. nhn. ou. edu/marzban.
7Hanley J A, McNeil B J. The Meaning and Use of the Area Under a Receiver Operating Characteristic(RCX2) Curve[J]. Radiology, 1982,143 (1): 29 - 36.
8James AW, Miranda sa, Culver K, et al. Am] Med Genet A 2007; 143A:2821-2831.
9Campeau PM, Kasperaviciute D, Lu JT, et al. Lancet Neurol 2014; 13:44-58.
10White SM, Fahey M. Am] Med Genet A 2011; 155A:2512-2515.

共引文献36

1方苗,张金龙,徐瑱.基于GIS和Logistic回归模型的兰州市滑坡灾害敏感性区划研究[J].遥感技术与应用,2011,26(6):845-854. 被引量：35
2杨尚瑜,杨梅,王开正,万沁.血糖三项检验的数据挖掘及应用[J].山东医药,2014,54(13):16-18. 被引量：1
3陈耀平,陈静,王贵杰,霍正浩,魏军.一视网膜色素变性家系的基因检测分析[J].宁夏医科大学学报,2014,36(2):137-139.
4何威,夏正坤,高春林.常见遗传性肾小球疾病的研究进展[J].医学研究生学报,2015,28(3):308-312. 被引量：7
5高志杰,姜茜,陈倩,许克铭.第2代测序技术在甲基丙二酸尿症以及苯丙酮尿症诊断中的应用[J].医学研究杂志,2015,44(3):111-114. 被引量：4
6闫妍,万平.利用位点特异性打分矩阵对大肠杆菌启动子的预测[J].生物信息学,2015,13(2):125-130. 被引量：2
7刘建蓓,马小龙,张志伟,郭忠印,柳本民.基于心电分析的青藏高原驾驶人疲劳特性[J].交通运输工程学报,2016,16(4):151-158. 被引量：12
8陈康,李耀华,游峰,陈润丰.基于串并行处理的多特征交通视频烟雾检测算法[J].计算机与现代化,2017(4):1-6. 被引量：3
9刘汉勇,马华林.来源于Alport综合症多能诱导干细胞转录组基因差异性表达[J].中国热带医学,2017,17(7):668-674.
10莫泽坤,徐逸峰,蒋麒憬,张晨曦,陈兰岚.基于外周生理信号的疲劳驾驶监测研究[J].汽车实用技术,2018,44(2):97-100.

同被引文献19

1庄永龙,周敏,李衍达,沈岩.人类遗传突变数据库及其应用[J].遗传,2004,26(4):514-518. 被引量：4
2奚剑英,任惠民,卢家红,汪寅,黄俊,朱雯华,林洁.Dysferlin肌病的临床和病理特点分析(附6例报道)[J].中国临床神经科学,2007,15(3):296-301. 被引量：3
3高志杰,姜玉武,吴晔,王静敏,熊晖,袁云,吴希如.婴儿神经轴索营养不良临床与分子遗传学研究[J].中国实用儿科杂志,2008,23(5):371-373. 被引量：6
4胡文彬,韩咏竹,薛本春,程楠,孙道银,叶冬青,杨任民.安徽省含山县肝豆状核变性的流行病学研究[J].中华医学杂志,2011,91(13):894-897. 被引量：35
5赵琴,蒋利萍,于洁,肖剑文,赵晓东.24例Wiskott-Aldrich综合征患儿基因型与临床表现型的关系[J].第三军医大学学报,2011,33(13):1404-1407. 被引量：8
6张平平,高志杰,王静敏,姜玉武,张锋,肖江喜,王爽,杨艳玲,张月华,熊晖,吴晔.中国婴儿神经轴索营养不良患儿临床随访及分子遗传学研究[J].实用儿科临床杂志,2012,27(9):692-696. 被引量：11
7胡文彬,韩咏竹,杨任民,程楠,薛本春,孙道银,喻绪恩,韩永升,叶冬青.安徽省金寨县和利辛县汉族人群肝豆状核变性的患病率调查(附一家系报道)[J].安徽医学,2012,33(6):734-737. 被引量：15
8彭方,农光民,蒋敏,刘晓微,刘宏涌,李勇.Wiskott-Aldrich综合征临床特点与基因测序分析[J].中华实用儿科临床杂志,2014,29(9):675-679. 被引量：8
9杨健,蔡浩洋.肿瘤生物信息学数据库[J].生物技术通报,2015,31(11):89-101. 被引量：8
10王金玲,吴蔚,陈雪峰,张黎,王秀敏,董关萍.PLA2G6基因纯合突变致婴儿神经轴索营养不良一例[J].中华医学遗传学杂志,2016,33(1):64-67. 被引量：6

引证文献5

1高敏,康丽丽,刘毅,盖中涛.二代测序确诊X连锁血小板减少症新生儿一例[J].中华医学遗传学杂志,2018,35(3):422-425. 被引量：2
2谭建强,严提珍,畅荣妮,袁德健,潘莉珍,蔡稔.一个婴儿神经轴索营养不良家系的基因变异分析[J].中华医学遗传学杂志,2020,37(1):21-24. 被引量：5
3刘凤姣,郭丽文.基因测序数据与疾病风险评估浅析[J].生物化工,2020,6(3):102-104.
4夏艳洁,时盼来,侯雅勤,陈铎,代鹏,赵莘瑜,孔祥东.五个Dysferlinopathy家系的DYSF基因变异分析[J].中华医学遗传学杂志,2021,38(3):205-209.
5刘力生,方明娟,年娜,赵雯,童广安,王佳炜,胡文彬.累代遗传的肝豆状核变性的临床与基因诊断分析[J].中风与神经疾病杂志,2024,41(1):52-57.

二级引证文献7

1高敏,邢梦娟,张开慧,律玉强,马健,盖中涛,刘毅.一例Claes-Jensen型X连锁精神发育迟滞的临床表型及遗传学分析[J].中华医学遗传学杂志,2020,37(7):736-738. 被引量：4
2孙艳舫,王会朋,任静,朱欣颖,杨淑莲.X连锁铁粒幼细胞性贫血一例[J].中华医学遗传学杂志,2020,37(10):1198-1199.
3盛志强,袁嫣然,赵兵.婴儿神经轴索营养不良的诊断学特征[J].中华诊断学电子杂志,2021,9(1):22-25.
4童培,刘艳.婴儿神经轴索营养不良1例临床和基因变异分析[J].临床儿科杂志,2021,39(4):301-303. 被引量：2
5郑小兰,周水珍,李文辉.非钙依赖型磷脂酶A2相关性神经变性病5例并国内文献复习[J].中国实用儿科杂志,2021,36(10):783-788. 被引量：2
6邱彬玮,钱小芳,张瑶,张丽萍.胰岛素治疗小儿糖尿病的效果及血糖指标分析[J].糖尿病新世界,2022,25(1):18-21. 被引量：3
7宫为大,陶钢,赵甜甜,杨悦,纪红.一例婴儿神经轴索营养不良的诊疗与基因检测分析[J].遗传,2023,45(7):617-623. 被引量：2

1核素诊断[J].中西医结合研究,2004(4):173-174.
2吴秀芬,王英.肝豆状核变性5个家系分析与遗传咨询[J].临床军医杂志,1992,24(2):19-20.
3刘东婷,刘家祎,范占明.多层螺旋CT肾脏灌注成像在主动脉夹层的应用进展[J].影像诊断与介入放射学,2015,24(4):335-339. 被引量：2
4王欢,俞同福,张伟,徐海.百草枯中毒患者早期胸部CT表现对预后的评估[J].南京医科大学学报（自然科学版）,2015,35(2):234-236. 被引量：7
5梁琼鹤,唐文伟,张新荣.甲型H1N1流感患儿胸部影像学表现[J].南京医科大学学报（自然科学版）,2010,30(7):1036-1038.
6赵雁,黄钢,万良荣,严惟力,刘建军,施一平,林盟菲.阈值校正方式对PET脑显像统计参数图分析显示结果的影响[J].中华生物医学工程杂志,2008,14(4):281-286. 被引量：1
7刘春英,何晓鹏,舒健,韩福刚.MSCT在乳腺癌腋窝淋巴结转移术前N分期的诊断价值[J].实用放射学杂志,2014,30(1):65-68. 被引量：10
8马志文,王雪红,肖喜刚.胸部螺旋CT扫描的质量控制[J].黑龙江医学,2000(2):60-60.
9邵明哲,陈英茂,姚树林,田嘉禾.SPECT设备平面成像性能评估与验收测试[J].中国医学装备,2011,8(12):1-4. 被引量：14
10杜福川,刘辉.多层螺旋CT灌注评价肝癌患者肝储备功能及手术耐受性的意义[J].重庆医科大学学报,2009,34(11):1578-1580. 被引量：4

中华医学遗传学杂志

2016年第5期

浏览历史

内容加载中请稍等...

五种生物信息学软件对于错义突变预测性能的评估被引量：5

参考文献4

二级参考文献59

共引文献36

同被引文献19

引证文献5

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

五种生物信息学软件对于错义突变预测性能的评估 被引量：5

参考文献4

二级参考文献59

共引文献36

同被引文献19

引证文献5

二级引证文献7

相关作者

相关机构

相关主题

浏览历史

五种生物信息学软件对于错义突变预测性能的评估被引量：5