基因表达谱数据缺失值的估计方法

下载PDF

导出

摘要目的探讨常用的基因表达谱数据缺失值填充方法对于提高目前流行的基因表达谱数据分类器一支持向量机性能的影响。方法采用公开发表的酵母菌基因表达谱数据．及Ribo功能类作为类属性构成训练集。分别利用KNN法和类均值法对其缺失值进行填充后．基于完整的表达谱数据对SVMs模型进行训练。采用k折交叉验证法避免训练中的过拟合问题，绘制CV准确率等高线图监控模型参数的迭代。采用检验对所得模型的性能进行评价。结果KNN法填充下。SVMs模型的CV准确率维持在99．554％；类均值法填充下，SVMs模型的CV准确率从99、554％上升至99．635％。对于模型性能的统计学愉验显示．两者差异无统计学意义。结论根据模型性能的统计学检验结果，两种填充方法对于SVMs模型性能改善的差别没有统计学意义。研究者可以根据实验条件和基因表达谱数据的特点任意选取两种填充方法进行处理。

作者吴骋王志勇贺佳

机构地区第二军医大学卫勤系卫生统计学教研室上海长海医院信息科

出处《中华国际医学杂志》 2004年第6期351-353,共3页

关键词基因表达谱数据缺失值估计

分类号 R311 [医药卫生—基础医学]

引文网络
相关文献

1钟漫如,苗巧云,王旭.不完全数据的完全化及其模拟结果[J].数理医药学杂志,1998,11(1):21-23.
2赵宏群,张一骅,李琬,何月涵,吕俊杰,黄昊,陈丽娜.基于共表达网络研究巨噬细胞在动脉硬化中的作用[J].国际免疫学杂志,2015,38(5):409-412.
3武建虎,贺佳,贺宪民,程红岩.多变量缺失数据的不同处理方法及分析结果比较[J].第二军医大学学报,2004,25(9):1013-1016. 被引量：17
4王发云.基于人类信号网络和基因表达谱数据动脉粥样硬化相关模块的作用机制[J].健康导报（医学版）,2015,20(1):159-160.
5陈婕卿,杨秋英,陈卉.计算机辅助诊断模型内部验证方法的定量评价[J].北京生物医学工程,2016,35(6):588-592. 被引量：1
6钱淑雯,李海燕,杨学智,李慧,张尚尚,芦煜,王京平,张治霞,徐静.褪黑素时间序列中缺失值的填补方法研究[J].现代中西医结合杂志,2014,23(35):3877-3879. 被引量：1
7汪伟.基于数据库语言实现基因表达谱数据的单因素重复测量方差分析[J].中国医疗设备,2013,28(11):34-35. 被引量：2
8茅群霞,李晓松.多重填补法与Ad Hoc法对模拟纵向数据集缺失值处理的比较[J].现代预防医学,2005,32(4):310-312. 被引量：5
9沈自尹,张新民,林伟,吴斌,黄建华,刘小雨,许世雄.基于基因表达谱数据建立肾虚证量化数学模型[J].中国中西医结合杂志,2008,28(2):131-134. 被引量：23
10马晔,孙红梅.基于蛋白质互作网络的功能模块挖掘[J].科技通报,2012,28(8):26-28.

中华国际医学杂志

2004年第6期

浏览历史

内容加载中请稍等...

基因表达谱数据缺失值的估计方法

相关作者

相关机构

相关主题

浏览历史