-
题名高维生物学数据两阶段组合降维策略研究
被引量:3
- 1
-
-
作者
荀鹏程
钱国华
赵杨
于浩
陈峰
-
机构
南京医科大学公共卫生学院流行病与卫生统计学系
南京医科大学现代毒理学教育部重点实验室
昆山市卫生监督所
-
出处
《中国卫生统计》
CSCD
北大核心
2012年第5期626-629,共4页
-
基金
国家自然科学基金(81072389
30901232)
+1 种基金
江苏省高校自然科学研究重大项目(10KJA330034)资助
江苏高校优势学科建设工程资助
-
文摘
目的探讨高维生物学数据的多阶段组合降维策略。方法以微阵列数据的判别分析为例,采用实际数据和模拟数据相结合的方法,提出"初步选维→进一步降维"的两阶段组合降维策略,并与后续的"判别→验证"相结合,形成了"选维→降维→判别→验证"的判别分析思路。以后续判别分析的预测效果、预测结果的稳定性与敏感性等为指标,对2种单一降维(PCA,PLS)方法和4种组合降维方法(PCA+SIR、PCA+SAVE、PLS+SIR和PLS+SAVE)进行了考察。结果从判别模型的预测效果、预测结果的稳定性及敏感性来看,PLS优于PCA,PLS+SIR/SAVE的组合降维效果更佳。结论用t计分法选维,以"PLS+SIR/SAVE"法进行降维的两阶段组合降维策略,对于微阵列数据判别分析,是实用的、可行的。
-
关键词
两阶段组合降维
偏最小二乘
切片逆回归
切片均方误差估计
微阵列数据
判别分析
-
Keywords
Two-stage combinational dimensionality re-duction
Partial least square
Sliced inverse regression
Sliced av-erage variance estimation
Microarray
Discriminant analysis
-
分类号
R311
[医药卫生—基础医学]
-