摘要
生物信息学背景下普遍存在着高维数据,所谓的“高维”即待估计的未知参数的个数是样本量的一个或几个数量级,例如Van’t Veer(2002)心0等学者收集的乳腺癌数据集共包括259例乳腺癌患者,25000个微阵列基因数据,研究变量个数25000远远大于样本量259,存在“高维”现象。传统的方法进行参数估计和统计推断的一个必要前提是待估参数的个数小于样本量,这样统计推断的结果才是稳定、可靠的。
出处
《中国卫生统计》
CSCD
北大核心
2013年第6期922-926,共5页
Chinese Journal of Health Statistics
基金
国家自然科学基金(81072385)
全国统计科研计划重点项目(2009LZ033)