摘要
近年来,随着各种生物检测技术的发展,医学研究中出现了各种高通量数据,如基因组、蛋白质组和代谢组学数据等,变量选择是生物标志物识别和建立分类模型的重要环节,由于高维组学数据中的绝大多数变量对分类并不起作用,并且存在多重共线性、模型过拟合等问题,传统的基于最小二乘方法估计的线性回归并不适用于高维数据。
出处
《中国卫生统计》
CSCD
北大核心
2016年第4期733-736,共4页
Chinese Journal of Health Statistics
基金
国家自然科学基金资助(81573256
81473072)
黑龙江省博士后资助经费(LBH-Z14174)