摘要
在计算速度飞速发展的今天,统计学家们已经开始研究超高维和复杂的数据,尤其在生物信息学方面更显突出.相应的统计问题表现在观测数据中有很多的特征来自不同的子总体.在每个子总体中选择数量恰当的特征(变量)是得到好的模型预测的关键.本文基于稀疏正态线性模型(FMSL)理论,对基因转录组数据进行了分析,筛选出重要的特征变量.
In today's computing speed rapid development,scientists have begun to study the ultra high dimensional and complex data,especially more prominent in bioinformatics. The corresponding statistical problems in attention to observation data in the overall. There are a lot of features from different sub-population. Choosing appropriate features in each sub-population(variable) is the key to get good models predict. This article is based on finite mixture sparse normal linear model(FMSL) theory,analyses the gene transcription of data,choose the important characteristics of a variable.
出处
《白城师范学院学报》
2016年第11期16-20,共5页
Journal of Baicheng Normal University
基金
吉林省教育厅"十二五"科学技术研究规划项目(吉教科合字[2015]第416号)
2013年白城师学院青年基金项目"高维数据的分类和回归应用研究"