-
题名超高维数据特征筛选方法综述
被引量:7
- 1
-
-
作者
牛勇
李华鹏
刘阳惠
熊世峰
於州
张日权
-
机构
华东师范大学统计学院
合肥学院人工智能与大数据学院
山西大同大学数学与统计学院
中国科学院数学与系统科学研究院
-
出处
《应用概率统计》
CSCD
北大核心
2021年第1期69-110,共42页
-
基金
国家自然科学基金项目(批准号:11971171)
安徽省高校人文社科重大项目(批准号:SK2019ZD55)
+6 种基金
安徽省高校人文社科重点项目(批准号:SK2018A0605)
安徽省线上教学示范高校项目(批准号:2020xssfgx14)
大同市平城区科技计划立项项目(批准号:201906)
大同大学博士启动基金(批准号:2018-B-25)
安徽高校自然科学研究重点项目(批准号:KJ2018A0564)
安徽省高等学校质量工程项目(批准号:2020jyxm1621)
合肥学院校级质量工程项目(批准号:2019hfjyxm13)资助。
-
文摘
随着数据收集和存储能力的大幅提高,超高维数据[9],即数据维数伴随着样本呈指数增长,频繁出现在许多科学邻域.此时,惩罚类变量选择方法普遍遭遇三个方面的挑战:计算的复杂性,统计的准确性以及算法的稳定性.Fan和Lv[9]首先提出超高维特征筛选的方法,并在近十多年取得大量研究成果,成为当今统计最热点的研究邻域.本文主要从带模型假设,包含参数、非参数半参数模型假定的筛选方法、无模型假设的筛选以及特殊数据的筛选方法四个角度来介绍超高维筛选相关工作,并简要探讨目前超高维筛选方法存在的问题以及未来可能的研究方向.
-
关键词
超高维
特征筛选
可加模型
非参数独立筛选
确保筛选性质
线性模型
变量选择
组变量选择
充分降维
纵向数据
稀疏性
-
Keywords
ultra-high dimensional
feature screening
additive model
nonparametric independence screening
sure screening property
linear model
variable selection
group variable selection
sufficient dimension reduction
longitudinal data
sparsity
-
分类号
O212.7
[理学—概率论与数理统计]
-