-
题名含发散维数自变量的单指标模型中方向向量的稳健估计
- 1
-
-
作者
朱利平
朱力行
-
机构
华东师范大学金融与统计学院
香港浸会大学数学系
-
出处
《中国科学:数学》
CSCD
北大核心
2010年第4期393-402,共10页
-
基金
国家自然科学基金(批准号:10701035)
上海市教育发展基金会晨光计划(批准号:2007CG33)资助项目
-
文摘
在回归分析中,常常引入大量的自变量来减少模型拟合的误差.本文考虑如下非常一般的单指标模型:在给定自变量X的线性组合β0τX的条件下,响应变量Y和维数发散的自变量X相互独立,其中β0是pn维向量.本文在这样的单指标模型假设下讨论当pn→∞时单指标模型中方向向量的稳健估计问题.我们发现,当pn=o(√n)时,最小二乘估计βn0能够相合地估计β0的方向.为了剔除不相关的自变量,从而提高回归模型的可解释能力,我们提出基于1-正则化的算法,通过加二次限制得到稀疏的最小二乘估计.1-正则化的解βn不仅可以相合地估计β0的方向,而且可以产生稀疏的估计.因此,我们可以选择一些重要的自变量,在保持预测准确度的同时使模型解释变得容易.模拟分析和汽车价格数据应用分析表明,我们所提出的估计方法在有限样本场合具有良好的表现.
-
关键词
e1-正则化
发散维数
逆回归
限制正交性
稀疏性
充分降维
-
分类号
O212.1
[理学—概率论与数理统计]
-
-
题名双侧截断回归模型的变量选择
- 2
-
-
作者
郑明
林婵娟
郁文
-
机构
复旦大学管理学院统计与数据科学系
-
出处
《中国科学:数学》
CSCD
北大核心
2022年第12期1433-1448,共16页
-
基金
国家自然科学基金(批准号:11771095和12071088)资助项目。
-
文摘
在回归分析中,当因变量存在双侧截断时,已有的统计方法会使得回归模型的系数估计与变量选择产生偏差.本文提出一种适用于双侧截断回归模型的系数估计与变量选择方法,且该方法允许回归模型中自变量的个数随着样本量增大并趋于无穷而趋于无穷.该方法的主要思想是,提出一种Mann-Whitney型的损失函数来进行纠偏,随后加入自适应最小绝对收缩和选择算子(least absolute shrinkage and selection operator,LASSO)惩罚项来进行变量选择.本文同时设计一种迭代算法来实现损失函数的优化;且证明了所提出估计量的相合性与渐近正态性,还给出所提出变量选择方法的神谕性(oracle property).本文通过随机模拟展示所提出方法在有限样本量下的表现,并使用所提出方法分析一个天文学领域的实际数据集.
-
关键词
双侧截断
变量选择
维数发散
自适应LASSO
最小绝对离差
神谕性
-
Keywords
double truncation
variable selection
diverging number of parameters
adaptive LASSO
least absolute deviation
oracle property
-
分类号
O212.1
[理学—概率论与数理统计]
-