-
题名极端值条件下线性回归分析策略的模拟研究
- 1
-
-
作者
胡维维
李业棉
颜虹
陈方尧
-
机构
西安交通大学公共卫生学院流行病与卫生统计学系卫生统计教研室
-
出处
《中国医院统计》
2022年第4期304-311,共8页
-
基金
国家社会科学基金(21CTJ009)。
-
文摘
目的比较4种常用的多因素回归分析极端值处理策略在不同极端值条件下的实际效果,为制定多因素回归分析中极端值处理策略提供参考依据。方法通过Monte Carlo算法模拟产生不同条件下的含极端值数据,对不同极端值条件下多因素回归分析极端值处理策略进行模拟研究。以Ⅰ类错误概率α、Ⅱ类错误概率β、模型系数估计值的均方根误差、模型R 2和调整R 2为评价指标。结果直接删除极端值的处理方法在极端值比例与含极端值观测点的数量较小时表现良好,而随着极端值点的比例和数量不断增大,表现越来越差;稳健回归分析除了在样本量较小时,表现并不是非常好之外,在大样本量的各种极端值条件下均有非常好的表现;将极端值转换为缺失值再进行多重插补的方法只在样本量较小和极端值比例较低时,有可接受的表现;数据转换的处理方法在各个极端值条件下都表现得非常差。结论稳健回归分析最适合在样本量较大时使用,样本量小时需谨慎使用;将极端值转换为缺失值再进行多重插补法适合于极端值比例较小的数据集;直接删除极端值法只在数据集中含极端值观测点数量较少和所占比例较小时适合使用;数据转换的方法则在大多数极端值条件下都不适合使用。
-
关键词
极端值
线性回归
极端值检测
极端值处理
-
Keywords
extreme value
linear regression
extreme value detection
extreme value processing
-
分类号
C812
[社会学—统计学]
-
-
题名熵值赋权的改进思路探讨
被引量:8
- 2
-
-
作者
韩新华
马春爱
-
机构
中国石油大学(北京)工商管理学院
-
出处
《会计之友》
北大核心
2013年第31期18-20,共3页
-
基金
国家自然科学基金项目"财务弹性影响公司价值的路径研究"(批准号:71202118)
-
文摘
熵值法是一种适合相互独立的变量之间计算权重的客观赋权方法,但是该方法的一个明显缺陷是无法处理零和负值,借鉴函数连续性的性质,文章提出重新赋值的解决思路,即对零值重新赋予一个正的微小量,并纳入计算过程。利用2011年沪、深上市公司的财务数据进行验证分析发现:文章提出的新思路下的赋权结果更加符合我国上市公司的实际情况。
-
关键词
熵值赋权
极端值处理
实证分析
-
分类号
F272.5
[经济管理—企业管理]
-