期刊文献+
共找到15篇文章
< 1 >
每页显示 20 50 100
基于高维变量选择的中国人口增长影响因素研究 被引量:1
1
作者 杨双双 王亮 李兴平 《统计理论与实践》 2023年第9期39-43,共5页
影响我国人口增长的因素是社会关注的焦点。运用相似性分析方法、灰色关联分析方法、随机森林方法、正则化方法和集成方法,对政治、经济、文化、社会、生态和人口层面下影响人口增长的92个因素进行筛选。将各方法选出的变量输入机器学... 影响我国人口增长的因素是社会关注的焦点。运用相似性分析方法、灰色关联分析方法、随机森林方法、正则化方法和集成方法,对政治、经济、文化、社会、生态和人口层面下影响人口增长的92个因素进行筛选。将各方法选出的变量输入机器学习模型KNN、RF、SVR和MLP中,依据模型性能指标综合评估得到较优的变量选择方法,并形成几种较优的变量选择方案。最后,用每种变量选择方案下选出的变量建立多元线性回归模型,选出统计意义和理论意义上较好的模型进行预测分析。实证结果表明:(1)置换重要性和距离相关系数的变量选择效果较好;(2)就业问题是导致我国人口出生率下降的核心因素。 展开更多
关键词 人口增长 就业 高维变量选择
下载PDF
惩罚logistic回归用于高维变量选择的模拟评价 被引量:8
2
作者 孙红卫 杨文越 +3 位作者 王慧 罗文海 胡乃宝 王彤 《中国卫生统计》 CSCD 北大核心 2016年第4期607-611,共5页
目的 logistic回归是生物医学研究中常用的方法,可以进行影响因素筛选、概率预测、分类等。高通量测序技术得到的数据给高维变量选择问题带来挑战。惩罚logistic回归可以对高维数据进行变量选择和系数估计,且其有效的算法保证了计算的... 目的 logistic回归是生物医学研究中常用的方法,可以进行影响因素筛选、概率预测、分类等。高通量测序技术得到的数据给高维变量选择问题带来挑战。惩罚logistic回归可以对高维数据进行变量选择和系数估计,且其有效的算法保证了计算的可行性。方法本文介绍了常用的惩罚logistic算法如LASSO(least absolutes shrinkage and selection operator)、EN(elastic net)、SCAD(smoothly clipped absolute deviation)、MCP(minimax concave penalty)以及SIS(sure independence screening)等,并用模拟数据对各方法进行评价。结果 (1)各方法的结果与自变量间的相关程度有关,不同惩罚logistic回归的精确性与自变量间的相关程度有关,如果相关较高,LASSO或EN的结果较好,而在相关较低时,MCP或SCAD结果较好;(2)结合SIS的方法倾向于少选变量,误选率低,但敏感度也低,而LASSO、MCP、SCAD选择变量较多,误选率高,但敏感度较高;(3)当自变量间低度相关时,SIS的三种方法结果非常接近,但相关较高时,SIS+LASSO的结果表现较好。结论采用非小细胞型肺癌的基因数据集进行实例分析,并表明如何根据模拟实验的结论,在多种方法的不同结果间进行选择。 展开更多
关键词 高维变量选择 惩罚 LOGISTIC 回归 LASSO MCP SCAD SIS
下载PDF
基于随机化适应性Lasso的高维变量选择 被引量:3
3
作者 闫懋博 田茂再 《统计研究》 CSSCI 北大核心 2021年第1期147-160,共14页
Lasso等惩罚变量选择方法选入模型的变量数受到样本量限制。文献中已有研究变量系数显著性的方法舍弃了未选入模型的变量含有的信息。本文在变量数大于样本量即p>n的高维情况下,使用随机化bootstrap方法获得变量权重,在计算适应性La... Lasso等惩罚变量选择方法选入模型的变量数受到样本量限制。文献中已有研究变量系数显著性的方法舍弃了未选入模型的变量含有的信息。本文在变量数大于样本量即p>n的高维情况下,使用随机化bootstrap方法获得变量权重,在计算适应性Lasso时构建选择事件的条件分布并剔除系数不显著的变量,以得到最终估计结果。本文的创新点在于提出的方法突破了适应性Lasso可选变量数的限制,当观测数据含有大量干扰变量时能够有效地识别出真实变量与干扰变量。与现有的惩罚变量选择方法相比,多种情境下的模拟研究展示了所提方法在上述两个问题中的优越性。实证研究中对NCI-60癌症细胞系数据进行了分析,结果较以往文献有明显改善。 展开更多
关键词 随机化适应性Lasso 高维变量选择 选择性推断
下载PDF
基于Lasso惩罚的迹差损失方法高维协变量调整的稀疏精度矩阵估计(英文)
4
作者 黄旭东 王冠鹏 李萌萌 《应用概率统计》 CSCD 北大核心 2019年第5期441-452,共12页
本文运用两阶段估计程序给出了协变量调整的精度矩阵估计.首先,运用联合l1惩罚方法确定影响均值的相关协变量.然后,将估计出的回归系数用于估计多元次高斯模型的均值,并通过Lasso惩罚的迹差损失方法对稀疏精度矩阵进行估计.在一些假设... 本文运用两阶段估计程序给出了协变量调整的精度矩阵估计.首先,运用联合l1惩罚方法确定影响均值的相关协变量.然后,将估计出的回归系数用于估计多元次高斯模型的均值,并通过Lasso惩罚的迹差损失方法对稀疏精度矩阵进行估计.在一些假设条件下,建立了精度矩阵估计的不同范数的收敛速率,并证明了依概率1收敛的稀疏恢复性质.数值结果表明,在有限样本情况下,同其他方法相比,我们的方法具有一定的优越性. 展开更多
关键词 高维变量 回归系数矩阵 稀疏精度矩阵 迹差损失
下载PDF
纵向多分类数据的广义估计方程分析
5
作者 尹长明 代文昊 尹露阳 《应用数学》 北大核心 2024年第1期251-257,共7页
广义估计方程(GEE)是分析纵向数据的常用方法.如果响应变量的维数是一,XIE和YANG(2003)及WANG(2011)分别研究了协变量维数是固定的和协变量维数趋于无穷时,GEE估计的渐近性质.本文研究纵向多分类数据(multicategorical data)的GEE建模和... 广义估计方程(GEE)是分析纵向数据的常用方法.如果响应变量的维数是一,XIE和YANG(2003)及WANG(2011)分别研究了协变量维数是固定的和协变量维数趋于无穷时,GEE估计的渐近性质.本文研究纵向多分类数据(multicategorical data)的GEE建模和GEE估计的渐近性质.当数据的分类数大于二时,响应变量的维数大于一,所以推广了文献的相关结果. 展开更多
关键词 属性数据 纵向数据 广义估计方程 高维变量
下载PDF
协变量维数可以趋于无穷的纵向数据的广义估计方程分析 被引量:2
6
作者 尹长明 石岳鑫 《应用数学》 CSCD 北大核心 2022年第1期190-199,共10页
广义估计方程(GEE)是分析纵向数据的常用方法.Balan,Schiopu-Kratina(2005)研究了协变量维数固定,GEE估计的渐近正态性.WANG(2011)研究了协变量维数趋于无穷,GEE估计的渐近正态性和响应变量是两点分布Wald统计量的渐近分布.本文证明协... 广义估计方程(GEE)是分析纵向数据的常用方法.Balan,Schiopu-Kratina(2005)研究了协变量维数固定,GEE估计的渐近正态性.WANG(2011)研究了协变量维数趋于无穷,GEE估计的渐近正态性和响应变量是两点分布Wald统计量的渐近分布.本文证明协变量维数是固定的或趋于无穷,响应变量是任意分布的Wald统计量的渐近分布是卡方分布,Wald统计量可以直接用于统计推断. 展开更多
关键词 纵向数据 广义估计方程 高维变量 Wald统计量
下载PDF
高维纵向数据的惩罚广义估计方程分析
7
作者 尹长明 王亚东 《应用数学》 CSCD 北大核心 2021年第3期657-664,共8页
广义估计方程(GEE)是分析纵向数据下响应变量是离散的或非负的回归问题常用方法.本文研究了高维GEE的变量选择,在更弱的条件下证明了相关阵(或协方差)假定不一定正确,只要均值函数假定正确,模型选择是相合的,得到了变量选择的Oracle性质... 广义估计方程(GEE)是分析纵向数据下响应变量是离散的或非负的回归问题常用方法.本文研究了高维GEE的变量选择,在更弱的条件下证明了相关阵(或协方差)假定不一定正确,只要均值函数假定正确,模型选择是相合的,得到了变量选择的Oracle性质.改进了WANG(2011)和WANG,ZHOU,QU(2012)的结果. 展开更多
关键词 纵向数据 广义估计方程 高维变量 变量选择
下载PDF
协变量维数趋于无穷的复合次序模型的GEE估计的渐近性质
8
作者 刘永睿 尹长明 孙晗 《纯粹数学与应用数学》 2017年第6期578-584,共7页
研究了协变量维数趋于无穷的复合次序Logisti回归纵向数据模型.首先在响应变量为k个有序"状态"之一时,给出了该模型下的广义估计方程,然后给出了该广义估计方程估计的渐近存在性,相合性以及渐近正态性定理,并在较弱的条件下... 研究了协变量维数趋于无穷的复合次序Logisti回归纵向数据模型.首先在响应变量为k个有序"状态"之一时,给出了该模型下的广义估计方程,然后给出了该广义估计方程估计的渐近存在性,相合性以及渐近正态性定理,并在较弱的条件下给出了定理的证明过程,证明了该模型的可用性以及结果的稳定性,推广了文献中的相关结果. 展开更多
关键词 属性数据 高维变量 相合性 渐近正态性
下载PDF
基于lasso方法的银行对中小企业贷款供给意愿研究 被引量:3
9
作者 龙泽海 杨毅 赵月丽 《金融与经济》 北大核心 2017年第3期58-65,共8页
本文基于lasso方法研究银行对中小企业贷款的供给意愿问题,与传统的多元回归或多元选择模型相比,能更准确地筛选出重要的变量,同时给出精准的回归系数估计值。文章通过设计高维变量指标体系,使用lasso方法研究发现:企业对相关政策更多... 本文基于lasso方法研究银行对中小企业贷款的供给意愿问题,与传统的多元回归或多元选择模型相比,能更准确地筛选出重要的变量,同时给出精准的回归系数估计值。文章通过设计高维变量指标体系,使用lasso方法研究发现:企业对相关政策更多地了解、更好的财务状况、更好的融资状态、更强的供应链情况、更优良的银企关系、更现代化的企业管理模式和企业负责人更高的素质,都能提高银行对中小企业贷款的供给意愿。 展开更多
关键词 中小企业 银行贷款 供给意愿 lasso方法 高维变量选择
下载PDF
基于新型高维代理模型的气动外形设计方法 被引量:2
10
作者 赵欢 高正红 夏露 《航空学报》 EI CAS CSCD 北大核心 2023年第5期131-147,共17页
随着现代飞行器性能需求的不断提高,飞行器精细化气动优化设计要求更高可信度的CFD数值分析及更多的独立设计变量,使得基于代理模型的全局优化算法在超过一定的设计变量后显著降低了效率,难以满足复杂工程的设计需求。而目前的高维代理... 随着现代飞行器性能需求的不断提高,飞行器精细化气动优化设计要求更高可信度的CFD数值分析及更多的独立设计变量,使得基于代理模型的全局优化算法在超过一定的设计变量后显著降低了效率,难以满足复杂工程的设计需求。而目前的高维代理模型过程复杂、时间花费高,缺乏对工程问题的广泛适应性。针对以上难题,提出了利用监督式非线性降维代理建模方法来缓解代理优化过程中的高维变量设计难题。该方法将核主成分分析(非线性)降维与高斯回归过程模型统一训练,自适应构建新型高维代理模型,并随着优化过程不断学习改进模型,建立了从高维输入到输出的准确映射,有效解决了传统高维代理模型训练时间花费高和适应性差等难题。然后基于该新型代理模型发展了适用于飞行器复杂气动设计的高维全局优化设计方法,并将其应用到美国航空航天学会(AIAA)优化小组发布的2个复杂跨声速优化算例中。通过与传统代理优化方法全面比较,验证了所提的方法能大幅提高飞行器高维变量全局优化效率和全局寻优能力。 展开更多
关键词 精细化气动优化 基于代理模型的优化设计 全局优化 高维变量 非线性降维代理模型 高维优化设计
原文传递
基于时间卷积网络与图注意力网络的分行业日售电量预测方法 被引量:9
11
作者 顾默 赵兵 陈昊 《电网技术》 EI CSCD 北大核心 2022年第4期1287-1296,共10页
为控制电力成本及提高电力部门绩效考核能力,需要高效准确地进行日售电量预测。深度学习卷积神经网络常被用于电力数据预测,但由于其输入数据信息量有限,现有模型预测存在上限,致使其存在难以捕捉长时特征等问题。为高效准确地预测日售... 为控制电力成本及提高电力部门绩效考核能力,需要高效准确地进行日售电量预测。深度学习卷积神经网络常被用于电力数据预测,但由于其输入数据信息量有限,现有模型预测存在上限,致使其存在难以捕捉长时特征等问题。为高效准确地预测日售电量,提出了一种基于时间卷积网络与图注意力网络相结合的分行业日售电量预测方法,搭建了高维度分行业日售电量预测模型。该方法可同时输入多个行业的日售电量,提取反映单个行业时序特征的高维变量,将多个行业的高维变量进行拼接学习,得到各行业之间的影响因素。通过多个行业日售电量的集成增加输入数据的信息量,从而实现各行业的日售电量预测。以中国东南某城市的21个行业日售电量为实际算例,上述方法的平均误差为4.03%。与时间卷积网络、门控循环单元网络、Facebook的Prophet模型、M4冠军模型指数平滑递归神经网络等进行对比,实验表明,所提出的分行业日售电量预测模型具有更高的预测精度。 展开更多
关键词 日售电量预测 时间卷积网络 图注意力网络 高维变量 时序特征
下载PDF
基于D藤结构Copula函数的风险资产投资决策模型与运用 被引量:1
12
作者 谢铖 《统计与决策》 CSSCI 北大核心 2021年第5期174-178,共5页
文章基于D藤结构Copula函数构建风险收益调整法组合投资决策模型。选取我国证监会行业板块中诸板块中相应风险资产,在反映单一资产间相关关系及其与上证综指收益率间"厚尾"结构基础上,实施风险资产组合投资决策。研究显示:(1... 文章基于D藤结构Copula函数构建风险收益调整法组合投资决策模型。选取我国证监会行业板块中诸板块中相应风险资产,在反映单一资产间相关关系及其与上证综指收益率间"厚尾"结构基础上,实施风险资产组合投资决策。研究显示:(1)从金融风险联动性角度,被考察的行业中,普通机械制造业行业指数对其他行业指数的影响最大,其次为银行业指数和房地产开发与经营业行业指数,电力蒸汽热气生产行业指数对其他指数影响最小;(2)D藤Copula-GARCH模型对刻画风险资产间的"厚尾"特性更占优;(3)D藤Copula-GARCH-t模型在优化风险资产组合决策中更具决策效能。 展开更多
关键词 金融风险联动 D藤结构Copula函数 风险厌恶系数 风险资产投资 高维变量非线性结构
下载PDF
两阶段Logit模型的惩罚广义估计方程估计的渐近性质 被引量:1
13
作者 林松 尹长明 《广西师范大学学报(自然科学版)》 CAS 北大核心 2019年第2期126-130,共5页
2012年Wang等在较弱条件下证明了经典Logit模型惩罚广义估计方程估计的渐近性质。两阶段Logit模型是经典Logit模型的推广,可以处理较复杂的属性数据,其联系函数(link)已不再是自然联系函数。本文在更弱条件下证明了两阶段Logit模型惩罚... 2012年Wang等在较弱条件下证明了经典Logit模型惩罚广义估计方程估计的渐近性质。两阶段Logit模型是经典Logit模型的推广,可以处理较复杂的属性数据,其联系函数(link)已不再是自然联系函数。本文在更弱条件下证明了两阶段Logit模型惩罚广义估计方程估计的渐近性质,推广了文献中的相应结果。 展开更多
关键词 两阶段Logit回归 惩罚广义估计方程 高维变量 纵向数据 一般联系函数
下载PDF
对参数带约束条件的生存模型的回归分析
14
作者 邓立凤 韦程东 《数学建模及其应用》 2019年第2期1-10,共10页
为了降低成本、提高研究效率,对与时间相依的数据,有偏抽样方法是广泛应用的基础抽样方法.在建模过程中,它可以从参数的先验信息中提取更有价值的信息.随着数字信息的发展,在许多领域都可以收集到协变量维数大于样本容量的高维数据.变... 为了降低成本、提高研究效率,对与时间相依的数据,有偏抽样方法是广泛应用的基础抽样方法.在建模过程中,它可以从参数的先验信息中提取更有价值的信息.随着数字信息的发展,在许多领域都可以收集到协变量维数大于样本容量的高维数据.变量选择法和独立筛选法是非常有效的降维方法.在比例风险模型中,对参数带有约束条件的回归分析,采用了修正的MM算法,但对不同的模型,此优化算法不再适用.为了克服优化问题的计算复杂难实现的困难,将蚁群算法和粒子群算法等优化算法应用到参数带约束条件的回归分析中. 展开更多
关键词 删失数据 高维变量 带约束条件的估计 生存模型 优化算法
下载PDF
高维线性模型中的经验似然 被引量:3
15
作者 石坚 《系统科学与数学》 CSCD 北大核心 2007年第1期124-133,共10页
研究高维线性模型中的经验似然推断.当协变量的维数随样本量增加时,常规的经验似然推断失效.在适当的正则条件下,对修正的经验似然比统计量给出了渐近分布理论.
关键词 线性模型 经验似然 高维变量
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部