期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于网络关系的分类变量预测研究
1
作者 丁月 方匡南 +1 位作者 兰伟 徐顺 《统计研究》 北大核心 2024年第1期148-156,共9页
传统的预测方法通常基于个体的协变量信息进行建模和预测,少有考虑个体间的网络结构信息。事实上,网络节点间的关联信息能够为节点的响应变量预测提供信息,为此本文提出网络标签传播算法。基于半监督学习框架,以邻接矩阵为节点相似性推... 传统的预测方法通常基于个体的协变量信息进行建模和预测,少有考虑个体间的网络结构信息。事实上,网络节点间的关联信息能够为节点的响应变量预测提供信息,为此本文提出网络标签传播算法。基于半监督学习框架,以邻接矩阵为节点相似性推断依据,通过节点间的连接信息和已知节点的响应变量信息,来推断未知节点的响应变量信息。该算法适用于响应变量为分类变量的不完整网络数据。在网络服从随机分块模型的设定下,本文证明了该算法能够一致地预测未知节点的响应变量。数值模拟和实证数据分析结果显示,该算法预测效果较好。 展开更多
关键词 不完整网络 网络插补 网络标签传播 分类变量 信用风险评估
下载PDF
基于多尺度时序建模与估计的电力负荷数据恢复 被引量:16
2
作者 张帅 杨晶显 +2 位作者 刘继春 刘俊勇 林华珍 《电工技术学报》 EI CSCD 北大核心 2020年第13期2736-2746,共11页
针对电力负荷数据缺损及失真问题,从时序数据特性分析及建模与估计的角度给出负荷数据补全与恢复的方法。运用马尔科夫链与序贯蒙特卡洛模拟联合法抽取负荷统计特性;基于电力负荷波动的年、月、周、日的多尺度时序特征分析,建立电力负... 针对电力负荷数据缺损及失真问题,从时序数据特性分析及建模与估计的角度给出负荷数据补全与恢复的方法。运用马尔科夫链与序贯蒙特卡洛模拟联合法抽取负荷统计特性;基于电力负荷波动的年、月、周、日的多尺度时序特征分析,建立电力负荷的多尺度时序特征建模。引入B-spline基函数展开法解决负荷模型的非参、变系数问题,并给出负荷模型中关键参数的估计方法。采取误差多指标评判方法确定B-spline节点最优数量与样条最优次数。根据所得负荷恢复模型提出周尺度的电力负荷缺失数据恢复方法,并给出年度等长时段日负荷数据恢复思路。经实际算例验证,该文所提方法准确有效,具备工程应用价值。 展开更多
关键词 电力负荷恢复 负荷统计特性抽取 多尺度时序建模 样条次数 误差衡量指标
下载PDF
风电外送断面极限输电能力的非参数回归估计 被引量:4
3
作者 刘挺坚 刘友波 +3 位作者 刘若凡 刘俊勇 林华珍 葛从 《电网技术》 EI CSCD 北大核心 2017年第11期3514-3522,共9页
大规模风电的随机性和间歇性导致基于典型方式计算的通道极限输电能力(total transfer capability,TTC)有效性降低。提出一种TTC非参数回归估计技术,通过风电与负荷场景聚类形成代表性中心,采用二分法重复潮流计算各场景下含稳定约束的... 大规模风电的随机性和间歇性导致基于典型方式计算的通道极限输电能力(total transfer capability,TTC)有效性降低。提出一种TTC非参数回归估计技术,通过风电与负荷场景聚类形成代表性中心,采用二分法重复潮流计算各场景下含稳定约束的断面TTC值,提取各场景与所属中心场景间的属性偏差及TTC偏差作为特征数据样本,经过相关性检验与非参独立筛选后,利用基于三次B样条函数展开的Group Lasso算法对TTC偏差进行非参数回归估计。算例验证表明,该方法具备较强的非线性泛化能力,能以较高精度提取输电断面TTC运行规则的显性表达式,与传统方法相比具有更丰富的信息输出与更良好的解释性,可用于含风电外送断面电力系统TTC的在线快速估计。 展开更多
关键词 风电 极限输电能力 运行规则 非参独立筛选 GROUP Lasso算法
下载PDF
我国股票市场可以预测吗?——基于组合LASSO-logistic方法的视角 被引量:8
4
作者 贺平 兰伟 丁月 《统计研究》 CSSCI 北大核心 2021年第5期82-96,共15页
本文研究了上市公司的41个特征变量对我国股票收益率样本外的可预测性。基于2010年1月至2019年10月上市公司的财务及股票交易数据,本文采用机器学习驱动的组合LASSO-logistic算法解决了股票预测中存在的3个问题:(1)特征变量不足导致股... 本文研究了上市公司的41个特征变量对我国股票收益率样本外的可预测性。基于2010年1月至2019年10月上市公司的财务及股票交易数据,本文采用机器学习驱动的组合LASSO-logistic算法解决了股票预测中存在的3个问题:(1)特征变量不足导致股票异象因子构建不全面问题,(2)特征变量构建过多而存在的"维度灾难"问题,(3)特征变量之间的高相关性导致预测不稳定问题。研究结果显示,组合LASSO-logistic算法能够有效识别特征变量与预期收益之间的复杂关系,其投资组合资产配置的策略能够比传统多元Logistic算法、支持向量机(SVM)算法和随机森林算法得到更高的超额回报。同时,本文发现影响股票预期收益的公司特征变量并非一成不变,其显著的动态变化在一定程度上提示了我国股票市场的弱稳定性。 展开更多
关键词 横截面收益预测 资产配置策略 我国股票市场 组合LASSO-logistic方法
下载PDF
多变点检测问题的Shape-based BS算法 被引量:5
5
作者 庄丹 刘友波 马铁丰 《高校应用数学学报(A辑)》 北大核心 2019年第2期151-164,共14页
BS算法是时间序列多变点检测中最经典的算法之一,但是基于全局CUSUM统计量的识别过程会带来过多误判和较高的时间复杂度.BS算法是一种离线的序贯方法,因此没有充分利用数据的时序信息;另一方面,BS算法识别变点的原则是CUSUM统计量最大化... BS算法是时间序列多变点检测中最经典的算法之一,但是基于全局CUSUM统计量的识别过程会带来过多误判和较高的时间复杂度.BS算法是一种离线的序贯方法,因此没有充分利用数据的时序信息;另一方面,BS算法识别变点的原则是CUSUM统计量最大化,也没有考虑统计量构成序列的形态特性.鉴于此,提出一种基于局部形态识别的BS改进算法,命名为Shape-based BS算法.基于局部形态识别统计量,不仅大大降低计算复杂度,且降低了因变点间的互相干扰而带来的误判率,进而提升变点识别的稳健性.最后,将此算法应用到了电力系统的"场景压缩"问题上,具有满意的实用效果. 展开更多
关键词 多变点检测 Shape-based BS算法 形态识别 场景压缩
下载PDF
有限二阶矩情形与重尾情形下的Hurst参数
6
作者 吴量 《数学物理学报(A辑)》 CSCD 北大核心 2020年第4期1072-1082,共11页
Hurst参数被广泛应用于序列长记忆性与自相似性的刻画.该文从最初计算Hurst参数的R/S统计量出发,在有限二阶矩与重尾两种情形下,讨论R/S统计量计算的Hurst参数与自相似性、长记忆性及重尾特性之间的关系.在有限二阶矩情形下,R/S统计量... Hurst参数被广泛应用于序列长记忆性与自相似性的刻画.该文从最初计算Hurst参数的R/S统计量出发,在有限二阶矩与重尾两种情形下,讨论R/S统计量计算的Hurst参数与自相似性、长记忆性及重尾特性之间的关系.在有限二阶矩情形下,R/S统计量计算的Hurst参数与自相似参数一致,并能刻画协方差定义的长记忆性.在无限二阶矩的重尾情形下,联系Hurst参数与长记忆性的协方差可能无限,很难讨论他们之间的关系.而R/S统计量与自相似参数及尾指数也没有必然联系.该内容能使已被广泛应用的Hurst参数的实际含义更清晰. 展开更多
关键词 HURST参数 长记忆性 重尾 自相似性 分数布朗运动
下载PDF
非平衡样本下基于生成对抗网络过抽样技术的公司债券违约风险预测研究 被引量:5
7
作者 姚潇 李可 余乐安 《系统工程理论与实践》 EI CSSCI CSCD 北大核心 2022年第10期2617-2634,共18页
本文基于我国在公开市场发行过信用类债券的违约数据,利用了基于Wasserstein距离的生成对抗网络模型和SMOTE抽样技术对违约样本进行过抽样以提高非平衡样本下违约风险模型的预测效果.为检验过抽样技术对分类模型的改进效果,实证分析对... 本文基于我国在公开市场发行过信用类债券的违约数据,利用了基于Wasserstein距离的生成对抗网络模型和SMOTE抽样技术对违约样本进行过抽样以提高非平衡样本下违约风险模型的预测效果.为检验过抽样技术对分类模型的改进效果,实证分析对不同的重抽样样本类别比例下分类模型的预测结果进行比较.研究结果表明过抽样技术能够显著地分类模型的预测精度,而且预测效果随着样本类别比例达到平衡而不断提高.和经典的SMOTE抽样技术相比,基于Wasserstein距离的生成对抗网络过抽样技术不仅可以提高分类模型的AUC指标,同时还能显著地改进F1得分.研究结果表明通过生成对抗网络对少数类样本进行过抽样能够显著地提升机器学习算法对债券违约风险的预测效果,为研究非平衡样本下的债券违约风险预测提供一种新的解决思路. 展开更多
关键词 债券违约风险 生成对抗网络 非平衡样本分类 过抽样技术
原文传递
金融发展、创新与二氧化碳排放 被引量:263
8
作者 严成樑 李涛 兰伟 《金融研究》 CSSCI 北大核心 2016年第1期14-30,共17页
本文构建了一个包含金融发展、创新和二氧化碳排放的内生增长模型,考察了金融发展对二氧化碳强度的影响。理论模型的分析表明,金融发展与二氧化碳强度之间存在倒U型关系。原因是,一方面,金融发展水平越高,技术水平越高,从而二氧化碳强... 本文构建了一个包含金融发展、创新和二氧化碳排放的内生增长模型,考察了金融发展对二氧化碳强度的影响。理论模型的分析表明,金融发展与二氧化碳强度之间存在倒U型关系。原因是,一方面,金融发展水平越高,技术水平越高,从而二氧化碳强度越低;另一方面,金融发展水平越高,经济增长率越高,能源消耗和二氧化碳排放越多;上述两种作用之间存在一个权衡。在此基础上,运用我国30个省份1997—2012年的数据,本文通过面板数据模型考察了金融发展对二氧化碳强度的影响。实证研究结果显示,信贷规模对我国二氧化碳强度的影响存在倒U型关系,FDI规模对我国二氧化碳强度的影响存在U型关系,金融市场融资规模、金融业的竞争、信贷资金分配的市场化对我国二氧化碳强度有负向影响。本文认为,应更好的发挥金融发展的技术提升效应,通过金融发展和创新实现我国经济的绿色发展、低碳发展。 展开更多
关键词 金融发展 创新 二氧化碳强度 经济增长
原文传递
门槛回归模型中门槛值和回归参数的估计 被引量:4
9
作者 蒋家坤 林华珍 +1 位作者 蒋靓 YIP Paul Siu Fai 《中国科学:数学》 CSCD 北大核心 2016年第4期409-422,共14页
门槛模型中有两个关键问题:门槛个数的选择和门槛参数的估计.本文提出的判罚光滑最小二乘方法同时解决这两个问题.本文的方法避免了为确定门槛个数所需的假设检验,计算简单.回归参数估计被证明是n-^(1/2)相合且渐近正态,门槛参数估计被... 门槛模型中有两个关键问题:门槛个数的选择和门槛参数的估计.本文提出的判罚光滑最小二乘方法同时解决这两个问题.本文的方法避免了为确定门槛个数所需的假设检验,计算简单.回归参数估计被证明是n-^(1/2)相合且渐近正态,门槛参数估计被证明是(n/h-)^(1/2)相合且渐近正态.数值模拟和实际例子结果显示本文方法有效可行. 展开更多
关键词 门槛模型 光滑最小二乘 SCAD(smoothly clipped ABSOLUTE deviation)判罚
原文传递
基于混合效应模型的医保费用测算及监控 被引量:1
10
作者 李好奇 林华珍 +2 位作者 张兴凤 朱玉峰 张伟 《数理统计与管理》 CSSCI 北大核心 2015年第6期1040-1047,共8页
近几年医改的一个核心内容就是医保支付方式的改革。2012年12月,人力资源和社会保障部、财政部、卫生部三部门联合出台了《关于开展基本医疗保险付费总额控制的意见》,提出在未来两年里,在所有医疗保险统筹地区实行总额预付工作。实行... 近几年医改的一个核心内容就是医保支付方式的改革。2012年12月,人力资源和社会保障部、财政部、卫生部三部门联合出台了《关于开展基本医疗保险付费总额控制的意见》,提出在未来两年里,在所有医疗保险统筹地区实行总额预付工作。实行总额预付制的关键是如何科学合理的测算每家医院的预算总额。本文利用线性混合效应模型分别对某市684家医院的病人数,平均费用进行建模,给出每一家医院来年医保费用的合理参考,并且利用模型中的随机效应项自动识别医保费用和病人数异常的医院,为医保监管机构的监管提供科学依据。 展开更多
关键词 总额预付 医保费用 随机效应
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部