期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
降低方差的深度确定性策略梯度算法 被引量:1
1
作者 赵国庆 徐君明 刘爱东 《兵工自动化》 2022年第6期41-46,共6页
针对高方差现象导致训练过程不稳定、算法性能下降的问题,提出一种降低方差的深度确定性策略梯度算法(reduction variance deep deterministic policy gradient,RV-DDPG)。通过延迟更新目标策略的方法,减少误差出现次数,降低误差的累计... 针对高方差现象导致训练过程不稳定、算法性能下降的问题,提出一种降低方差的深度确定性策略梯度算法(reduction variance deep deterministic policy gradient,RV-DDPG)。通过延迟更新目标策略的方法,减少误差出现次数,降低误差的累计;通过平滑目标策略的方法,减小单步误差,稳定方差。将RV-DDPG算法、传统深度确定性策略梯度算法(deep deterministic policy gradient,DDPG)和目前广泛应用的异步优势行动者评论家算法(asynchronous advantage actor-critic,A3C)应用于Pendulum、Mountain Car Continues和Half Cheetah问题。实验结果表明:RV-DDPG具有更好的收敛性和稳定性,证明了该算法降低方差的有效性。 展开更多
关键词 强化学习 DDPG 平滑目标策略 策略延迟更新 降低方差
下载PDF
基于最优抽样与选择性解析的电力系统可靠性评估 被引量:23
2
作者 宋晓通 谭震宇 《电力系统自动化》 EI CSCD 北大核心 2009年第5期29-33,60,共6页
为降低Monte Carlo法的计算方差,加快电力系统可靠性评估的速度,提出一种基于最优抽样和选择性解析的混合算法。该算法是在传统Monte Carlo法的基础上,增加小样本预抽样计算,以获得最优抽样密度函数与各变量的投影方差。根据投影方差的... 为降低Monte Carlo法的计算方差,加快电力系统可靠性评估的速度,提出一种基于最优抽样和选择性解析的混合算法。该算法是在传统Monte Carlo法的基础上,增加小样本预抽样计算,以获得最优抽样密度函数与各变量的投影方差。根据投影方差的大小,确定解析变量,进行解析化处理,对模拟变量按照最优抽样密度函数抽取元件状态。对测试系统IEEE-RTS的算例分析表明,该算法可以同时提高抽样计算和解析计算的效率,降低计算方差,加快可靠性评估的速度。 展开更多
关键词 电力系统可靠性评估 MONTE Carlo法 解析法 混合法 降低方差
下载PDF
你也需要蒙特卡罗方法——提高应用水平的若干技巧 被引量:9
3
作者 杨自强 《数理统计与管理》 CSSCI 北大核心 2007年第2期365-376,共12页
本文是《你也需要蒙特卡罗方法》中的第二篇。文中讨论提高应用水平的一些技巧,涉及模拟模型的选取,提高计算速度或降低抽样方差的一些方法,诸如重要抽样、相关抽样、对偶抽样和分层抽样等。还讨论了模拟中所需的抽样次数的确定和模拟... 本文是《你也需要蒙特卡罗方法》中的第二篇。文中讨论提高应用水平的一些技巧,涉及模拟模型的选取,提高计算速度或降低抽样方差的一些方法,诸如重要抽样、相关抽样、对偶抽样和分层抽样等。还讨论了模拟中所需的抽样次数的确定和模拟结果的精度评估等实用问题。 展开更多
关键词 统计模拟 加速方法 降低方差 蒲丰投针 重要抽样 对偶抽样 分层抽样
下载PDF
加工工序对配方烟丝混合效果的影响 被引量:1
4
作者 刘栋 陈越立 +5 位作者 张志明 曾静 李华杰 卢新万 堵劲松 罗登山 《烟草科技》 EI CAS 北大核心 2013年第8期11-14,23,共5页
以CO2膨胀烟丝作为示踪物探索建立了一种以示踪物的均匀性评价配方烟丝混合效果的方法,并利用该方法研究了不同加工工序烟丝混合效果的变化规律。结果表明:从一级混配柜出口到卷烟机出口,配方烟丝中膨胀烟丝含量的标准偏差从2.139%降低... 以CO2膨胀烟丝作为示踪物探索建立了一种以示踪物的均匀性评价配方烟丝混合效果的方法,并利用该方法研究了不同加工工序烟丝混合效果的变化规律。结果表明:从一级混配柜出口到卷烟机出口,配方烟丝中膨胀烟丝含量的标准偏差从2.139%降低到0.483%,烟丝混合均匀度明显提高;其中加香机和卷烟机的方差降低指数分别为5.389和6.387,其混合能力明显高于其他加工环节,而风送环节烟丝混合的均匀度有所降低。 展开更多
关键词 烟丝 示踪物 混合效果 加工工序 方差降低指数
下载PDF
资产跳跃下CM策略多期收入保证价格模拟——基于条件蒙特卡罗方法
5
作者 何志权 《运筹学学报》 CSCD 北大核心 2017年第1期87-102,共16页
恒定混合策略(CM策略)多期收入保证价格是保本基金发行方采取设置止损的CM策略作为投资策略时收取保本费的理论依据,其中标的资产由复合泊松过程和维纳过程共同驱动,这一定价问题内嵌奇异期权,蒙特卡罗模拟方法擅长处理这种高维数量金... 恒定混合策略(CM策略)多期收入保证价格是保本基金发行方采取设置止损的CM策略作为投资策略时收取保本费的理论依据,其中标的资产由复合泊松过程和维纳过程共同驱动,这一定价问题内嵌奇异期权,蒙特卡罗模拟方法擅长处理这种高维数量金融问题.基于风险中性测度推导出多期收入保证价格的现值表达式,用条件蒙特卡罗推导出这一现值表达式的模拟公式.在给定参数下分别用普通蒙特卡罗和条件蒙特卡罗计算CM策略多期收入保证价格的数值解,结果显示两种蒙特卡罗方法均能有效计算其数值解,之后通过给定显著性水平下的置信区间长度评价两种方法的精确度,结果显示条件蒙特卡罗比普通蒙特卡罗有很大改进.接着运用条件蒙特卡罗模拟研究多期收入保证价格对不同参数范围的变化情况. 展开更多
关键词 CM策略 降低方差技术 条件蒙特卡罗 路径依赖 跳过程
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部