期刊文献+
共找到6篇文章
< 1 >
每页显示 20 50 100
有样本重用的阶段性策略梯度深度强化学习
1
作者 李海亮 王莉 《太原理工大学学报》 CAS 北大核心 2024年第4期712-719,共8页
【目的】针对基于策略的深度强化学习算法中存在的样本不能重复利用、样本利用率低的问题,提出一种有样本重用的阶段性策略梯度算法(phasic policy gradient with sample reuse,SR-PPG).【方法】该算法在阶段性策略梯度算法(phasic poli... 【目的】针对基于策略的深度强化学习算法中存在的样本不能重复利用、样本利用率低的问题,提出一种有样本重用的阶段性策略梯度算法(phasic policy gradient with sample reuse,SR-PPG).【方法】该算法在阶段性策略梯度算法(phasic policy gradient,PPG)的基础上引入离线数据,从而减小训练的时间成本,使模型能够快速收敛。在这项工作中,SR-PPG将理论上支持的在线策略算法的稳定性优势与离线策略算法的样本效率相结合,开发了适用于离线策略设置的策略改进保证,并将这些界限与阶段性策略梯度算法使用的剪裁机制联系起来。【结果】一系列理论和实验证明,该算法通过有效平衡稳定性和样本效率这两个相互竞争的目标,提供了更好的性能。 展开更多
关键词 深度强化学习 阶段性策略梯度 样本重用
下载PDF
基于小样本重用的新型混合盲均衡算法研究
2
作者 朱婷婷 《电子设计工程》 2016年第16期98-100,104,共4页
随着人们对通信质量和速度的要求越来越高,传统均衡技术暴露出了越来越多的缺点。混合盲均衡算法因为其高效、适应度高的特点,成为了均衡领域的一个热点。该文提出了一种基于小样本重用的新型混合盲均衡算法。算法利用小样本重用技术重... 随着人们对通信质量和速度的要求越来越高,传统均衡技术暴露出了越来越多的缺点。混合盲均衡算法因为其高效、适应度高的特点,成为了均衡领域的一个热点。该文提出了一种基于小样本重用的新型混合盲均衡算法。算法利用小样本重用技术重新设计均衡器加权系数,提高算法收敛效率,并引入常范数盲均衡算法,通过计算机仿真验证了了新算法有效性,可以极大的降低系统的稳态误差,提高收敛效率。 展开更多
关键词 盲均衡 常范数 样本重用 混合算法
下载PDF
多景影像监督分类的样本重用研究 被引量:1
3
作者 于基业 张新利 李珊 《测绘通报》 CSCD 北大核心 2014年第1期60-62,85,共4页
对于地理国情监测、地表覆盖等大范围、大数据量、多人参与的遥感监督分类工作,其影像重叠区的样本选择具有盲目性,不便于管理,其分类的成果接边效果不佳,导致作业效率不高。针对上述问题,本文从数据工程角度出发,研究影像重叠区样本重... 对于地理国情监测、地表覆盖等大范围、大数据量、多人参与的遥感监督分类工作,其影像重叠区的样本选择具有盲目性,不便于管理,其分类的成果接边效果不佳,导致作业效率不高。针对上述问题,本文从数据工程角度出发,研究影像重叠区样本重用的方法,构建了接边样本库,实现了多幅相邻影像重用公共的样本点,既减少了样本采集工作量,又保证了影像接边的分类一致性;最后以某区域的TM影像植被分类提取进行试验,试验结果证明了该方法的可行性与实用性。 展开更多
关键词 监督分类 影像重叠 样本重用 接边一致性
下载PDF
基于改进型模糊ARTMAP网络的CBR遥感图像分类系统研究 被引量:1
4
作者 唐晓亮 韩敏 《中国图象图形学报》 CSCD 北大核心 2007年第6期1033-1040,共8页
针对难以及时地获取充足而准确的遥感样本、缺乏积累和管理遥感样本的有效手段是制约遥感图像分类技术发展的瓶颈问题。构建了基于改进型模糊ARTMAP网络的CBR(case-based reasoning范例推理)遥感图像分类系统。系统将改进型模糊ARTMAP... 针对难以及时地获取充足而准确的遥感样本、缺乏积累和管理遥感样本的有效手段是制约遥感图像分类技术发展的瓶颈问题。构建了基于改进型模糊ARTMAP网络的CBR(case-based reasoning范例推理)遥感图像分类系统。系统将改进型模糊ARTMAP网络作为范例的知识提取器和图像分类器,运用CBR求解策略实现遥感样本知识的合理储备、优化组合和重复利用。分别应用本文所建系统、最大似然法、BP网络和改进型模糊ARTMAP网络对向海自然保护区TM遥感图像进行分类操作,实验结果表明,本文建立的系统与其他分类方法相比,能够更好地提高遥感样本数据的利用效率和遥感图像的分类精度,而且一定程度上解决了在样本有限的条件下如何高效利用已有数据进行遥感图像分类的问题。 展开更多
关键词 范例推理 遥感 分类 样本重用
下载PDF
基于改进加权响应面的结构可靠度计算方法 被引量:4
5
作者 吴洁 张建国 +1 位作者 游令非 叶楠 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2021年第8期1638-1645,共8页
在结构可靠度分析中,响应面法由于具有良好的适用性和可操作性,是目前广泛使用的基于代理模型的分析方法。针对响应面法的计算效率和精度难以平衡兼顾等难点问题,提出一种基于改进加权响应面的结构可靠度计算方法。首先,在迭代过程中,... 在结构可靠度分析中,响应面法由于具有良好的适用性和可操作性,是目前广泛使用的基于代理模型的分析方法。针对响应面法的计算效率和精度难以平衡兼顾等难点问题,提出一种基于改进加权响应面的结构可靠度计算方法。首先,在迭代过程中,同时考虑样本点与验算点距离、极限状态函数值、联合概率密度函数值3个权重因子对样本点进行赋权,采用加权回归并重复利用已有样本点更新不含交叉项的二次多项式响应面函数。其次,在迭代收敛后,选取已有样本点中权重较大的样本点加权拟合含有交叉项的二次多项式响应面函数。最后,结合数值算例和工程案例,通过与传统抽样方法和其他响应面法进行对比,验证了改进加权响应面法的可行性。结果表明所提方法具有较高效率的同时也保证了精度。 展开更多
关键词 结构可靠度 响应面法 响应面函数 加权回归 样本重用
下载PDF
一种改进响应面法结构可靠度计算方法 被引量:10
6
作者 张学刚 《机械强度》 CAS CSCD 北大核心 2018年第6期1382-1388,共7页
为了减少设计的样本点以及充分利用样本点信息资源,采用了一种改进响应面法结构可靠度计算方法。利用可靠度指标作为收敛条件,在迭代过程中采用混合响应面法,即第一次迭代响应函数采用一次多项式,其余迭代步都采用不含交叉项的二次多项... 为了减少设计的样本点以及充分利用样本点信息资源,采用了一种改进响应面法结构可靠度计算方法。利用可靠度指标作为收敛条件,在迭代过程中采用混合响应面法,即第一次迭代响应函数采用一次多项式,其余迭代步都采用不含交叉项的二次多项式,在迭代收敛后运用样本重用思想并利用加权响应面法来逼近真实的极限状态方程,即从所有样本点中选取靠近真实失效曲线处的样本点利用含交叉项的完全二次多项式并对所选样本点进行加权来构造响应曲线,最后通过蒙特卡洛抽样的方法计算可靠度。多个数值算例表明,该方法构造出的响应曲线能够很好地逼近失效曲线,有效地提高可靠度计算精度,同时采用混合响应面法可以减少设计的样本点,在工程应用中可减少计算时间。 展开更多
关键词 结构可靠度 样本重用 混合响应面 加权响应面蒙 特卡洛
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部