期刊文献+
共找到100篇文章
< 1 2 5 >
每页显示 20 50 100
演化算法的DQN网络参数优化方法
1
作者 曹子建 郭瑞麒 +2 位作者 贾浩文 李骁 徐恺 《西安工业大学学报》 CAS 2024年第2期219-231,共13页
为了解决DQN(Deep Q Network)在早期会出现盲目搜索、勘探利用不均并导致整个算法收敛过慢的问题,从探索前期有利于算法训练的有效信息获取与利用的角度出发,以差分演化(Differential Evolution)算法为例,提出了一种基于演化算法优化DQ... 为了解决DQN(Deep Q Network)在早期会出现盲目搜索、勘探利用不均并导致整个算法收敛过慢的问题,从探索前期有利于算法训练的有效信息获取与利用的角度出发,以差分演化(Differential Evolution)算法为例,提出了一种基于演化算法优化DQN网络参数以加快其收敛速度的方法(DE-DQN)。首先,将DQN的网络参数编码为演化个体;其次,分别采用“运行步长”和“平均回报”两种适应度函数评价方式;利用CartPole控制问题进行仿真对比,验证了两种评价方式的有效性。最后,实验结果表明,在智能体训练5 000代时所提出的改进算法,以“运行步长”为适应度函数时,在运行步长、平均回报和累计回报上分别提高了82.7%,18.1%和25.1%,并优于改进DQN算法;以“平均回报”为适应度函数时,在运行步长、平均回报和累计回报上分别提高了74.9%,18.5%和13.3%并优于改进DQN算法。这说明了DE-DQN算法相较于传统的DQN及其改进算法前期能获得更多有用信息,加快收敛速度。 展开更多
关键词 深度强化学习 深度q网络 收敛加速 演化算法 自动控制
下载PDF
基于改进Q学习算法的无人物流配送车路径规划 被引量:2
2
作者 王小康 冀杰 +1 位作者 刘洋 贺庆 《系统仿真学报》 CAS CSCD 北大核心 2024年第5期1211-1221,共11页
为解决传统的Q学习算法用于无人车路径规划时,存在规划效率低和收敛速度慢等问题,为此,提出一种基于改进Q学习算法的无人物流配送车路径规划算法。借鉴模拟退火算法的能量迭代原理,对贪婪因子ε进行调整,使其在训练过程中动态变化,以平... 为解决传统的Q学习算法用于无人车路径规划时,存在规划效率低和收敛速度慢等问题,为此,提出一种基于改进Q学习算法的无人物流配送车路径规划算法。借鉴模拟退火算法的能量迭代原理,对贪婪因子ε进行调整,使其在训练过程中动态变化,以平衡探索与利用之间的关系,提高规划效率。将奖励机制中的奖励值由离散值变为连续值,并使其随着无人物流配送车与目标点的欧式距离减小而增大,让目标点牵引无人物流配送车移动以加快算法收敛速度。在两种不同的环境下对改进的Q学习算法进行仿真实验,结果表明:改进后的Q学习算法可以高效地规划出一条从起始点至目标点的路径,步数为34步,优于对比算法的路径质量。通过改变道路环境,验证了改进Q学习算法对不同环境的适应性,规划效率和收敛速度依然优于传统Q学习算法。 展开更多
关键词 q学习 路径规划 收敛速度 规划效率 路径质量
下载PDF
基于多步信息辅助的Q-learning路径规划算法
3
作者 王越龙 王松艳 晁涛 《系统仿真学报》 CAS CSCD 北大核心 2024年第9期2137-2148,共12页
为提升静态环境下移动机器人路径规划能力,解决传统Q-learning算法在路径规划中收敛速度慢的问题,提出一种基于多步信息辅助机制的Q-learning改进算法。利用ε-greedy策略中贪婪动作的多步信息与历史最优路径长度更新资格迹,使有效的资... 为提升静态环境下移动机器人路径规划能力,解决传统Q-learning算法在路径规划中收敛速度慢的问题,提出一种基于多步信息辅助机制的Q-learning改进算法。利用ε-greedy策略中贪婪动作的多步信息与历史最优路径长度更新资格迹,使有效的资格迹在算法迭代中持续发挥作用,用保存的多步信息解决可能落入的循环陷阱;使用局部多花朵的花授粉算法初始化Q值表,提升机器人前期搜索效率;基于机器人不同探索阶段的目的,结合迭代路径长度的标准差与机器人成功到达目标点的次数设计动作选择策略,以增强算法对环境信息探索与利用的平衡能力。实验结果表明:该算法具有较快的收敛速度,验证了算法的可行性与有效性。 展开更多
关键词 路径规划 q-LEARNING 收敛速度 动作选择策略 栅格地图
下载PDF
Schurer型q-Phillips算子的逼近性质
4
作者 任美英 《武夷学院学报》 2024年第6期1-6,共6页
引进一类保持线性函数的Schurer型q-Phillips算子,并利用q-微积分的相关理论研究该算子列的一些逼近性质,得到算子列的一个Korovkin型收敛定理和一个Voronovskaja型结果,同时给出该算子列的收敛速度的一些估计。
关键词 Schurer型q-Phillips算子 q-积分 Korovich型定理 Voronovskaja型结果 收敛性
下载PDF
CONVERGENCE RATE FOR ITERATES OF q-BERNSTEIN POLYNOMIALS
5
作者 Xueyan Xiang Qian He Wenshan Yang 《Analysis in Theory and Applications》 2007年第3期243-254,共12页
Recently, q-Bernstein polynomials have been intensively investigated by a number of authors. Their results show that for q ≠ 1, q-Bernstein polynomials possess of many interesting properties. In this paper, the conve... Recently, q-Bernstein polynomials have been intensively investigated by a number of authors. Their results show that for q ≠ 1, q-Bernstein polynomials possess of many interesting properties. In this paper, the convergence rate for iterates of both q-Bernstein polynomials and their Boolean sum are estimated. Moreover, the saturation of {Bn(., qn)} when n → ∞ and convergence rate of Bn(f,q;x) when f ∈ C^n-1 [0, 1], q → ∞ are also presented. 展开更多
关键词 q-Bernstein operator convergence rate saturation of positive lienar operator iterates
下载PDF
COMPLETE MOMENT CONVERGENCE FOR L^P-MIXINGALES 被引量:3
6
作者 邱德华 陈平炎 Volodin ANDREI 《Acta Mathematica Scientia》 SCIE CSCD 2017年第5期1319-1330,共12页
In this paper, the complete moment convergence for L~p-mixingales are studied.Sufficient conditions are given for the complete moment convergence for the maximal partial sums of B-valued L~p-mixingales by utilizing th... In this paper, the complete moment convergence for L~p-mixingales are studied.Sufficient conditions are given for the complete moment convergence for the maximal partial sums of B-valued L~p-mixingales by utilizing the Rosenthal maximal type inequality for B-valued martingale difference sequence, which extend and improve the related known works in the literature. 展开更多
关键词 complete moment convergence q-smooth Banach space L^p-mixingales
下载PDF
离散多智能体有限时间Q学习协同输出调节 被引量:1
7
作者 唐静远 魏文军 《计算机应用研究》 CSCD 北大核心 2023年第1期204-208,共5页
针对离散多智能体系统输出调节,提出了一种基于Q学习的最优控制策略。对于传统多智能体系统的输出调节,获取系统的精确动力学模型并依此求得其HJB方程的解为主要障碍。该策略通过智能体之间的局部通信,在不依赖系统动态模型的前提下实... 针对离散多智能体系统输出调节,提出了一种基于Q学习的最优控制策略。对于传统多智能体系统的输出调节,获取系统的精确动力学模型并依此求得其HJB方程的解为主要障碍。该策略通过智能体之间的局部通信,在不依赖系统动态模型的前提下实现了对每个智能体输出的全局最优控制。为实现对系统响应速率的优化,提出了一种新的有限时间局部误差公式,不仅保证了算法原有的全局最优性能,而且将输出同步时间缩短了近50%,并对所提算法的稳定性进行了分析。仿真结果表明,该策略在避免建立复杂系统模型和求解离散HJB方程的前提下实现了对系统的最优控制,采用更新后的有限时间局部误差公式有效缩短了收敛时间。 展开更多
关键词 离散多智能体系统 q学习 协同输出调节 快速收敛
下载PDF
q-型Lupas-Kantorovich算子的逼近性质
8
作者 王涛 李艳 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2023年第5期533-538,共6页
利用q-型微积分构造了一种基于q-型整数的q-型Lupas-Kantorovich算子,利用连续模研究了q-型Lupas-Kantorovich算子的逼近速度、q-型Lupas-Kantorovich算子加权逼近性质和加权统计收敛性质。
关键词 q-型Lupas-Kantorovich算子 q-型微积分 统计收敛 加权统计收敛
下载PDF
一次高空槽在青藏高原上诱发切变线的Q矢量分析 被引量:12
9
作者 郁淑华 《应用气象学报》 CSCD 北大核心 1994年第1期109-113,共5页
通过对1982年6月1-6日一次高空槽在青藏高原上诱发切变线的过程进行了Q矢量分析,发现高原切变线产生、维持在明显的呈东西向的500hPaQ矢量辐合带内,而且低层500hPa·Q<0,高层200hPa·Q>0... 通过对1982年6月1-6日一次高空槽在青藏高原上诱发切变线的过程进行了Q矢量分析,发现高原切变线产生、维持在明显的呈东西向的500hPaQ矢量辐合带内,而且低层500hPa·Q<0,高层200hPa·Q>0。这说明宽广的上升运动的存在和加强,是产生、维持切变线的重要机制。高原切变线的产生、维持还与锋生情况有一定的关系。 展开更多
关键词 q矢量 切变线 高空槽 锋生
下载PDF
迭代算法的广义Q-收敛阶和效率 被引量:1
10
作者 钟萍 张春华 张海斌 《中国农业大学学报》 CAS CSCD 北大核心 2001年第6期23-26,共4页
推广了迭代算法收敛分析中的 Q 收敛阶的概念 ,据此给出了算法效率的一种一般的度量。分析了新效率定义与已有的 Ostrowski效率和 Brent效率之间的关系。这种度量适用于任何迭代算法 ,因而为分析算法的优劣提供了一个理论依据。
关键词 广义q-收敛阶 Ostrowski效率 Brent效率 迭代算法
下载PDF
GF(q)域上非规则LDPC码EXIT图分析方法研究 被引量:2
11
作者 许拔 张仲明 +1 位作者 何英亮 张尔扬 《计算机工程与科学》 CSCD 北大核心 2011年第5期177-182,共6页
GF(q)域上非规则LDPC码是二进制非规则LDPC码在有限域GF(q=2p)上的扩展,在码长和码率相等的情况下,具有比二进制非规则LDPC码更优异的性能。如何分析GF(q)域上非规则LD-PC码的迭代译码性能是其能否有效应用的关键。基于迭代译码结构,本... GF(q)域上非规则LDPC码是二进制非规则LDPC码在有限域GF(q=2p)上的扩展,在码长和码率相等的情况下,具有比二进制非规则LDPC码更优异的性能。如何分析GF(q)域上非规则LD-PC码的迭代译码性能是其能否有效应用的关键。基于迭代译码结构,本文研究了AWGN信道下GF(q)域上非规则LDPC码的EXIT图分析方法,推导了其计算表达式;提出了利用EXIT图变量节点与校验节点联合优化准则。仿真结果表明,相对密度进化方法,该方法计算出的收敛门限值的精度稍有下降,却极大地降低了计算复杂度;在相同通信条件下,通过联合优化准则设计的GF(q)域上的非规则LDPC性能优于二进制非规则LDPC码;得到的收敛门限对应的信噪比非常接近香农限,进一步验证了EXIT图分析工具的优越性。 展开更多
关键词 非规则LDPC 密度进化 EXIT 收敛门限值 GF(q) 香农限
下载PDF
基于(p,q) -整数的一类新的Durrmeyer型Baskakov算子的收敛阶 被引量:1
12
作者 蔡清波 《福州大学学报(自然科学版)》 CAS 北大核心 2020年第6期685-691,共7页
引入一类新的基于(p,q)-整数的Durrmeyer型Baskakov算子,利用计算出的算子的矩量和中心矩量导出该算子的加权逼近定理,并采用二阶光滑模和Steklov平均得到算子的收敛阶.
关键词 (p q)-整数 BASKAKOV算子 光滑模 收敛阶 Steklov平均
下载PDF
Q学习对制糖结晶遗传神经网络收敛性的改进(英文)
13
作者 罗飞 毛宗源 +1 位作者 莫鸿强 卢子广 《控制理论与应用》 EI CAS CSCD 北大核心 2001年第6期887-890,共4页
采用多层前馈遗传神经网络模型对甘蔗制糖结晶速度进行学习和预测 ,并针对该模型存在的计算量大 ,收敛慢的问题 ,采用具有强化作用的Q学习确定遗传算法的变异概率 ,以提高学习的收敛速度 。
关键词 q学习 遗传神经网络 收敛性 甘蔗 制糖工艺
下载PDF
sum from n=0 to ∞ a_n(bx+c)^(np+q)型幂级数的收敛半径的简捷求法 被引量:1
14
作者 项明寅 鲍志晖 叶鸣 《黄山学院学报》 2005年第6期8-9,共2页
本文通过对赵树嫄教授主编的《微积分》关于求幂级数收敛半径一处笔误的讨论,得出关于sum from n=0 to ∞ a_n(bx+c)^(np+q)型幂级数收敛半径的简捷求法。
关键词 一般型幂级数 收敛半径 简捷求法
下载PDF
一维优化问题的一种Q-2阶收敛混合算法
15
作者 王兆智 邓乃扬 《中国农业大学学报》 CAS CSCD 北大核心 1998年第6期16-18,共3页
利用牛顿法和不精确牛顿法构造了1维代化问题的混合算法。用该算法连续2次迭代只计算1次2阶导数值。在一合理的假设下证明了该算法具有Q-2阶收敛速率。
关键词 1维优化 精确牛顿法 q-2阶收敛性 优化问题
下载PDF
二次规划的Q-平方收敛算法
16
作者 林正华 于波 《吉林大学自然科学学报》 CAS CSCD 1994年第1期45-48,共4页
本文提出一个解二次规划的修正步长牛顿法,它保证迭代点列在严格可行解集内。并且保持牛顿法的Q-平方收敛速度,每步的计算量为O(n ̄(2.5))个运算。
关键词 二次规划 平方收敛 变步长牛顿法
下载PDF
采用WOLFE搜索的BFGSSQP算法
17
作者 宁伟 《辽宁师范大学学报(自然科学版)》 CAS 2001年第3期243-247,共5页
X .Chen给出了一个用于解决LC1 线性约束优化问题的BFGS SQP算法 ,这个算法是用Armijo线性搜索原则来求步长的 .采用Wolfe线性搜索原则来替代该BFGS SQP算法的Armijo原则 ,经过类似的分析 ,同样得到了BFGS SQP算法的全局收敛性及超线性... X .Chen给出了一个用于解决LC1 线性约束优化问题的BFGS SQP算法 ,这个算法是用Armijo线性搜索原则来求步长的 .采用Wolfe线性搜索原则来替代该BFGS SQP算法的Armijo原则 ,经过类似的分析 ,同样得到了BFGS SQP算法的全局收敛性及超线性收剑性 . 展开更多
关键词 BEGS-SqP算法 全局收敛 超线性收敛 LC′线性约束优化问题 Wolfe线性搜索原则 Armijo原则
下载PDF
q-一致光滑Banach空间中的严格伪压缩映像
18
作者 何松年 孟记丽 《中国民航大学学报》 CAS 2010年第4期51-55,共5页
提出一种不用投影算子的修正的Mann迭代的循环算法,用于逼近q-一致光滑的Banach空间中有限个严格伪压缩映像的公共不动点,并证明了算法的强收敛性。本结论推广了Kim等和Zhang等关于非扩张映像的相应结果。
关键词 循环算法 强收敛 q-一致光滑 严格伪压缩映像 修正的Mann迭代 公共不动点
下载PDF
q-Stancu算子的保形性及收敛定理
19
作者 云连英 《浙江大学学报(理学版)》 CAS CSCD 北大核心 2009年第3期254-258,共5页
给出了基于q-整数的Stancu算子Ln(.,q),同时研究了该算子的一些基本性质.首先,利用q-Stancu算子作用于某一函数f(x)以后Ln(f,q;x)与f(x)变号数的关系,得到了该算子的保形性定理.其次,通过精细的不等式放缩,该算子作用于一般的连续函数... 给出了基于q-整数的Stancu算子Ln(.,q),同时研究了该算子的一些基本性质.首先,利用q-Stancu算子作用于某一函数f(x)以后Ln(f,q;x)与f(x)变号数的关系,得到了该算子的保形性定理.其次,通过精细的不等式放缩,该算子作用于一般的连续函数后收敛于一极限算子,而不像一般算子那样收敛于函数本身,并用光滑模刻画了其收敛速度. 展开更多
关键词 STANCU算子 q-整数 保形性 变号数 收敛速度
下载PDF
q一致光滑Banach空间中关于广义变分不等式组的迭代算法(英文)
20
作者 张丽娟 《应用数学》 CSCD 北大核心 2013年第4期925-933,共9页
在q一致光滑Banach空间中,本文引进一类包含三个算子的广义非线性变分不等式组,并考虑关于该类变分不等式组的三步迭代算法,得到该算法的强收敛定理,推广了某些已知结论.
关键词 变分不等式 投影方法 松弛协强制映射 q一致光滑 收敛
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部