期刊文献+
共找到32篇文章
< 1 2 >
每页显示 20 50 100
结合优势结构和最小目标Q值的深度强化学习导航算法
1
作者 朱威 洪力栋 +1 位作者 施海东 何德峰 《控制理论与应用》 EI CAS CSCD 北大核心 2024年第4期716-728,共13页
针对现有基于策略梯度的深度强化学习方法应用于办公室、走廊等室内复杂场景下的机器人导航时,存在训练时间长、学习效率低的问题,本文提出了一种结合优势结构和最小化目标Q值的深度强化学习导航算法.该算法将优势结构引入到基于策略梯... 针对现有基于策略梯度的深度强化学习方法应用于办公室、走廊等室内复杂场景下的机器人导航时,存在训练时间长、学习效率低的问题,本文提出了一种结合优势结构和最小化目标Q值的深度强化学习导航算法.该算法将优势结构引入到基于策略梯度的深度强化学习算法中,以区分同一状态价值下的动作差异,提升学习效率,并且在多目标导航场景中,对状态价值进行单独估计,利用地图信息提供更准确的价值判断.同时,针对离散控制中缓解目标Q值过估计方法在强化学习主流的Actor-Critic框架下难以奏效,设计了基于高斯平滑的最小目标Q值方法,以减小过估计对训练的影响.实验结果表明本文算法能够有效加快学习速率,在单目标、多目标连续导航训练过程中,收敛速度上都优于柔性演员评论家算法(SAC),双延迟深度策略性梯度算法(TD3),深度确定性策略梯度算法(DDPG),并使移动机器人有效远离障碍物,训练得到的导航模型具备较好的泛化能力. 展开更多
关键词 强化学习 移动机器人 导航 优势结构 最小化目标q
下载PDF
大型离散不适定问题的广义G-K双对角正则化算法
2
作者 杨思雨 王正盛 +1 位作者 李伟 徐贵力 《工程数学学报》 CSCD 北大核心 2024年第3期432-446,共15页
不适定问题常常出现于科学和工程等诸多领域,求解此类问题的难点在于其解对扰动的高度敏感性。正则化方法由于用与原不适定问题相邻近的适定问题的解逼近原问题的解,成为求解不适定问题的一类有效算法。近来,用不同范数分别约束保真项... 不适定问题常常出现于科学和工程等诸多领域,求解此类问题的难点在于其解对扰动的高度敏感性。正则化方法由于用与原不适定问题相邻近的适定问题的解逼近原问题的解,成为求解不适定问题的一类有效算法。近来,用不同范数分别约束保真项和正则项的极小化模型求解不适定问题的正则化方法引起了广泛关注。本文针对大型离散不适定问题的不同范数约束优化模型,基于Majorization-Minimization优化算法和Golub-Kahan Lanczos双对角化过程,采用基于偏差原理的正则化参数选择策略,提出了一种求解大型离散不适定问题的广义Golub-Kahan双对角化正则化算法,并给出了所提算法的收敛性理论证明。本文对新算法进行了数值实验,并与已有算法进行了比较,数值结果表明所提算法与已有算法相比在计算效能等方面更具优势;新算法应用到图像恢复问题的算例验证了新算法在图像恢复应用中的实用性和有效性。新算法由于其更低迭代运算和更高计算效率而更具吸引力。 展开更多
关键词 l_(p)−l_(q)极小化 不适定问题 迭代正则化方法 Golub-Kahan Lanczos双对角化
下载PDF
最小Q-过程的Martin流入边界与Ray-Knight紧化 被引量:4
3
作者 徐长伟 阎国军 郝淑双 《应用概率统计》 CSCD 北大核心 2011年第6期633-641,共9页
郝淑双(黄河科技学院信息工程学院,郑州,450063)本文讨论了在最小Q-过程不中断的条件下Martin流入边界与Ray-Knight紧化之间的关系,即在Martin流入边界有限的条件下,Martin流入边界中的点与Ray-Knight紧化所添加的点之间具有一一对应关系.
关键词 最小q-过程 Martin流入边界 Ray-Knight紧化 右过程
下载PDF
全稳定广义生-灭最小Q过程的构造 被引量:3
4
作者 吴群英 林亮 《广西科学》 CAS 2005年第1期10-13,共4页
结合分解定理 ,研究全稳定广义生 -灭最小 Q过程的具体构造 .最小 Q过程对所有 Q过程的构造以及研究Q过程的性质起到极其重要的作用 .
关键词 全稳定广义生-灭过程 最小q过程 分解定理
下载PDF
广义生-灭最小Q过程的常返、遍历性 被引量:3
5
作者 吴群英 林亮 《纯粹数学与应用数学》 CSCD 北大核心 2007年第3期289-292,318,共5页
研究具有突变率的全稳定广义生-灭最小Q过程的常返性和遍历性,在Q-矩阵是正则、不可约的条件下,利用Q过程的构造理论,获得广义生-灭最小Q过程是常返、遍历的易于检验的充分必要条件,并给出不变测度.
关键词 广义生-灭最小q过程 常返 遍历
下载PDF
广义生-灭最小Q过程及其性质(英文) 被引量:5
6
作者 吴群英 《应用数学》 CSCD 北大核心 2002年第4期79-84,共6页
本文给出具有突变率的广义生 灭最小Q过程及其性质 .
关键词 广义生-灭最小q过程 零流出 零流入 突变率
下载PDF
最小q过程的随机可比性 被引量:2
7
作者 张余辉 《北京师范大学学报(自然科学版)》 CAS CSCD 北大核心 2000年第2期156-158,共3页
在较一般的条件下给出了 2个最小 q过程随机可比的充分和必要条件 ;同时 ,基于随机可比条件 ,得到了零流出的 1个判别法 .
关键词 最小q过程 随机可比 零流出 充要条件
下载PDF
广义生灭矩阵的对偶q-矩阵Q*及最小Q*-函数
8
作者 赵海霞 李扬荣 唐生强 《广西师范大学学报(自然科学版)》 CAS 北大核心 2014年第4期76-83,共8页
本文讨论广义生灭矩阵Q的对偶q-矩阵Q*的基本性质,结合基本性质得出在一定条件下Q*强零入、零出的数字刻画,并由此推出在相应条件下,Q强零入当且仅当Q*零出,Q零出当且仅当Q*强零入,从而找到了Q与Q*在性质上的关联。本文还讨论了最小Q*... 本文讨论广义生灭矩阵Q的对偶q-矩阵Q*的基本性质,结合基本性质得出在一定条件下Q*强零入、零出的数字刻画,并由此推出在相应条件下,Q强零入当且仅当Q*零出,Q零出当且仅当Q*强零入,从而找到了Q与Q*在性质上的关联。本文还讨论了最小Q*函数的基本性质,并得出在一定条件下最小Q-函数的对偶恰是最小Q*函数。 展开更多
关键词 广义生灭矩阵q 对偶q-矩阵 q*函数
下载PDF
最小Q^0过程的构造定理的证明
9
作者 孙琳 杨向群 《广东工业大学学报》 CAS 2001年第3期98-101,共4页
将Q0 过程的轨道“嵌入”Qb 过程的轨道中 ,借助Qb 过程的概率构造证明了最小Q0
关键词 最小q^0过程 嵌入 构造定理 q^b过程 生灭过程 马尔可夫过程
下载PDF
一类具有连续p(x)-增长条件的积分泛函的球面Q-极小的局部高阶可积性
10
作者 张子叶 王梅 《山东科技大学学报(自然科学版)》 CAS 2008年第4期78-81,共4页
给出了一类具有连续p(x)-增长条件的积分泛函,通过引理1、Sobolev-Poincaré不等式及反向H lder不等式证明了满足一定条件的此类积分泛函的球面Q-极小的局部高阶可积性。
关键词 积分泛函 球面q-极小 局部高阶可积性
下载PDF
关于Q过程的逼近理论 被引量:1
11
作者 陈作忠 《广西师范大学学报(自然科学版)》 CAS 1998年第3期14-22,共9页
在假定状态稳定的条件下提出了用一列(不必是Q过程的)ψn(λ)去逼近Q过程的转移概率的拉氏变换ψ(λ)的理论.
关键词 q过程 范条件 预解条件 逼近 转移 概率
下载PDF
关于Q过程的逼近理论(续)
12
作者 陈作忠 《广西师范大学学报(自然科学版)》 CAS 2000年第1期32-37,共6页
在文章“关于Q过程的逼近理论”中给出了一个Q过程的逼近定理 。
关键词 q过程 最小q过程 逼近理论
下载PDF
基于l_(2)/l_(q)(q=2/3)最小化模型的块稀疏信号恢复
13
作者 祝德春 周珺 +1 位作者 曹满霞 黄尉 《应用数学和力学》 CSCD 北大核心 2021年第9期989-998,共10页
该文主要研究了块稀疏信号的恢复问题.利用q-块限制等距性质(0<q≤1),通过极小化混合l_(2)/l_(q)(q=2/3)范数,建立了块稀疏信号恢复的一个充分条件,并且得到了在有噪声情形下信号恢复的误差界.通过数值实验,验证了该模型对于块稀疏... 该文主要研究了块稀疏信号的恢复问题.利用q-块限制等距性质(0<q≤1),通过极小化混合l_(2)/l_(q)(q=2/3)范数,建立了块稀疏信号恢复的一个充分条件,并且得到了在有噪声情形下信号恢复的误差界.通过数值实验,验证了该模型对于块稀疏信号的恢复有较高的成功率. 展开更多
关键词 压缩感知 块稀疏恢复 混合l_(2)/l_(q)(q=2/3)范数
下载PDF
CK_(3)单群与正规{p,q,r}补
14
作者 谢婉雯 《西南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第3期377-380,共4页
利用单群分类定理对CK3单群和极小非{p,q,r}′闭群进行了分类,并由此得到有限群具有正规{p,q,r}补的若干充分条件.
关键词 CK_(3)单群 正规{p q r}-补 极小非{p q r}′-闭群
下载PDF
An Efficient Adaptive Iteratively Reweighted l1 Algorithm for Elastic lq Regularization
15
作者 Yong Zhang Wanzhou Ye 《Advances in Pure Mathematics》 2016年第7期498-506,共9页
In this paper, we propose an efficient adaptive iteratively reweighted l<sub>1</sub> algorithm (A-IRL1 algorithm) for solving the elastic l<sub>q</sub> regularization problem. We prove that the... In this paper, we propose an efficient adaptive iteratively reweighted l<sub>1</sub> algorithm (A-IRL1 algorithm) for solving the elastic l<sub>q</sub> regularization problem. We prove that the sequence generated by the A-IRL1 algorithm is convergent for any rational and the limit is a critical point of the elastic l<sub>q</sub> regularization problem. Under certain conditions, we present an error bound for the limit point of convergent sequence. 展开更多
关键词 Compressed Sensing Elastic style="font-family:Mistral font-size:20pt ">lq minimization Nonconvex Optimization Convergence Critical Point
下载PDF
四元数体上Hermite矩阵的最小化问题 被引量:2
16
作者 袁仕芳 廖安平 雷渊 《数学物理学报(A辑)》 CSCD 北大核心 2009年第5期1298-1306,共9页
该文建立了四元数矩阵对的标准相关分解(CCD-Q).借助CCD-Q,GSVD-Q和有限维内积空间中的投影定理,该文得到了基于四元数矩阵方程AXB=C的Hermite矩阵最小化问题解的表达式.
关键词 四元数矩阵方程 最小化问题 CCD-q GSVD-q
下载PDF
快时尚服装供应链解耦点定位模型研究 被引量:1
17
作者 毛敏 何雅丽 《物流技术》 2015年第13期210-212,共3页
分析与服装供应链解耦点定位相关的制造商固定生产成本、库存成本、缺货成本以及零售商库存成本、缺货成本与过剩成本,建立制造商和零售商总成本最小的数学模型,研究了不确定需求下解耦点处最优库存策略的求解方法,并设计了模型算法思路。
关键词 快时尚 服装供应链 解耦点定位 最优(q R)策略 总成本最小模型
下载PDF
不可微多目标规划问题的最优性条件
18
作者 邬冬华 张连生 蔡建平 《应用数学与计算数学学报》 1994年第1期86-89,共4页
本文在文献[1]的基础上,建立了不可微多目标规划的一个最优性条件。
关键词 q-C条件 最优性条件 不可微规划 多目标规划
下载PDF
一类正割修正矩阵带有直接分解且保持稀疏性的拟牛顿法及其收敛性
19
作者 葛仁东 杨淑华 《大连理工大学学报》 EI CAS CSCD 北大核心 1997年第1期15-19,共5页
改进了Bogle和Perkins就求解稀疏性非线性方程组提出的能够保持正割修正矩阵稀疏性的拟牛顿法,进而提出一类带有直接分解的正割修正矩阵且保持稀疏性的拟牛顿法.进行了数值计算,效果良好;
关键词 拟牛顿法 收敛性 非线性方程组 矩阵 稀疏性
下载PDF
一类修正Broyden算法的超线性收敛性分析
20
作者 陈忠 费浦生 《安徽建筑工业学院学报(自然科学版)》 2003年第1期33-37,共5页
提出了一种求解非凸函数极小的修正的Broyden算法 ,该算法的基本思想是对计算Broyden修正矩阵的梯度差增加一个修正项。若假设目标函数是二阶连续可微的 ,二阶导数矩阵在极小点处正定 ,在极小点的邻域内满足Lipschitz条件时 ,证明了修正... 提出了一种求解非凸函数极小的修正的Broyden算法 ,该算法的基本思想是对计算Broyden修正矩阵的梯度差增加一个修正项。若假设目标函数是二阶连续可微的 ,二阶导数矩阵在极小点处正定 ,在极小点的邻域内满足Lipschitz条件时 ,证明了修正Broyden算法的q -超线性收敛性。 展开更多
关键词 BROYDEN算法 q-超线性收敛 非凸函数 LIPSCHITZ连续
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部