期刊文献+
共找到412篇文章
< 1 2 21 >
每页显示 20 50 100
Experimental study of temperature gradient in track slab under outdoor conditions in Chengdu area 被引量:12
1
作者 Pingrui Zhao Xueyi Liu Guan Liu 《Journal of Modern Transportation》 2014年第3期148-155,共8页
Temperature is one of the important loads for designing slab track. The characteristic of slab track tem- perature varies greatly with different regional climates. In this work, a bi-block slab track model was built u... Temperature is one of the important loads for designing slab track. The characteristic of slab track tem- perature varies greatly with different regional climates. In this work, a bi-block slab track model was built under outdoor conditions in Chengdu area; the statistical characteristic of temperature gradient in track slab and the relationship between temperature gradient and surface air temperature were tested and analyzed. The results show that the track slab temperature gradient will vary periodically according to the surface air temperature, and show a clear nonlinearity along the height direction. The temperature gradient distribution is extremely uneven: the temperature gradient in the top part of the track slab is larger than that in the bottom part; the most frequently occurring temperature gradient of the track slab is around -3.5 ℃/m and more than 75 % locates in the level -10 to 10 ℃/m; concrete with a relatively good heat exchange condition with the surrounding air has a narrower band distribution. In addition, the frequency distribution histogram should exclude the time zone from 00:00 to 06:00 because there is almost no traffic in this period. The amplitude of track slab temperature variation is obviously lower than that of the air temperature variation, and the former is approximately linear with the latter. 展开更多
关键词 Slab track track slab - Temperature gradient Temperature field Surface air temperature
下载PDF
基于实测数据的高海拔大日温差地区拱上组合梁桥-无砟轨道体系温度场研究 被引量:3
2
作者 勾红叶 陈子豪 +3 位作者 刘畅 肖畅 袁蔚 苏延文 《铁道学报》 EI CAS CSCD 北大核心 2024年第2期159-170,共12页
温度作用是影响桥梁-轨道结构服役性能的重要因素之一。为探究高海拔大日温差地区拱上组合梁桥-无砟轨道体系的温度场变化规律,基于某拟建铁路上承式大跨拱桥桥址处的环境温度持续监测数据与卫星反演得到的太阳辐射数据,建立了考虑太阳... 温度作用是影响桥梁-轨道结构服役性能的重要因素之一。为探究高海拔大日温差地区拱上组合梁桥-无砟轨道体系的温度场变化规律,基于某拟建铁路上承式大跨拱桥桥址处的环境温度持续监测数据与卫星反演得到的太阳辐射数据,建立了考虑太阳辐射阴影遮挡效应的拱上组合梁桥-无砟轨道体系温度场模型,重点分析日温度变化规律和竖向温差分布规律,获得了考虑实测气温和太阳辐射逐时变化的全年日温度场;采用广义帕累托分布对竖向温差样本进行了极值分布估计,确定不同超越概率的竖向温差代表值,提出多折线形式的竖向温度梯度模式。研究结果表明,梯度相较于平原地区更为显著,无砟轨道的遮挡效应使得温度梯度分布上移,钢梁外侧腹板在冬季产生局部梯度作用;基于实测数据的温差极值估计方法考虑了环境温度和太阳辐射对结构温度场的随机影响,可为特殊地区桥梁设计阶段温度作用的计算提供参考。 展开更多
关键词 组合梁桥-无砟轨道体系 温度场 阴影遮挡效应 竖向温度梯度 广义帕累托分布
下载PDF
基于蒙特卡罗策略梯度的雷达观测器轨迹规划
3
作者 陈辉 王荆宇 +2 位作者 张文旭 赵永红 席磊 《兰州理工大学学报》 CAS 北大核心 2024年第5期77-85,共9页
在目标跟踪过程的雷达观测器轨迹规划(OTP)中,针对马尔可夫步进规划智能决策问题,在离散动作空间上,提出了一种基于蒙特卡罗策略梯度(MCPG)算法的雷达轨迹规划方法.首先,联合目标跟踪状态、奖励机制、动作方案和雷达观测器位置,将OTP过... 在目标跟踪过程的雷达观测器轨迹规划(OTP)中,针对马尔可夫步进规划智能决策问题,在离散动作空间上,提出了一种基于蒙特卡罗策略梯度(MCPG)算法的雷达轨迹规划方法.首先,联合目标跟踪状态、奖励机制、动作方案和雷达观测器位置,将OTP过程建模为一个连续的马尔可夫决策过程(MDP),提出基于MCPG的全局智能规划方法.其次,将跟踪幕长内的每个时间步作为单独一幕来进行策略更新,提出基于MCPG目标跟踪中观测器轨迹的步进智能规划方法,并深入研究目标的跟踪估计特性,构造以跟踪性能优化为目的的奖励函数.最后,对最优非线性目标跟踪过程中基于强化学习的智能OTP决策仿真实验,表明了所提方法的有效性. 展开更多
关键词 目标跟踪 雷达观测器轨迹规划 策略梯度 奖励函数
下载PDF
DDPG深度强化学习算法在无人船目标追踪与救援中的应用
4
作者 宋雷震 吕东芳 《黑龙江大学工程学报(中英俄文)》 2024年第1期58-64,共7页
为保证海上救援活动的高效性,研究结合深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)从状态空间、动作空间、奖励函数方面对船只追踪救援目标算法进行设计,并实际应用到无人船追踪救援之中。结果显示DDPG算法的稳... 为保证海上救援活动的高效性,研究结合深度确定性策略梯度算法(Deep Deterministic Policy Gradient,DDPG)从状态空间、动作空间、奖励函数方面对船只追踪救援目标算法进行设计,并实际应用到无人船追踪救援之中。结果显示DDPG算法的稳定成功率接近100%,性能优异。该设计的算法最终回合累积奖励值能够稳定在10左右,而平均时长则能稳定在80 s左右,能够根据周边环境的状态调整自己的运动策略,满足海上救援活动中的紧迫性要求,能为相关领域的研究提供一条新的思路。 展开更多
关键词 无人船 目标追踪 海上救援 深度确定性策略梯度算法(DDPG)
下载PDF
基于LQR的智能驾驶汽车横纵向控制研究 被引量:2
5
作者 高爱云 肖寒 付主木 《河南科技大学学报(自然科学版)》 北大核心 2024年第2期30-43,55,M0004,M0005,共17页
为了提高智能驾驶汽车跟踪控制器的稳定性和跟踪精度,提出了一种基于线性二次型调节器(LQR)控制算法和驾驶员预瞄模型的横向跟踪控制策略,结合纵向比例-积分-微分(PID)控制算法实现横纵向控制。首先建立带有前馈的LQR控制器,采用梯度下... 为了提高智能驾驶汽车跟踪控制器的稳定性和跟踪精度,提出了一种基于线性二次型调节器(LQR)控制算法和驾驶员预瞄模型的横向跟踪控制策略,结合纵向比例-积分-微分(PID)控制算法实现横纵向控制。首先建立带有前馈的LQR控制器,采用梯度下降优化算法优化LQR控制器权重参数,并在此基础上引入驾驶员预瞄模型,设计了基于经验的预瞄距离自适应控制器;其次建立双PID纵向控制器进行速度控制。最后通过Carsim和Matlab/Simulink联合仿真以及实车测试验证,结果表明:仿真工况下最大横向偏差小于0.035 m,最大航向偏差小于0.09 rad,实车测试工况下也能够良好遵循规划轨迹的整体趋势,速度跟踪效果良好且前轮转角与横摆角速度变化平稳。因此,该控制器能够保证较高精度且平稳的轨迹跟踪,在高速状态下更为明显。 展开更多
关键词 智能驾驶汽车 轨迹跟踪 线性二次型 梯度下降法 驾驶员模型
下载PDF
基于空间偏振混叠特性的红外偏振视频目标跟踪
6
作者 乔新博 赵永强 张景程 《兵工学报》 EI CAS CSCD 北大核心 2024年第9期3274-3287,共14页
基于分焦平面的红外偏振摄像仪体积小、实时性好、精确度高,并能有效应对复杂天候与红外伪装等干扰,但输出的偏振马赛克视频需要去马赛克并计算偏振参数,这种耗时较长且存在误差的处理方式限制了该设备在实时目标跟踪领域的应用。为解... 基于分焦平面的红外偏振摄像仪体积小、实时性好、精确度高,并能有效应对复杂天候与红外伪装等干扰,但输出的偏振马赛克视频需要去马赛克并计算偏振参数,这种耗时较长且存在误差的处理方式限制了该设备在实时目标跟踪领域的应用。为解决这一问题,分析了红外偏振马赛克图像中空间信息与偏振信息的混叠特性,提出基于空间偏振混叠梯度的马赛克图像空间偏振梯度方向直方图特征。特征利用偏振通道之间的空间相关性,设计空间梯度算子获取图像的空间信息,并利用偏振伪全色图像与偏振通道之间的关联性设计偏振梯度算子,结合图像空间信息与偏振信息构建目标特征。将该特征应用于AutoTrack目标跟踪方法,实现了基于空间-偏振混叠信息的实时红外偏振视频目标跟踪。在实拍的红外偏振马赛克视频数据上的实验结果表明,该特征提取方法可提高红外偏振图像的目标跟踪实时性和准确性,并有效利用马赛克图像的偏振信息。 展开更多
关键词 偏振图像 特征提取 目标跟踪 空间偏振混叠梯度
下载PDF
深度确定性策略梯度下运动目标识别及无人机跟随
7
作者 刘欣 张倩飞 +1 位作者 刘成宇 高涵 《西安工程大学学报》 CAS 2024年第4期9-17,共9页
针对无人机(unmanned aerial vehicle,UAV)平台采集运动目标图像信息过程中因UAV自身的飞行状态、环境的干扰、目标的随机性等原因易产生运动目标丢失等问题,提出了一种基于运动目标识别的深度确定性策略梯度(deep deterministic policy... 针对无人机(unmanned aerial vehicle,UAV)平台采集运动目标图像信息过程中因UAV自身的飞行状态、环境的干扰、目标的随机性等原因易产生运动目标丢失等问题,提出了一种基于运动目标识别的深度确定性策略梯度(deep deterministic policy gradient,DDPG)算法UAV跟随方法。面向高速公路的车辆目标,分析了UAV高度、位姿与高速车辆运动之间的关系,建立了移动平台目标检测帧率的速度自适应模型,根据目标的运动状态计算能够相匹配UAV的飞行状态,实时修正飞行姿态与速度,使UAV能够保持与目标的相对位置和角度。继而基于DDPG算法价值网络估计UAV在不同状态下采取特定动作的价值,策略网络生成UAV在给定状态下采取动作的策略,给予UAV飞行高度、速度控制参数用于目标跟踪,使UAV能够根据目标的运动变化自动调节飞行状态,实现运动目标的自适应跟随。仿真实验表明:DDPG算法能够提供稳定的飞行姿态数据,为UAV的跟随任务提供了可靠的控制基础;通过在真实场景下实验验证,UAV能够实时跟踪速度范围0~33 m/s、半径为120 m的圆形面积内的地面运动目标,且在续航范围内能够实现持续稳定跟随。 展开更多
关键词 四轴飞行器 高速公路 动态规划 深度确定性策略梯度 目标跟踪
下载PDF
单元双块式无砟轨道翘曲变形特征的试验研究
8
作者 赵磊 蒋典佑 施成 《铁道科学与工程学报》 EI CAS CSCD 北大核心 2024年第10期4053-4064,共12页
为解决无砟轨道应用过程中波长与板长相近的周期性不平顺问题,探明单元双块式无砟轨道周期性变形特征,厘清道床板翘曲变形与温度梯度的相关关系,基于双块式无砟轨道温度及温度变形现场试验,根据试验实测数据研究双块式无砟轨道温度场时... 为解决无砟轨道应用过程中波长与板长相近的周期性不平顺问题,探明单元双块式无砟轨道周期性变形特征,厘清道床板翘曲变形与温度梯度的相关关系,基于双块式无砟轨道温度及温度变形现场试验,根据试验实测数据研究双块式无砟轨道温度场时变规律以及空间分布特征,分析温度梯度与道床板翘曲变形之间的相关关系。建立双块式无砟轨道多层结构体系有限元模型,研究温度梯度对道床板翘曲变形和轨面周期性不平顺的影响规律,并分析温度梯度作用下无砟轨道周期性变形的特征,最终提出合理的控制措施。研究结果表明:双块式无砟轨道结构温度及温度变形均具有明显的日周期性变化特征,轨道结构温度在距离道床板表面0.16 m范围内变化活跃;道床板竖向位移量与温度梯度值呈正相关关系,实测最大正、负温度梯度+55/−33℃/m作用下,板角竖向位移量为−0.47/0.64 mm,板中竖向位移为−0.15/0.27 mm,正温度梯度最值时刻板中竖向位移量较板角低约68.1%,负温度梯度最值时刻板中较板角低约57.8%;仿真分析表明,正温度梯度下钢轨与道床板呈板中高、板端低的周期性变形趋势,负温度梯度下钢轨与道床板变形与之相反;当温度梯度为90℃/m和−45℃/m时,钢轨垂向变形差分别为0.58 mm和0.26 mm,道床板侧边垂向变形差分别为1.01 mm和0.55 mm。研究成果可为控制目前广泛存在的无砟轨道周期性变形问题提供理论指导。 展开更多
关键词 高速铁路 双块式无砟轨道 温度梯度 周期性变形 现场试验
下载PDF
单元式无砟轨道周期性变形敏感因素分析
9
作者 赵磊 杨国涛 +1 位作者 刘伟斌 施成 《铁道工程学报》 EI CSCD 北大核心 2024年第1期26-31,38,共7页
研究目的:单元式无砟轨道应用过程中检测出波长与板长相近的周期性不平顺问题,影响了列车运营舒适性。为研究周期性变形的敏感影响因素,以CRTSⅢ型板式无砟轨道为例,建立考虑层间非线性接触关系的无砟轨道多物理场耦合分析模型,分析轨... 研究目的:单元式无砟轨道应用过程中检测出波长与板长相近的周期性不平顺问题,影响了列车运营舒适性。为研究周期性变形的敏感影响因素,以CRTSⅢ型板式无砟轨道为例,建立考虑层间非线性接触关系的无砟轨道多物理场耦合分析模型,分析轨道板内温度梯度和自密实混凝土收缩对轨道板翘曲变形和轨面周期性不平顺的影响程度,获取了两种荷载与周期性变形间传递关系。研究结论:(1)温度梯度、混凝土收缩等效降温量越大,轨道竖向变形差越大且传递比越大,+90℃/m、-45℃/m温度梯度时,钢轨垂向变形差分别为0.72 mm、0.32 mm,传递比分别为0.0158 mm/(℃·m^(-1))、0.0183 mm/(℃·m^(-1));(2)等效降温-10℃时,钢轨垂向变形差0.39mm,传递比为0.0739 mm/℃;(3)与混凝土收缩组合时,正温度梯度变形效应叠加,负温度梯度变形效应抵消,-45℃/m温度梯度与混凝土收缩-10℃间引起的变形效应相当,可基本抵消;(4)通过控制轨道精调时机,合理预设初始不平顺可减小运营期单元式无砟轨道周期性不平顺;(5)本研究结论可为控制目前广泛存在的无砟轨道周期性变形问题提供理论指导。 展开更多
关键词 高速铁路 单元式无砟轨道 温度梯度 混凝土收缩 周期性变形
下载PDF
大温差地区CRTSⅠ型板式无砟轨道层间动态受力特征
10
作者 赵磊 李浩 +3 位作者 杨国涛 李晨曦 施成 宁娜 《中国铁道科学》 EI CAS CSCD 北大核心 2024年第4期30-39,共10页
大温差地区单元式轨道板受日照影响会产生较大温度梯度,导致轨道板翘曲变形,诱发轨面不平顺,增加高速列车轮轨冲击响应,加速轨道结构损伤。针对这一问题,采用有限元方法,首先建立考虑层间关系的无砟轨道静力分析模型,对大温度梯度下轨... 大温差地区单元式轨道板受日照影响会产生较大温度梯度,导致轨道板翘曲变形,诱发轨面不平顺,增加高速列车轮轨冲击响应,加速轨道结构损伤。针对这一问题,采用有限元方法,首先建立考虑层间关系的无砟轨道静力分析模型,对大温度梯度下轨道板翘曲变形及轨面周期性不平顺进行分析;然后,建立车辆-轨道系统动力学模型,模拟分析温度梯度作用下无砟轨道层间动态受力特征,研究高速行车条件下无砟轨道真实服役状态。结果表明:温度梯度作用下,轨道板呈椭球形变形趋势,正温度梯度时轨道板中部向上鼓起、4角支承,负温度梯度时轨道板4角翘起、板中支承;温度梯度会导致轨道板与CA砂浆间产生不同程度离缝,板下接触面积减小,高速行车时层间接触面积逐渐增加,但离缝不会完全闭合;负温度梯度对轨道结构振动和砂浆层受力影响较小,正温度梯度影响较大,温度梯度为90℃·m^(-1)时,轨道板振动加速度增大10倍左右,轨道板与CA砂浆层间压力最大值增加6.6倍,板角处CA砂浆应力较无温度梯度下钢轨正下方CA砂浆应力增加5.4倍,正温度梯度下轨道板侧边及4角位置处CA砂浆受力加剧效应显著,是导致该区域CA砂浆出现结构性破坏的主要原因。 展开更多
关键词 高速铁路 CRTSⅠ型板式无砟轨道 温度梯度 周期性不平顺 层间接触 有限元
下载PDF
非对称弦测法中基于梯度下降的轨道不平顺复原方法 被引量:1
11
作者 曾晨 国巍 +4 位作者 刘汉云 余志武 蒋丽忠 国振 谈遂 《Journal of Central South University》 SCIE EI CAS CSCD 2024年第1期288-301,共14页
本研究提出了一种基于梯度下降的轨道不平顺复原方法。基于非对称弦测法理论,轨道不平顺的复原过程可描述为一个欠定线性系统的优化问题。本文提出采用梯度下降法求解该优化问题,采用了考虑正则项的二次型代价函数。为了评估所提出方法... 本研究提出了一种基于梯度下降的轨道不平顺复原方法。基于非对称弦测法理论,轨道不平顺的复原过程可描述为一个欠定线性系统的优化问题。本文提出采用梯度下降法求解该优化问题,采用了考虑正则项的二次型代价函数。为了评估所提出方法的性能,本研究搭建了一个轨道检测小车,并在一个缩尺桥梁模型上进行了现场试验。通过与水准仪测量值的比较,验证了基于梯度下降轨道不平顺复原方法具有良好精度。与传统的需要专门设计逆滤波器的轨道不平顺复原方法相比,本研究所提出的方法物理意义明确,只需基于非对称弦测法原理建立优化模型,这表明本方法在现场实测中具有良好的可操作性。此外,重复性评估表明,在调整不同的弦长以及多次重复测量时,本研究所提出的方法可复现一致的轨道不平顺结果,表明该方法具有良好的测量重复性。本研究所提出的方法可对轨道不平顺进行准确复原,为轨道平顺性状态及时有效评估提供数据支撑,进而保证列车运行的平稳与安全。 展开更多
关键词 非对称弦测法 轨道不平顺复原 优化模型 梯度下降方法 逆滤波器法
下载PDF
自适应分布式聚合博弈广义纳什均衡算法
12
作者 时侠圣 任璐 孙长银 《自动化学报》 EI CAS CSCD 北大核心 2024年第6期1210-1220,共11页
随着信息物理系统技术的发展,面向多智能体系统的分布式协同优化问题得到广泛研究.主要研究面向多智能体系统的受约束分布式聚合博弈问题,其中局部智能体成本函数受到全局聚合项约束和全局等式耦合约束.首先,面向一阶积分型多智能体系... 随着信息物理系统技术的发展,面向多智能体系统的分布式协同优化问题得到广泛研究.主要研究面向多智能体系统的受约束分布式聚合博弈问题,其中局部智能体成本函数受到全局聚合项约束和全局等式耦合约束.首先,面向一阶积分型多智能体系统设计一种基于估计梯度下降的纳什均衡求解算法.其中,利用多智能体系统平均一致性方法设计一种自适应估计策略,以实现全局聚合项约束分布式估计,并据此计算出梯度函数估计值.其次,利用状态反馈策略和输出反馈策略将上述算法推广至状态信息可测和状态信息不可测一般线性异构多智能体系统.最后,利用拉萨尔不变性原理证实上述算法收敛性,并提供多组案例仿真用以验证算法有效性. 展开更多
关键词 聚合博弈 自适应 比例积分 梯度跟踪 一般线性多智能体系统
下载PDF
基于深度强化学习的自主换道控制模型
13
作者 孙腾超 陈焕明 《农业装备与车辆工程》 2024年第4期30-34,共5页
为解决自动驾驶汽车快速安全换道问题,提出并改进了一种基于深度强化学习的自主换道控制模型。首先建立车辆动力学运动模型,其次使用深度确定性策略梯度(DDPG)算法更新模型,最后通过MATLAB/CarSim对学习到的控制策略进行联合仿真验证。... 为解决自动驾驶汽车快速安全换道问题,提出并改进了一种基于深度强化学习的自主换道控制模型。首先建立车辆动力学运动模型,其次使用深度确定性策略梯度(DDPG)算法更新模型,最后通过MATLAB/CarSim对学习到的控制策略进行联合仿真验证。为了使模型更真实可靠,提出将CarSim融入智能体的训练,同时为解决传统模型在换道后期控制效果不理想问题,提出一种基于采样时间的方向盘转角输出模型。结果表明:在60、80 km/h车速下,提出的模型从换道开始到稳定行驶的过程相比于改进前更平顺、快速,验证了模型能够实现一般车速下的自主换道控制,为车辆的自主换道研究提供一定的参考。 展开更多
关键词 自动驾驶汽车 自主换道模型 深度强化学习 轨迹规划跟踪 深度确定性策略梯度算法
下载PDF
基于Policy Gradient的机械臂运动跟踪控制器参数整定 被引量:3
14
作者 韩霖骁 胡剑波 +3 位作者 宋仕元 王应洋 贺子厚 张鹏 《系统工程与电子技术》 EI CSCD 北大核心 2021年第9期2605-2611,共7页
针对机械臂运动跟踪控制器的参数自整定问题,设计了一种基于强化学习Policy Gradient法的参数整定器。首先,介绍了机械臂的一种混合动力学模型,根据该系统模型进行了比例微分(proportional-derivative,PD)控制器设计和李雅普诺夫稳定性... 针对机械臂运动跟踪控制器的参数自整定问题,设计了一种基于强化学习Policy Gradient法的参数整定器。首先,介绍了机械臂的一种混合动力学模型,根据该系统模型进行了比例微分(proportional-derivative,PD)控制器设计和李雅普诺夫稳定性证明,并由此给出了参数矩阵的范围。其次,设计了基于Policy Gradient的参数整定器,通过引入积分器的方法对其进行改进,使其控制下的参数行为连续化以进一步提高PD控制器的控制效果。最后,以二阶机械臂系统为例进行了仿真验证。实验数据证明了该参数整定器的有效性和可行性,并能有效提升系统的动态性能。 展开更多
关键词 机械臂 运动跟踪 Policy gradient 参数整定 比例微分控制
下载PDF
自动驾驶路径优化的RF-DDPG车辆控制算法研究
15
作者 焦龙飞 谷志茹 +2 位作者 舒小华 袁鹏 王建斌 《湖南工业大学学报》 2024年第1期62-69,共8页
针对自动驾驶车辆在行使中对目标路径跟踪精度不高、鲁棒性能较差等问题,提出了一种深度确定性策略梯度RF-DDPG(reward function-deep deterministic policy gradient)路径跟踪算法。该算法是在深度强化学习DDPG的基础上,设计DDPG算法... 针对自动驾驶车辆在行使中对目标路径跟踪精度不高、鲁棒性能较差等问题,提出了一种深度确定性策略梯度RF-DDPG(reward function-deep deterministic policy gradient)路径跟踪算法。该算法是在深度强化学习DDPG的基础上,设计DDPG算法的奖励函数,以此优化DDPG的参数,达到所需跟踪精度及稳定性。并且采用aopllo自动驾驶仿真平台,对原始的DDPG算法和改进的RF-DDPG路径跟踪控制算法进行了仿真实验。研究结果表明,所提出的RF-DDPG算法在路径跟踪精度以及鲁棒性能等方面均优于DDPG算法。 展开更多
关键词 自动驾驶 路径跟踪 深度强化学习 路径控制 DDPG算法
下载PDF
基于深度强化学习的分层自适应PID控制算法
16
作者 余文浩 齐立哲 +1 位作者 梁瀚文 孙云权 《计算机系统应用》 2024年第9期245-252,共8页
比例积分微分(PID)控制在工业控制和机器人控制领域应用非常广泛.然而,其在实际应用中存在参数整定复杂、系统无法精准建模以及对被控对象变化敏感的问题.为了解决这些问题,本文提出了一种基于深度强化学习算法的分层自适应PID控制算法,... 比例积分微分(PID)控制在工业控制和机器人控制领域应用非常广泛.然而,其在实际应用中存在参数整定复杂、系统无法精准建模以及对被控对象变化敏感的问题.为了解决这些问题,本文提出了一种基于深度强化学习算法的分层自适应PID控制算法,即TD3-PID,用于移动机器人的自动控制.其中,上层控制器通过实时观测当前环境状态和系统状态实现对下层PID控制器参数和输出补偿量进行调整,以实时补偿误差从而优化系统性能.本文将所提出的TD3-PID控制器应用于4轮移动机器人轨迹跟踪任务并和其他控制方法进行了真实场景实验对比.结果显示TD3-PID控制器表现出更优越的动态响应性能和抗干扰能力,整体响应误差显著减小,在提高控制系统性能方面具有显著的优势. 展开更多
关键词 深度强化学习 PID算法 自适应控制 确定性策略梯度算法 轨迹跟踪
下载PDF
基于相关滤波的铁路异物侵限跟踪方法研究
17
作者 衣晚卓 黄克勇 王锡奎 《铁路计算机应用》 2024年第5期14-19,共6页
针对铁路异物侵限频繁发生导致的列车运行安全问题,提出一种基于背景感知相关滤波器的铁路异物侵限跟踪方法。利用方向梯度直方图(HOG,Histogram of Oriented Gradient)特征提取铁路侵限异物自身特征,结合剪裁矩阵,以增加视频帧中实际... 针对铁路异物侵限频繁发生导致的列车运行安全问题,提出一种基于背景感知相关滤波器的铁路异物侵限跟踪方法。利用方向梯度直方图(HOG,Histogram of Oriented Gradient)特征提取铁路侵限异物自身特征,结合剪裁矩阵,以增加视频帧中实际背景的负样本;使用交替方向乘子法(ADMM,Alternating Direction Method of Multipliers)训练背景感知相关滤波器,减少计算复杂度,在保证跟踪速度的前提下,提升跟踪侵限异物的准确性,从而适应铁路沿线环境中由于侵限异物的形变、快速移动或天气等原因造成的目标丢失及跟踪框漂移等情况。实验结果表明,该方法对铁路侵限异物的跟踪精确度和AUC(Area Under Curve)值分别达到93%和71.9%,均高于SRDCF、KCF、ASLA和CSK等算法,具有更好的准确性。 展开更多
关键词 铁路异物侵限 跟踪方法 相关滤波 方向梯度直方图(HOG)特征 剪裁矩阵
下载PDF
扩展目标跟踪中基于深度强化学习的传感器管理方法
18
作者 张虹芸 陈辉 张文旭 《自动化学报》 EI CAS CSCD 北大核心 2024年第7期1417-1431,共15页
针对扩展目标跟踪(Extended target tracking,ETT)优化中的传感器管理问题,基于随机矩阵模型(Random matrices model,RMM)建模扩展目标,提出一种基于深度强化学习(Deep reinforcement learning,DRL)的传感器管理方法.首先,在部分可观测... 针对扩展目标跟踪(Extended target tracking,ETT)优化中的传感器管理问题,基于随机矩阵模型(Random matrices model,RMM)建模扩展目标,提出一种基于深度强化学习(Deep reinforcement learning,DRL)的传感器管理方法.首先,在部分可观测马尔科夫决策过程(Partially observed Markov decision process,POMDP)理论框架下,给出基于双延迟深度确定性策略梯度(Twin delayed deep deterministic policy gradient,TD3)算法的扩展目标跟踪传感器管理的基本方法;其次,利用高斯瓦瑟斯坦距离(Gaussian Wasserstein distance,GWD)求解扩展目标先验概率密度与后验概率密度之间的信息增益,对扩展目标多特征估计信息进行综合评价,进而以信息增益作为TD3算法奖励函数的构建;然后,通过推导出的奖励函数,进行基于深度强化学习的传感器管理方法的最优决策;最后,通过构造扩展目标跟踪优化仿真实验,验证了所提方法的有效性. 展开更多
关键词 传感器管理 扩展目标跟踪 深度强化学习 双延迟深度确定性策略梯度 信息增益
下载PDF
A LUMINANCE EDGE EXTRACTION METHOD USING GRADIENT OF GRAY LEVEL FOR SYNTHETIC APERTURE RADAR IMAGERY
19
作者 许蔚 陈宗骘 《Journal of Electronics(China)》 1991年第2期104-115,共12页
In the multistage imaging processing for SAR digital imaging and applications ofSAR imagery,extraction of luminance edge for the SAR imageis often required.It is well studiedto extract the luminance edge for ordinary ... In the multistage imaging processing for SAR digital imaging and applications ofSAR imagery,extraction of luminance edge for the SAR imageis often required.It is well studiedto extract the luminance edge for ordinary images,The methods using gradient are effective andcommonly used.Because of the serious noise of coherent speckle exists in SAR images,somepeople believe that edge extraction by using gradient for SAR imagery gives poor results.Inthis paper,we have derived a rather ideal method for the extraction of luminance edge for SARimagery with the consideration of the characteristics of SAR imagery.This method uses therelative average gradient and combines detection with tracking. 展开更多
关键词 Edge extraction SAR IMAGERY MULTISTAGE imaging gradient RELATIVE AVERAGE gradient detection and tracking
下载PDF
THE IMPACTS OF INTERACTION OF A TYPHOON WITH THE MIDLATITUDE TROUGH ON ITS TRACK AFTER THE RECURVATURE 被引量:1
20
作者 王凯 陈华 王金梅 《Journal of Tropical Meteorology》 SCIE 2017年第2期202-209,共8页
Three typhoon cases are selected to conduct a series of simulations that are initialized from sequential analyses. The results show that the forecast error in crucial area where a tropical cyclone(TC) interactes with ... Three typhoon cases are selected to conduct a series of simulations that are initialized from sequential analyses. The results show that the forecast error in crucial area where a tropical cyclone(TC) interactes with the upstream trough is highly correlated to the track forecast error after the TC recurvature. Furthermore, sensitivity experiments confirm that the developments of the midlatitude downstream circulations and then the TC track after its recurvature are highly sensitive to the TC intensity and its location relative to the upstream trough, which can give an example or one way of sensitivity of the TC track to the TC-trough interaction. If the TC interacts with the upstream trough more strongly(e.g., the TC being intensified or getting closer to the upstream trough), the downstream circulations will be more meridional, thus the TC track will be more northerly and westerly; otherwise, the downstream circulations will be more zonal, and the TC track will be more southerly and easterly. 展开更多
关键词 tropical cyclone typhoon track typhoon recurvature midlatitude downstream circulations upstream trough PV gradient
下载PDF
上一页 1 2 21 下一页 到第
使用帮助 返回顶部