期刊文献+
共找到147篇文章
< 1 2 8 >
每页显示 20 50 100
深部软岩巷道围岩与锚喷U型钢支护结构相互作用研究 被引量:1
1
作者 孟庆彬 宋子鸣 +4 位作者 刘滨 黄炳香 浦海 王从凯 辛学奎 《煤炭科学技术》 EI CAS CSCD 北大核心 2024年第7期23-36,共14页
收敛-约束法(特性曲线法)是将理论解析、现场实测、工程经验相结合的一种地下工程结构设计方法,是目前分析围岩-支护相互作用关系及开展支护优化设计的常用方法。基于收敛-约束法的基本原理,总结给出了经典的支护特征与支护结构变形方程... 收敛-约束法(特性曲线法)是将理论解析、现场实测、工程经验相结合的一种地下工程结构设计方法,是目前分析围岩-支护相互作用关系及开展支护优化设计的常用方法。基于收敛-约束法的基本原理,总结给出了经典的支护特征与支护结构变形方程,理论计算获得了喷射混凝土、锚杆(索)、U型钢支架等支护结构的支护特征曲线,分析了支护结构的几何尺寸(直径、长度)、间排距、材料强度等参数对支护压力的影响特征;随着喷射混凝土厚度及强度等级的增加,喷射混凝土提供的支护刚度和支护压力逐渐增大;随着锚杆(索)直径、长度、杆体材料强度的增加及间排距的减小,锚杆的支护压力显著增加;U型钢支架的排距越小及材料强度越大,其提供的支护压力越大。采用FLAC^(3D)内嵌的莫尔库伦应变软化本构模型,建立了考虑岩石峰后应变软化与扩容特性的深部软岩巷道数值分析模型,计算获得了不同应力状态下巷道纵剖面变形曲线、围岩特征曲线,分析了锚喷、锚杆(索)喷、锚喷U型钢等3种联合支护技术对深部巷道围岩大变形控制的适用性,验证了锚喷U型钢联合支护技术应用于深部巷道支护工程的可行性。考虑岩石峰后应变软化与扩容特性的应变软化本构模型和经典的莫尔库伦本构模型的数值模拟结果相差较大,采用莫尔库伦本构模型的数值模拟结果保守,支护结构提供的支护压力无法满足深部巷道稳定性控制要求,支护后巷道围岩变形较大甚至会发生冒顶、片帮等安全事故。 展开更多
关键词 深部巷道 收敛-约束法 围岩-支护相互作用 巷道支护
下载PDF
通信受限条件下多无人机协同环境覆盖路径规划
2
作者 陈洋 周锐 《中国惯性技术学报》 EI CSCD 北大核心 2024年第3期273-281,共9页
多无人机协同覆盖旨在有效分配多个无人机任务,实现给定区域的快速、高效全覆盖。然而,在现实应用场景中常常因为无人机之间距离超出通信范围,信号传输受阻,导致无人机之间的协作和信息交互面临极大挑战。为此,提出一种基于Deep Q Netwo... 多无人机协同覆盖旨在有效分配多个无人机任务,实现给定区域的快速、高效全覆盖。然而,在现实应用场景中常常因为无人机之间距离超出通信范围,信号传输受阻,导致无人机之间的协作和信息交互面临极大挑战。为此,提出一种基于Deep Q Networks(DQN)的多无人机路径规划方法。采用通信中断率和最大通信中断时间两个指标来评价路径质量,通过构建与指标相关的奖励函数,实现了无人机团队的自主路径决策。仿真实验表明,所提方法在最短路径上可以与传统优化算法效果保持一致,权衡路径下在增加20%路径长度的情况下可以降低80%通信中断率,在全通信路径下则可以实现100%的全过程连接通信,因此可以根据不同的通信环境生成高效覆盖所有环境节点的路径。 展开更多
关键词 环境覆盖 多无人机 通信约束 深度Q网络 路径规划
下载PDF
基于轨迹引导的移动机器人导航策略优化算法
3
作者 李忠伟 刘伟鹏 罗偲 《计算机应用研究》 CSCD 北大核心 2024年第5期1456-1461,共6页
针对在杂乱、障碍物密集的复杂环境下移动机器人使用深度强化学习进行自主导航所面临的探索困难,进而导致学习效率低下的问题,提出了一种基于轨迹引导的导航策略优化(TGNPO)算法。首先,使用模仿学习的方法为移动机器人训练一个能够同时... 针对在杂乱、障碍物密集的复杂环境下移动机器人使用深度强化学习进行自主导航所面临的探索困难,进而导致学习效率低下的问题,提出了一种基于轨迹引导的导航策略优化(TGNPO)算法。首先,使用模仿学习的方法为移动机器人训练一个能够同时提供专家示范行为与导航轨迹预测功能的专家策略,旨在全面指导深度强化学习训练;其次,将专家策略预测的导航轨迹与当前时刻移动机器人所感知的实时图像进行融合,并结合坐标注意力机制提取对移动机器人未来导航起引导作用的特征区域,提高导航模型的学习性能;最后,使用专家策略预测的导航轨迹对移动机器人的策略轨迹进行约束,降低导航过程中的无效探索和错误决策。通过在仿真和物理平台上部署所提算法,实验结果表明,相较于现有的先进方法,所提算法在导航的学习效率和轨迹平滑方面取得了显著的优势。这充分证明了该算法能够高效、安全地执行机器人导航任务。 展开更多
关键词 移动机器人自主导航 轨迹预测 轨迹-图像融合 轨迹约束 深度强化学习
下载PDF
多约束边环境下计算卸载与资源分配联合优化
4
作者 熊兵 张俊杰 +3 位作者 黄思进 陈哲毅 于正欣 陈星 《小型微型计算机系统》 CSCD 北大核心 2024年第2期405-412,共8页
移动边缘计算(Mobile Edge Computing,MEC)将计算与存储资源部署到网络边缘,用户可将移动设备上的任务卸载到附近的边缘服务器,得到一种低延迟、高可靠的服务体验.然而,由于动态的系统状态和多变的用户需求,MEC环境下的计算卸载与资源... 移动边缘计算(Mobile Edge Computing,MEC)将计算与存储资源部署到网络边缘,用户可将移动设备上的任务卸载到附近的边缘服务器,得到一种低延迟、高可靠的服务体验.然而,由于动态的系统状态和多变的用户需求,MEC环境下的计算卸载与资源分配面临着巨大的挑战.现有解决方案通常依赖于系统先验知识,无法适应多约束条件下动态的MEC环境,导致了过度的时延与能耗.为解决上述重要挑战,本文提出了一种新型的基于深度强化学习的计算卸载与资源分配联合优化方法(Joint computation Offloading and resource Allocation with deep Reinforcement Learning,JOA-RL).针对多用户时序任务,JOA-RL方法能够根据计算资源与网络状况,生成合适的计算卸载与资源分配方案,提高执行任务成功率并降低执行任务的时延与能耗.同时,JOA-RL方法融入了任务优先级预处理机制,能够根据任务数据量与移动设备性能为任务分配优先级.大量仿真实验验证了JOA-RL方法的可行性和有效性.与其他基准方法相比,JOA-RL方法在任务最大容忍时延与设备电量约束下能够在时延与能耗之间取得更好的平衡,且展现出了更高的任务执行成功率. 展开更多
关键词 移动边缘计算 计算卸载 资源分配 多约束优化 深度强化学习
下载PDF
一种基于迁移学习的多任务制导算法 被引量:1
5
作者 罗皓文 何绍溟 亢有为 《兵工学报》 EI CAS CSCD 北大核心 2024年第6期1787-1798,共12页
针对典型的飞行器制导任务,利用深度学习算法可以有效地拟合导弹飞行状态与制导指令之间的函数关系。然而当制导任务发生变化时,其二者之间的映射关系也会随之改变,从而导致在当前环境下预训练好的模型无法直接作用于新环境,重新训练制... 针对典型的飞行器制导任务,利用深度学习算法可以有效地拟合导弹飞行状态与制导指令之间的函数关系。然而当制导任务发生变化时,其二者之间的映射关系也会随之改变,从而导致在当前环境下预训练好的模型无法直接作用于新环境,重新训练制导模型需要大量的弹道数据和巨额的时间成本。为解决上述问题,基于迁移学习的思想引入域对抗神经网络,提出基于迁移学习的多任务制导算法。以1个含有大量标签数据的源域任务辅助2个含有极少量标签数据的目标域任务进行迁移学习,从而克服预训练与在线控制之间的环境差异。使用特征提取器和域判别器提取出对任务环境不敏感的关键特征,使神经网络学习到各个任务所共享的底层信息;为提高预测精度,分别设计针对不同任务的偏置加速度预测器。数值仿真结果表明:基于迁移学习的多任务制导算法实现了导弹在不同任务中的加速度指令预测。 展开更多
关键词 多约束制导 计算制导 深度学习 迁移学习 偏置比例导引
下载PDF
基于深度全卷积神经弹性网络WCGAN-GP模型的语音增强研究 被引量:1
6
作者 许雯婷 龚晓峰 《计算机应用与软件》 北大核心 2024年第2期130-137,共8页
Wasserstein距离生成对抗网络(Wasserstein Generative Adversal Network,WGAN)模型^([1])在语音增强中运用广泛,但存在梯度易爆炸、性能不稳定等问题。引入梯度惩罚(Gradient Penalty,GP)和弹性网络条件约束,并将生成器和判别器优化成... Wasserstein距离生成对抗网络(Wasserstein Generative Adversal Network,WGAN)模型^([1])在语音增强中运用广泛,但存在梯度易爆炸、性能不稳定等问题。引入梯度惩罚(Gradient Penalty,GP)和弹性网络条件约束,并将生成器和判别器优化成深度全卷积神经网络(Deep Fully Convolutional Neural Networks,DFCNN)结构,提出一种基于DFCNN的弹性网络条件梯度惩罚(Wasserstein Conditional Generative Adversal Network Gradient Penalty,WCGAN-GP)模型。改进后的模型可以达到真实Lipschitz限制条件,提高了可控性、稳定性和特征提取能力,能更快优化训练。实验将改进后的模型与WGAN对不同噪声条件下的语音进行增强,结果证实了改进后的模型在语音增强方面的优越性。 展开更多
关键词 Wasserstein距离 深度全卷积神经网络 梯度惩罚 弹性网络 条件约束
下载PDF
考虑结构安全的桩基码头清淤施工方案优化
7
作者 赵煜 蔡忠志 +1 位作者 尤再进 隋意 《水利水运工程学报》 CSCD 北大核心 2024年第5期10-21,共12页
中国沿海粉砂质海岸桩基码头下方普遍存在的严重泥沙回淤问题,导致码头桩基受损和高昂泥沙清淤成本。将桩基受力的有限元分析方法与港口运营管理的运筹学方法相结合,以大型沿海桩基码头泥沙清淤工程为原型,开展桩基码头的清淤施工方案... 中国沿海粉砂质海岸桩基码头下方普遍存在的严重泥沙回淤问题,导致码头桩基受损和高昂泥沙清淤成本。将桩基受力的有限元分析方法与港口运营管理的运筹学方法相结合,以大型沿海桩基码头泥沙清淤工程为原型,开展桩基码头的清淤施工方案优化研究,分别建立码头桩基-岸坡土体结构体系的有限元数值模型,以及综合考虑清淤成本、安全、效率的港口清淤施工方案优化数学模型,并应用基于强化学习改进的遗传算法求解得到最优清淤方案。方案在充分考虑结构安全的前提下,有效降低了清淤成本,可为港口清淤提供依据。 展开更多
关键词 码头泥沙回淤 清淤施工方案 约束优化 DDQN-GA算法
下载PDF
车辆边缘计算中基于深度学习的任务判别卸载
8
作者 章坚武 戚可寒 +1 位作者 章谦骅 孙玲芬 《电子科技大学学报》 EI CAS CSCD 北大核心 2024年第1期29-39,共11页
车辆边缘计算(VEC)将移动边缘计算(MEC)与车联网(IoV)技术相结合,将车载任务下沉至网络边缘,以此解决车辆终端计算能力有限问题。为了克服任务数量骤增的车载任务调度难题并提供一个低时延服务环境,首先依据所选的5大特征参数的动态关... 车辆边缘计算(VEC)将移动边缘计算(MEC)与车联网(IoV)技术相结合,将车载任务下沉至网络边缘,以此解决车辆终端计算能力有限问题。为了克服任务数量骤增的车载任务调度难题并提供一个低时延服务环境,首先依据所选的5大特征参数的动态关联变化准则,使用改进型层次分析法(AHP)将车载任务划分为3类主要任务,基于3种卸载决策进行资源分配联合建模;随后,利用调度算法和罚函数来消除建模的约束条件,所获的代价值为之后的深度学习算法提供输入;最后,提出一种基于深度学习的分布式卸载网络算法来有效降低VEC系统的能耗与时延。仿真实验结果表明,所提卸载方案相较传统深度学习卸载方案具有更好环境适应性与稳定性,并降低了任务平均处理时延与能耗。 展开更多
关键词 深度学习 边缘卸载 多约束优化 任务类型划分 车辆边缘计算
下载PDF
基于约束图的远程监督长尾关系抽取方法
9
作者 张万里 佟安 李文桥 《现代电子技术》 北大核心 2024年第21期91-96,共6页
关系抽取任务可以从非结构化文本中抽取出实体对的关系信息,是信息抽取的核心任务。远程监督可以通过自动构建训练数据的方式降低人工的成本和压力,但原始语料本身存在数据不平衡的现象,导致长尾分布问题。针对这一问题,基于多示例学习... 关系抽取任务可以从非结构化文本中抽取出实体对的关系信息,是信息抽取的核心任务。远程监督可以通过自动构建训练数据的方式降低人工的成本和压力,但原始语料本身存在数据不平衡的现象,导致长尾分布问题。针对这一问题,基于多示例学习的思想,提出一种基于约束图的远程监督长尾关系抽取方法。首先根据知识图谱本体结构构建约束图,利用图卷积神经网络对其进行编码;其次利用分段膨胀卷积神经网络和实体注意力机制对句子进行编码;最后结合上述编码信息进行分类预测。在公开数据集NYT10上,相较于主流最优模型在Hits@10、Hits@15和Hits@20上分别提高了约0.6%、1.5%和2.6%,证明了实体类型和关系之间的约束信息对远程监督长尾关系抽取的重要性。 展开更多
关键词 关系抽取 远程监督 长尾分布 约束图 深度学习 知识图谱 注意力机制 膨胀卷积
下载PDF
基于多任务约束深度学习的水工隧洞缺陷检测方法研究
10
作者 邓旭方 徐轶 +2 位作者 阿依胡兰·阿山 陈正虎 蔡伟 《水利水电快报》 2024年第7期64-69,共6页
由于水工隧洞环境复杂、缺陷类型多,数字图像处理技术在隧洞巡检中的应用存在缺陷识别精度低、鲁棒性差等问题。为此,提出了基于多任务约束深度学习的水工隧洞缺陷自动检测方法。该方法在Faster R-CNN深度学习原理的基础上,结合原始目... 由于水工隧洞环境复杂、缺陷类型多,数字图像处理技术在隧洞巡检中的应用存在缺陷识别精度低、鲁棒性差等问题。为此,提出了基于多任务约束深度学习的水工隧洞缺陷自动检测方法。该方法在Faster R-CNN深度学习原理的基础上,结合原始目标检测的定位约束、类别约束,增加特征到影像恢复的约束,可以较完整地保留图像以及缺陷特征信息,从而解决部分水工隧洞缺陷样本不全而引起的特征提取不鲁棒的问题。测试结果表明:多任务约束的Faster R-CNN深度学习方法能够较好地识别裂缝、渗水、掉块等多种病害缺陷,有效提高了识别精度,为水工隧洞工程缺陷检测提供了可靠方法。 展开更多
关键词 隧洞缺陷检测 多任务约束深度学习 Faster R-CNN 隧洞缺陷特征表达
下载PDF
不确定风电接入下计及煤电机组深调和储能的电力系统分布鲁棒优化日前调度方法
11
作者 滕孟杰 陈晨 +4 位作者 赵宇鸿 钟剑 耿建 吕建虎 别朝红 《电网技术》 EI CSCD 北大核心 2024年第8期3122-3132,I0012-I0018,共18页
随着新能源装机规模和占比的不断扩大,未来新型电力系统对灵活调节能力的需求逐步攀升。目前,我国仍以煤炭为主要能源,电源结构仍以煤电机组为主。在新能源大规模并网条件下,煤电逐步由传统的基础保障性电源向系统调节性电源转变,更多... 随着新能源装机规模和占比的不断扩大,未来新型电力系统对灵活调节能力的需求逐步攀升。目前,我国仍以煤炭为主要能源,电源结构仍以煤电机组为主。在新能源大规模并网条件下,煤电逐步由传统的基础保障性电源向系统调节性电源转变,更多地承担系统调峰和备用等任务,以促进新能源的消纳。因此,充分发挥煤电机组的灵活调节能力对于电力系统的安全稳定经济运行至关重要。该文在考虑风电不确定性的基础上建立了计及煤电机组深调和储能的电力系统两阶段分布鲁棒优化模型。模型第一阶段考虑基础场景下系统的调度计划,包括煤电机组的启停和储能的充放电计划,第二阶段在第一阶段决策已知的情况下优化不确定概率分布下的成本期望,从而得到最恶劣场景下的概率分布。模型采用非精确列和约束生成(inexact column-and-constraint generation,i-C&CG)算法迭代求解。最后,采用改进的IEEE-39节点和IEEE-300节点系统验证了模型对风电消纳的促进作用以及i-C&CG算法对模型求解的加速效果。 展开更多
关键词 风电消纳 深度调峰 分布鲁棒优化 非精确列和约束生成 优化调度
下载PDF
基于深度学习的高超声速飞行器运动行为识别
12
作者 林照晨 张欣然 +2 位作者 刘紫阳 贺风华 欧阳磊 《空天防御》 2024年第1期48-55,共8页
高超声速飞行器具有机动大、速度高、航程远、威胁强等特点,已成为各大国重点发展的武器装备,识别其运动行为能为防御和拦截提供有力的技术支持。本文对有禁飞区等复杂约束条件下的高超声速飞行器运动行为识别问题开展研究:首先通过分... 高超声速飞行器具有机动大、速度高、航程远、威胁强等特点,已成为各大国重点发展的武器装备,识别其运动行为能为防御和拦截提供有力的技术支持。本文对有禁飞区等复杂约束条件下的高超声速飞行器运动行为识别问题开展研究:首先通过分析高超声速飞行器的运动特点,建立能够充分描述其行为模式的参数化运动方程;然后基于优化思想求解有禁飞区等复杂约束条件下的航迹规划问题,构建其数据集;最后基于深度学习方法设计高超声速飞行器运动行为识别算法。试验结果表明:所设计的识别算法能够实现对高超声速飞行器运动行为的识别,且具有一定的泛化能力,可为后续防御决策提供一定的参考。 展开更多
关键词 高超声速飞行器 飞行约束条件 运动行为识别 航迹规划 深度学习
下载PDF
统一框架的增强深度子空间聚类方法
13
作者 王清 赵杰煜 +1 位作者 叶绪伦 王弄潇 《计算机应用》 CSCD 北大核心 2024年第7期1995-2003,共9页
深度子空间聚类是一种处理高维数据聚类任务的有效方法。然而,现有的深度子空间聚类方法通常将自表示学习和指标学习作为两个独立的过程,导致在处理具有挑战性的数据时,固定的自表示矩阵会导致次优的聚类结果;另外,自表示矩阵的质量对... 深度子空间聚类是一种处理高维数据聚类任务的有效方法。然而,现有的深度子空间聚类方法通常将自表示学习和指标学习作为两个独立的过程,导致在处理具有挑战性的数据时,固定的自表示矩阵会导致次优的聚类结果;另外,自表示矩阵的质量对聚类结果的准确性至关重要。针对上述问题,提出一种统一框架的增强深度子空间聚类方法。首先,通过将特征学习、自表示学习和指标学习集成在一起同时优化所有参数,根据数据的特征动态地学习自表示矩阵,确保准确地捕捉数据特征;其次,为了提高自表示学习的效果,提出类原型伪标签学习,为特征学习和指标学习提供自监督信息,进而促进自表示学习;最后,为了增强嵌入表示的判别能力,引入正交性约束帮助实现自表示属性。实验结果表明,与AASSC(Adaptive Attribute and Structure Subspace Clustering network)相比,所提方法在MNIST、UMIST、COIL20数据集上的聚类准确率分别提升了1.84、0.49、0.34个百分点。可见,所提方法提高了自表示矩阵学习的准确性,聚类效果更好。 展开更多
关键词 深度子空间聚类 自表示学习 指标学习 亲和矩阵 正交约束
下载PDF
被动探测视场角约束下的深度强化学习制导方法
14
作者 张青龙 赵斌 许新鹏 《宇航学报》 EI CAS CSCD 北大核心 2024年第8期1281-1289,共9页
针对红外制导导弹拦截机动目标的导引律设计问题,提出了一种纯角度量测下考虑视场角约束的深度强化学习制导方法。首先,将拦截制导问题转化为一个马尔可夫决策过程,建立了基于双延迟深度确定性策略梯度算法的深度强化学习制导模型,并充... 针对红外制导导弹拦截机动目标的导引律设计问题,提出了一种纯角度量测下考虑视场角约束的深度强化学习制导方法。首先,将拦截制导问题转化为一个马尔可夫决策过程,建立了基于双延迟深度确定性策略梯度算法的深度强化学习制导模型,并充分考虑了导弹一阶自动驾驶仪特性;其次,设计了一种满足导引头视场角约束,同时又能权衡能量消耗和制导精度的综合奖励函数,并在典型场景下进行了深度强化学习制导律训练。在目标采用不同机动形式的条件下进行了对比仿真与蒙特卡洛仿真。仿真结果表明,该方法采用红外导引头探测到的纯角度信息,能够在满足视场角约束、过载指令饱和约束的前提下以较高精度命中目标,同时对目标的不同机动方式具有较强的鲁棒性。 展开更多
关键词 深度强化学习 机动目标 视场约束 纯角度量测 红外制导 导弹拦截
下载PDF
基于强化学习的能量受限无人机通信感知轨迹规划方法
15
作者 张智琛 何振清 李彬 《电讯技术》 北大核心 2024年第7期1033-1041,共9页
针对能量受限下无人机(Unmanned Aerial Vehicle,UAV)辅助通信感知中的无人机轨迹规划问题,采用激光无线充电的方式为无人机额外提供能量,同时考虑了无人机动力学和感知通信速率等约束,以对移动目标感知互信息量最大化为目标,建立了移... 针对能量受限下无人机(Unmanned Aerial Vehicle,UAV)辅助通信感知中的无人机轨迹规划问题,采用激光无线充电的方式为无人机额外提供能量,同时考虑了无人机动力学和感知通信速率等约束,以对移动目标感知互信息量最大化为目标,建立了移动目标感知通信轨迹规划问题。为了求解建立的包含大量复杂约束的优化问题,将原优化问题建立为马尔可夫决策过程,把无人机运动、能量变化、目标感知、基站通信等过程建模为环境空间,无人机电机转速设计为动作空间,并采用深度强化学习方法进行训练,实现无人机的轨迹规划。由于考虑了无人机动力学,规划得到的轨迹更符合无人机运动特性,并且训练得到的最优控制序列可以直接作用于无人机电机转速,降低了无人机控制难度。在设计的实验场景下,相较于传统最优控制方法,所提方法对移动目标感知互信息量提升了约3倍。 展开更多
关键词 无人机 辅助通信感知 轨迹规划 深度强化学习 激光充电 动力学约束
下载PDF
基于裁剪优化和策略指导的近端策略优化算法
16
作者 周毅 高华 田永谌 《计算机应用》 CSCD 北大核心 2024年第8期2334-2341,共8页
针对近端策略优化(PPO)算法难以严格约束新旧策略的差异和探索与利用效率较低这2个问题,提出一种基于裁剪优化和策略指导的PPO(COAPG-PPO)算法。首先,通过分析PPO的裁剪机制,设计基于Wasserstein距离的信任域裁剪方案,加强对新旧策略差... 针对近端策略优化(PPO)算法难以严格约束新旧策略的差异和探索与利用效率较低这2个问题,提出一种基于裁剪优化和策略指导的PPO(COAPG-PPO)算法。首先,通过分析PPO的裁剪机制,设计基于Wasserstein距离的信任域裁剪方案,加强对新旧策略差异的约束;其次,在策略更新过程中,融入模拟退火和贪心算法的思想,提升算法的探索效率和学习速度。为了验证所提算法的有效性,使用MuJoCo测试基准对COAPG-PPO与CO-PPO(PPO based on Clipping Optimization)、PPO-CMA(PPO with Covariance Matrix Adaptation)、TR-PPO-RB(Trust Region-based PPO with RollBack)和PPO算法进行对比实验。实验结果表明,COAPG-PPO算法在大多数环境中具有更严格的约束能力、更高的探索和利用效率,以及更高的奖励值。 展开更多
关键词 深度强化学习 近端策略优化 信任域约束 模拟退火 贪心算法
下载PDF
基于无量纲模型的空地导弹强化学习制导律
17
作者 黄晓阳 周军 +2 位作者 赵斌 许新鹏 沈昱恒 《宇航学报》 EI CAS CSCD 北大核心 2024年第9期1445-1455,共11页
针对空地导弹对地打击的终端角度约束制导问题,提出了一种基于无量纲模型和终端奖励的强化学习末制导方法。首先,基于导弹飞行运动学方程建立了无量纲弹目相对运动模型,降低了强化学习环境状态空间和观测空间规模,有效提高了终端角度约... 针对空地导弹对地打击的终端角度约束制导问题,提出了一种基于无量纲模型和终端奖励的强化学习末制导方法。首先,基于导弹飞行运动学方程建立了无量纲弹目相对运动模型,降低了强化学习环境状态空间和观测空间规模,有效提高了终端角度约束制导的强化学习网络训练效率;其次,综合考虑终端命中精度和终端攻击角度精度,不依赖过程奖励函数,构建了基于终端奖励的强化学习策略,避免了传统强化学习制导过程中存在的奖励稀疏问题;第三,采用深度确定性策略梯度算法,在典型场景下完成了考虑输入优化的末制导律训练。数学仿真实验表明,所述方法相比现有方法具有更高的命中精度和攻击角度精度,显著降低需用过载,能够有效克服现有强化学习制导方法中存在的计算资源占用高、学习效率低的问题,充分体现了其潜在的应用价值。 展开更多
关键词 深度强化学习 无量纲模型 深度确定性策略梯度算法 终端奖励函数 攻击角度约束
下载PDF
深埋隧洞软岩变形控制和应力拱圈形成分析 被引量:1
18
作者 杨正基 杜宁 史林泉 《云南水力发电》 2024年第4期29-32,共4页
就深埋隧洞在高地应力软岩环境应力拱圈的形成、应力拱圈的强度和围压作用,以及围岩变形控制机理进行论述。分析超前地质预报、减少围岩扰动、数学模拟及监测、主动让压支护、围岩约束平稳过渡对变形控制及应力拱圈形成的作用,以及分析... 就深埋隧洞在高地应力软岩环境应力拱圈的形成、应力拱圈的强度和围压作用,以及围岩变形控制机理进行论述。分析超前地质预报、减少围岩扰动、数学模拟及监测、主动让压支护、围岩约束平稳过渡对变形控制及应力拱圈形成的作用,以及分析主动让压支护成功案例,阐明控制围岩应力释放的同时又及时提供围压的主动让压支护体系和使围岩约束平稳过渡的措施可以推动应力拱圈形成,能承担高地应力环境下的压应力。 展开更多
关键词 软岩 深埋隧洞 高地应力 变形控制 应力拱圈 围岩约束过渡 让压支护
下载PDF
基于DDPG算法的旋翼无人机智能跟踪方法
19
作者 王悠 方林逸 韩立祥 《自动化应用》 2024年第5期12-17,共6页
针对旋翼无人机视觉伺服控制可视性约束差与控制效率低的问题,介绍四旋翼无人机的动力学模型与传统视觉伺服的基本原理;针对视觉伺服增益调节问题,提出了一种基于深度强化学习的旋翼无人机视觉伺服控制的马可科夫模型;并结合深度确定性... 针对旋翼无人机视觉伺服控制可视性约束差与控制效率低的问题,介绍四旋翼无人机的动力学模型与传统视觉伺服的基本原理;针对视觉伺服增益调节问题,提出了一种基于深度强化学习的旋翼无人机视觉伺服控制的马可科夫模型;并结合深度确定性策略梯度(DDPG)算法训练了模型,最终得到线速度和角速度2个解耦的伺服增益。结果表明,与传统的基于图像的视觉伺服(IBVS)方法相比,该方法能保证目标始终在视场中、飞行轨迹平滑、到达目标位置所需时间短,满足旋翼无人机视觉伺服控制可视性约束条件,同时,控制效率比传统控制方法高23.5%。实验中该方法能在复杂的非线性环境中实现精确控制,增加了视觉伺服技术的应用场景。 展开更多
关键词 深度强化学习 旋翼无人机 视觉伺服 视场约束
下载PDF
Query Translation on the Fly in Deep Web Integration 被引量:2
20
作者 JIANG Fangjiao JIA Linlin MENG Xiaofeng 《Wuhan University Journal of Natural Sciences》 CAS 2007年第5期819-824,共6页
To facilitate users to access the desired information, many researches have dedicated to the Deep Web (i.e. Web databases) integration. We focus on query translation which is an important part of the Deep Web integr... To facilitate users to access the desired information, many researches have dedicated to the Deep Web (i.e. Web databases) integration. We focus on query translation which is an important part of the Deep Web integration. Our aim is to construct automatically a set of constraints mapping rules so that the system can translate the query from the integrated interface to the Web database interfaces based on them. We construct a concept hierarchy for the attributes of the query interfaces, especially, store the synonyms and the types (e.g. Number, Text, etc.) for every concept At the same time, we construct the data hierarchies for some concepts if necessary. Then we present an algorithm to generate the constraint mapping rules based on these hierarchies. The approach is suitable for the scalability of such application and can be extended easily from one domain to another for its domain independent feature. The results of experiment show its effectiveness and efficiency. 展开更多
关键词 deep Web data integration query translation constraint mapping rules
下载PDF
上一页 1 2 8 下一页 到第
使用帮助 返回顶部