期刊文献+
共找到903篇文章
< 1 2 46 >
每页显示 20 50 100
Parametrically Optimal, Robust and Tree-Search Detection of Sparse Signals
1
作者 A. T. Burrell P. Papantoni-Kazakos 《Journal of Signal and Information Processing》 2013年第3期336-342,共7页
We consider sparse signals embedded in additive white noise. We study parametrically optimal as well as tree-search sub-optimal signal detection policies. As a special case, we consider a constant signal and Gaussian ... We consider sparse signals embedded in additive white noise. We study parametrically optimal as well as tree-search sub-optimal signal detection policies. As a special case, we consider a constant signal and Gaussian noise, with and without data outliers present. In the presence of outliers, we study outlier resistant robust detection techniques. We compare the studied policies in terms of error performance, complexity and resistance to outliers. 展开更多
关键词 SPARSE Signals DETECTION Robustness OUTLIER Resistance TREE SEARCH
下载PDF
考虑综合性能最优的非短视快速天基雷达多目标跟踪资源调度算法
2
作者 王增福 杨广宇 金术玲 《雷达学报(中英文)》 EI CSCD 北大核心 2024年第1期253-269,共17页
合理有效的资源调度是天基雷达效能得以充分发挥的关键。针对天基雷达多目标跟踪资源调度问题,建立了综合考虑目标威胁度、跟踪精度与低截获概率(LPI)的代价函数;考虑目标的不确定、天基平台约束以及长远期期望代价,建立了多约束下的基... 合理有效的资源调度是天基雷达效能得以充分发挥的关键。针对天基雷达多目标跟踪资源调度问题,建立了综合考虑目标威胁度、跟踪精度与低截获概率(LPI)的代价函数;考虑目标的不确定、天基平台约束以及长远期期望代价,建立了多约束下的基于部分可观测的马尔可夫决策过程(POMDP)的资源调度模型;采用拉格朗日松弛法将多约束下的多目标跟踪资源调度问题转换分解为多个无约束的子问题;针对连续状态空间、连续动作空间及连续观测空间引起的维数灾难问题,采用基于蒙特卡罗树搜索(MCTS)的在线POMDP算法—POMCPOW算法进行求解,最终提出了一种综合多指标性能的非短视快速天基雷达多目标跟踪资源调度算法。仿真表明,与已有调度算法相比,所提算法资源分配更合理,系统性能更优。 展开更多
关键词 天基雷达 资源调度 多目标跟踪 部分可观测的马尔可夫决策过程 蒙特卡罗树搜索(MCTS)
下载PDF
LLRB算法的函数式建模及其机械化验证
3
作者 左正康 黄志鹏 +4 位作者 黄箐 孙欢 曾志城 胡颖 王昌晶 《软件学报》 EI CSCD 北大核心 2024年第11期5016-5039,共24页
基于机器定理证明的形式化验证技术不受状态空间限制,是保证软件正确性、避免因潜在软件缺陷带来严重损失的重要方法.LLRB(left-leaning red-black trees)是一种二叉搜索树变体,其结构比传统的红黑树添加了额外的左倾约束条件,在验证时... 基于机器定理证明的形式化验证技术不受状态空间限制,是保证软件正确性、避免因潜在软件缺陷带来严重损失的重要方法.LLRB(left-leaning red-black trees)是一种二叉搜索树变体,其结构比传统的红黑树添加了额外的左倾约束条件,在验证时无法使用常规的证明策略,需要更多的人工干预和努力,其正确性验证是一个公认的难题.为此,基于二叉搜索树类算法Isabelle验证框架,对其附加性质部分进行细化,并给出具体化的验证方案.在Isabelle中对LLRB插入和删除操作进行函数式建模,对其不变量进行模块化处理,并验证函数的正确性.这是首次在Isabelle中对函数式LLRB插入和删除算法进行机械化验证,相较于目前LLRB算法的Dafny验证,定理数由158减少至84,且无需构造中间断言,减轻了验证的负担;同时,为复杂树结构算法的函数式建模及验证提供了一定的参考价值. 展开更多
关键词 LLRB 函数式建模 机械化验证 Isabelle定理证明器 二叉搜索树
下载PDF
面向人员岸滩行进的三维路径规划算法研究
4
作者 董箭 王天岳 王栋 《海洋测绘》 CSCD 北大核心 2024年第2期66-71,共6页
针对当前无法为人员岸滩行进提供科学合理的路径规划这一问题,论文基于蚁群算法提出了面向岸滩行进的最优路径规划算法。首先对基本的蚁群算法进行了改良,包括路径搜索方式、信息素更新策略和启发函数的合理设计等,改善了算法的收敛效率... 针对当前无法为人员岸滩行进提供科学合理的路径规划这一问题,论文基于蚁群算法提出了面向岸滩行进的最优路径规划算法。首先对基本的蚁群算法进行了改良,包括路径搜索方式、信息素更新策略和启发函数的合理设计等,改善了算法的收敛效率;然后定量结合多类岸滩场路径规划影响因子,构建了满足岸滩行进的代价函数;最终实现了面向岸滩行进的算法构建。该算法可为实现复杂地形条件下岸滩行进的最优路径解算和基于蚁群算法的相关三维路径规划分析研究提供参考借鉴。 展开更多
关键词 栅格模型 岸滩行进 三维路径规划 蚁群算法 十六叉树搜索
下载PDF
基于自动终止准则改进的kd-tree粒子近邻搜索研究
5
作者 张挺 王宗锴 +1 位作者 林震寰 郑相涵 《工程科学与技术》 EI CAS CSCD 北大核心 2024年第6期217-229,共13页
对于大规模运动模拟问题而言,近邻点的搜索效率将对整体的运算效率产生显著影响。本文基于关联性分析建立kd-tree的最大深度dmax与粒子总数N的自适应关系式,提出了kd-tree自动终止准则,即ATC-kd-tree,同时还考虑了叶子节点大小阈值n_(0... 对于大规模运动模拟问题而言,近邻点的搜索效率将对整体的运算效率产生显著影响。本文基于关联性分析建立kd-tree的最大深度dmax与粒子总数N的自适应关系式,提出了kd-tree自动终止准则,即ATC-kd-tree,同时还考虑了叶子节点大小阈值n_(0)对近邻搜索效率的影响。试验表明,ATC-kd-tree具有更高的近邻搜索效率,相较于不使用自动终止准则的kd-tree搜索效率最高提升46%,且适用性更强,可求解不同N值的近邻搜索问题,解决了粒子总数N发生改变时需要再次率定最大深度dmax的问题。同时,本文还提出了网格搜索法组合坐标下降法的两步参数优化算法GSCD法。通过2维阿米巴虫形状的参数优化试验发现,GSCD法可更为快速地率定ATC-kd-tree的可变参数,其优化效率比网格搜索法最高提升了205%,相较于改进网格搜索法最高提升了90%。研究结果表明,ATC-kd-tree和GSCD法不仅提高了近邻搜索的效率,也为复杂运动中近邻粒子搜索问题提供了一种更为高效的解决方案,能够显著降低计算资源的消耗,进一步提升模拟的精度和效率。 展开更多
关键词 KD-TREE 粒子近邻搜索 自适应 网格搜索法 坐标下降法
下载PDF
树状结构在数据流求均值中的应用
6
作者 刘薇 陈文 《电脑与电信》 2024年第3期81-83,88,共4页
数据采集过程中,随着数据的增加,数据的平均值持续发生变化。为了研究平均值的变化过程,分析平均值序列的计算方法是有必要的。传统的方法是使用线性顺序存储方式计算均值序列,总的时间复杂度高达O(n2)。提出利用树状结构存储方法求取... 数据采集过程中,随着数据的增加,数据的平均值持续发生变化。为了研究平均值的变化过程,分析平均值序列的计算方法是有必要的。传统的方法是使用线性顺序存储方式计算均值序列,总的时间复杂度高达O(n2)。提出利用树状结构存储方法求取均值序列,并介绍其实现方法,该方法时间复杂度大大降低,仅为O(n*lnn)。 展开更多
关键词 算法 数据流 搜索树 平均值
下载PDF
基于聚类和GBDT的镀锌钢卷力学性能预测
7
作者 王伟 赵飞 +2 位作者 匡祯辉 白振华 刘勇 《重型机械》 2024年第2期54-58,共5页
热镀锌钢卷力学性能影响因素之间关系复杂,限制了模型精度的提升。采用k-means算法利用化学成分属性对镀锌钢卷数据集进行聚类,将数据聚成三种模式簇实现样本的优选。利用梯度提升树算法,开展各模式数据集与不划分模式的全数据集下的力... 热镀锌钢卷力学性能影响因素之间关系复杂,限制了模型精度的提升。采用k-means算法利用化学成分属性对镀锌钢卷数据集进行聚类,将数据聚成三种模式簇实现样本的优选。利用梯度提升树算法,开展各模式数据集与不划分模式的全数据集下的力学性能建模研究,最后结合网格搜索与交叉验证方法进行模型参数优化。研究结果表明,分模式下模型MAE误差相比于全数据集建模平均减小0.85 MPa。参数优化后,各模式下MAE误差平均减少5.19 MPa,RMSE误差平均减少3.63 MPa,提高了预测模型精度。 展开更多
关键词 热镀锌钢卷 K-MEANS 力学性能建模 梯度提升树 网格搜索法
下载PDF
基于KNN-RRT 的机械臂运动路径规划算法
8
作者 张延军 张朋琳 +3 位作者 马创创 郭栋梁 韩雨 陈博 《组合机床与自动化加工技术》 北大核心 2024年第11期28-33,共6页
针对机械臂路径规划过程中节点生成容易陷入局部最小值、算法收敛速度慢等问题,以目标引力函数渐进最优快速扩展随机树(P-RRT)为基础,提出一种基于KNN快速查找的自适应步长的改进RRT算法(KNN-RRT)。首先,在目标引力的基础上引入AdaGrad... 针对机械臂路径规划过程中节点生成容易陷入局部最小值、算法收敛速度慢等问题,以目标引力函数渐进最优快速扩展随机树(P-RRT)为基础,提出一种基于KNN快速查找的自适应步长的改进RRT算法(KNN-RRT)。首先,在目标引力的基础上引入AdaGrad方法来调整自适应步长系数,降低随机点采样陷入局部最小值的问题;其次,利用KDTree来存储节点并利k邻近快速搜索查找相邻节点,提高算法的效率,并结合三次B样条曲线优化搜索路径的质量;最后,基于KNN-RRT算法在不同障碍物环境下进行实验,实验结果表明该算法在路径搜索时间、路径质量等方面有显著提升,提高算法的稳定性。 展开更多
关键词 机械臂运动规划 渐进最优快速搜索随机树 避障规划 路径优化
下载PDF
基于深度蒙特卡洛树搜索的拱坝仓面排序研究 被引量:1
9
作者 宋文帅 任炳昱 关涛 《水力发电学报》 CSCD 北大核心 2024年第3期120-130,共11页
合理的仓面排序方案对于加快工程进度和优化资源配置有着重要影响。然而,现有仓面排序方法将这一序贯决策问题简化,多数采用多属性决策方法,存在仅对大坝实时施工状态进行分析以及未考虑未来仓面浇筑方案对当前排序策略影响的问题;部分... 合理的仓面排序方案对于加快工程进度和优化资源配置有着重要影响。然而,现有仓面排序方法将这一序贯决策问题简化,多数采用多属性决策方法,存在仅对大坝实时施工状态进行分析以及未考虑未来仓面浇筑方案对当前排序策略影响的问题;部分采用多目标优化方法进行仓面排序多目标优化问题分析,但主要是采用静态权重,存在忽略了仓面排序策略随环境动态变化的不足。针对以上问题,本文提出基于深度蒙特卡洛树搜索的拱坝仓面排序方法。首先,分析仓面排序问题的约束条件和目标函数,建立仓面排序强化学习模型;其次,针对仓面排序强化学习模型具有复杂且庞大的离散状态空间,为提高搜索效率,提出融合深度学习的蒙特卡洛树搜索方法,分别利用深度神经网络进行先验动作概率分布预测和策略函数评估;最后,以乌东德拱坝工程为例进行研究,结果表明本文方法可以有效地分析拱坝仓面排序问题,且相比于粒子群方法、证据理论方法,本文方法分析的施工工期可分别提前6天、14天,平均机械利用率分别提高1.19%、1.35%。本研究为拱坝仓面排序分析与优化提供了新思路。 展开更多
关键词 拱坝 仓面排序 深度强化学习 蒙特卡洛树搜索 门控循环单元
下载PDF
Navi:基于自然语言交互的数据分析系统 被引量:1
10
作者 谢宇鹏 骆昱宇 冯建华 《软件学报》 EI CSCD 北大核心 2024年第3期1194-1206,共13页
随着大数据时代的到来,数据分析的作用日益显著.它能够从海量数据中发现有价值的信息,从而更有效地指导用户决策.然而,数据分析流程中存在三大挑战:分析流程高耦合、交互接口种类多和探索分析高耗时.为了应对上述挑战,提出了基于自然语... 随着大数据时代的到来,数据分析的作用日益显著.它能够从海量数据中发现有价值的信息,从而更有效地指导用户决策.然而,数据分析流程中存在三大挑战:分析流程高耦合、交互接口种类多和探索分析高耗时.为了应对上述挑战,提出了基于自然语言交互的数据分析系统Navi.该系统采用模块化的设计原则,抽象出主流数据分析流程的3个核心功能模块:数据查询、可视化生成和可视化探索模块,从而降低系统设计的耦合度.同时,Navi以自然语言作为统一的交互接口,并通过一个任务调度器实现了各功能模块的有效协同.此外,为了解决可视化探索中搜索空间指数级和用户意图不明确的问题,提出了一种基于蒙特卡洛树搜索的可视化自动探索方法,并设计了基于可视化领域知识的剪枝算法和复合奖励函数,提高了搜索效率和结果质量.最后,通过量化实验和用户实验验证了Navi的有效性. 展开更多
关键词 数据分析 数据查询 可视化 自然语言 蒙特卡洛树搜索
下载PDF
基于电压序列最小KL散度索引的低压台区拓扑识别
11
作者 李开放 林湘宁 +3 位作者 李正天 魏繁荣 吴宇奇 武文昊 《电力系统及其自动化学报》 CSCD 北大核心 2024年第10期22-32,共11页
为了实现对低压台区拓扑结构的准确刻画,提出一种基于电压序列最小KL(Kullback-Leibler)散度与深度搜索相结合的拓扑识别方法。首先,采用Neville插值修复电压采样序列,利用改进的KL散度计算用户电压序列概率分布,并依据KL散度大小对用... 为了实现对低压台区拓扑结构的准确刻画,提出一种基于电压序列最小KL(Kullback-Leibler)散度与深度搜索相结合的拓扑识别方法。首先,采用Neville插值修复电压采样序列,利用改进的KL散度计算用户电压序列概率分布,并依据KL散度大小对用户所属台区进行划分;其次,基于最小KL散度确定深度搜索的索引方向,通过主干搜索与分支搜索遍历台区用户节点,判断用户之间的连接关系;最后,针对不同场景分析所提方案拓扑识别性能。仿真结果验证了所提方案的有效性。 展开更多
关键词 低压台区 拓扑识别 Neville插值 Kullback-Leibler散度 树状搜索算法
下载PDF
车路协同下的无信号交叉口车辆通行调度策略
12
作者 张方忆 彭景阳 +1 位作者 李磊 王文格 《计算机应用研究》 CSCD 北大核心 2024年第7期2087-2092,共6页
无信号交叉口车辆通行调度问题是智能交通领域的研究重点,由于车辆通行顺序决策问题的解空间随着车辆数增加而指数级增长,在保证实时性的同时找到较优通行顺序成为无信号交叉口通行调度的一大问题。针对该问题提出一种基于自适应蒙特卡... 无信号交叉口车辆通行调度问题是智能交通领域的研究重点,由于车辆通行顺序决策问题的解空间随着车辆数增加而指数级增长,在保证实时性的同时找到较优通行顺序成为无信号交叉口通行调度的一大问题。针对该问题提出一种基于自适应蒙特卡罗树搜索算法的无信号交叉口车辆通行调度方法,采用分层式框架,上层集中式顺序决策,下层分布式轨迹规划。首先,建立基于冲突点的交叉口模型,将网联车加入到待搜索队列中,根据交叉口中的车辆通行特点设计通行顺序的蒙特卡罗树搜索流程,以总通行时间为指标建立评价函数,然后针对不同交通情景设计自适应探索系数及其他超参数,使算法在求解不同车辆数时以及搜索的不同时期保持最佳状态。轨迹规划环节以加速度二范数为目标函数,以速度、加速度以及始终点位置等为约束,建立最优控制命题求解车辆轨迹。最后,进行实验,结果表明该算法相较于其他算法在数值仿真和微缩平台实验中最大优化幅度分别达到33.42%和38.04%,为无信号交叉口车辆通行调度提供了一个有效解决方案。 展开更多
关键词 智能交通 无信号交叉口车辆通行调度 蒙特卡罗树搜索 智能网联车 微缩平台
下载PDF
露天矿作业区无人矿车协同通行决策方法研究
13
作者 倪浩原 余贵珍 +3 位作者 李涵 陈鹏 刘喜 王文达 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第3期277-289,共13页
露天矿无人矿车在装卸载作业区内运输过程中的长时间停车等待是制约露天矿无人运输系统效率提升的瓶颈。为提高无人矿车的运输效率,本文结合作业区内的运输作业流程,提出一种基于动态可行驶距离的多车协同通行决策方法。首先,将决策模... 露天矿无人矿车在装卸载作业区内运输过程中的长时间停车等待是制约露天矿无人运输系统效率提升的瓶颈。为提高无人矿车的运输效率,本文结合作业区内的运输作业流程,提出一种基于动态可行驶距离的多车协同通行决策方法。首先,将决策模型建模为混合整数线性规划(Mixed Integer Linear Programming, MILP)模型,表述优化目标和问题约束;其次,考虑到求解MILP模型存在难以满足动态决策实时性的问题,基于蒙特卡洛树搜索(Monte Carlo Tree Search,MCTS)实现多车冲突消解,核心思想是利用搜索树的推演能力进行多车通行前瞻模拟,计算多车的最优通行优先级,动态调整多车的可行驶距离;此外,根据无人矿车在作业区内的作业特征设计不同的MCTS节点价值函数,实现综合考虑运输效率与作业特征的通行优先级排序;最后,设计作业区4,8,12个停车位场景下的多车通行仿真实验,与基于先到先服务(First-Come-FirstServed, FCFS)的方法进行对比,吞吐量提升22.03%~28.00%,平均停车等待时间缩短31.71%~50.79%。同时,搭建微缩智能车辆的6停车位作业区场景实验平台,多车单次运输作业总用时相比FCFS缩短了18.84%。仿真与微缩智能车辆的实验结果表明,本文提出的方法能够提升露天矿作业区多车运输效率。 展开更多
关键词 智能交通 协同通行决策 蒙特卡洛树搜索 无人矿车 动态可行驶距离 露天矿作业区
下载PDF
一种基于决策树的比特币不可达节点发现方法
14
作者 李锐光 朱佳伟 +3 位作者 吴阜东 高家奇 徐大伟 祝烈煌 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第6期1861-1867,共7页
不可达节点是指比特币网络中不接收外部连接请求的网络工作节点,发现、验证均较为困难。现有研究大多集中于可达节点,而对不可达节点的研究较少。为此,提出一种基于决策树算法的不可达节点发现方法,可以从大量比特币地址中自动分类发现... 不可达节点是指比特币网络中不接收外部连接请求的网络工作节点,发现、验证均较为困难。现有研究大多集中于可达节点,而对不可达节点的研究较少。为此,提出一种基于决策树算法的不可达节点发现方法,可以从大量比特币地址中自动分类发现不可达节点。实验结果表明:所提方法在实验数据集上分类准确率为95.73%,召回率为91.97%;在真实数据上进行实测,并利用网络空间搜索引擎进行验证,所提方法实际分类准确率为53.75%,召回率约为76.86%。对实验中发现不可达节点的总量、地理分布、所属网络服务商等进行统计分析,为比特币监管工作提供有力技术支撑。 展开更多
关键词 比特币 不可达节点 可达节点 决策树 网络空间搜索引擎
下载PDF
基于深度学习的循环自动调度研究
15
作者 胡煜霄 郑启龙 《小型微型计算机系统》 CSCD 北大核心 2024年第7期1770-1777,共8页
循环代码的自动调度问题是编译优化领域中的热门问题,然而当前大部分此类研究都基于不同领域的领域特定语言或编程框架,缺乏对通用编程语言的支持.本文提出了一个面向通用编程语言的循环自动调度框架.该自动调度框架使用蒙特卡洛树搜索... 循环代码的自动调度问题是编译优化领域中的热门问题,然而当前大部分此类研究都基于不同领域的领域特定语言或编程框架,缺乏对通用编程语言的支持.本文提出了一个面向通用编程语言的循环自动调度框架.该自动调度框架使用蒙特卡洛树搜索算法对循环调度空间进行高效的搜索,在搜索样本评估阶段,本文利用深度学习技术为循环调度构建了基于Tree-LSTM的代价模型对搜索过程进行指导以加速搜索过程.经实验验证,本文提出的自动调度框架能够达到优于前沿的启发式循环优化编译器Polly的优化效果,同时本文构建的代价模型能够在10%以内的调度性能损失的前提下显著提升调度搜索过程的效率. 展开更多
关键词 自动调度 编译优化 蒙特卡洛树搜索 深度学习 长短期记忆网络
下载PDF
基于蒙特卡洛树搜索的数值目标子群发现算法
16
作者 关承彬 何振峰 《计算机系统应用》 2024年第5期195-202,共8页
MonteCloPi算法是一种基于蒙特卡洛树搜索(Monte Carlo tree search,MCTS)的任意时间子群发现算法,旨在使用MCTS策略构建非对称的最佳优先搜索树来发现高质量的多样性模式集,但是限制了目标为二值变量.为此,本文结合了数值目标的特点,... MonteCloPi算法是一种基于蒙特卡洛树搜索(Monte Carlo tree search,MCTS)的任意时间子群发现算法,旨在使用MCTS策略构建非对称的最佳优先搜索树来发现高质量的多样性模式集,但是限制了目标为二值变量.为此,本文结合了数值目标的特点,通过为置信度上界(upper confidence bound,UCB)公式选取合适的C值、动态调整各个样本的拓展权重并对搜索树进行剪枝、使用自适应top-k均值更新策略,将MonteCloPi算法拓展到了数值目标.最后,在UCI数据集、全国健康与营养调查(national health and nutrition examination survey,NHANES)听力测试数据集上的实验结果表明本文的算法相比其他算法可以发现更高质量的多样性模式集,并且最优子群的可解释性也更好. 展开更多
关键词 蒙特卡洛树搜索 子群发现 数值目标 任意时间算法
下载PDF
基于GBDT特征提取与Tent-ASO-BP网络的铣刀磨损量预测
17
作者 谭金铃 赵春华 +2 位作者 林彰稳 罗顺 李谦 《计算机集成制造系统》 EI CSCD 北大核心 2024年第4期1296-1308,共13页
为了提高机械加工过程中小样本刀具磨损量监测的准确性,提出一种基于Pearson+GBDT特征提取、Tent混沌映射和原子搜索算法(ASO)优化BP神经网络(Tent-ASO-BP)的刀具磨损量预测模型。针对BP神经网络特征选择及参数选择难题,提出了基于Pears... 为了提高机械加工过程中小样本刀具磨损量监测的准确性,提出一种基于Pearson+GBDT特征提取、Tent混沌映射和原子搜索算法(ASO)优化BP神经网络(Tent-ASO-BP)的刀具磨损量预测模型。针对BP神经网络特征选择及参数选择难题,提出了基于Pearson+GBDT的双层过滤式特征筛选方式求取网络输入特征,并使用Tent混沌映射改进原子搜索算法(ASO)对BP神经网络最优权值和阈值进行求解。通过实验证明:Tent混沌映射改善了ASO,避免ASO陷入局部极值和过早收敛,即通过交叉验证证明Tent-ASO优化BP神经网络训练模型精度较ASO高。同时,验证了梯度提升决策树(GBDT)能够筛选出用于刀具磨损值映射的一组特征,且特征筛选能力强于同类算法Light GBM、Catboost、决策树、随机森林。 展开更多
关键词 刀具磨损量 Pearson相关系数 梯度提升决策树 Tent-ASO-BP网络
下载PDF
带障碍物惩罚因子的多机器人路径规划
18
作者 闫星宇 李大焱 +2 位作者 王妮娅 张凯翔 毛剑琳 《系统仿真学报》 CAS CSCD 北大核心 2024年第3期673-685,共13页
轻载环境中,复杂障碍物区域将引起机器人之间局部冲突加剧,进而导致路径求解效率下降,针对该问题,提出轻载环境下带障碍物惩罚因子的多机器人路径规划方法。在基于冲突搜索(conflict-based search,CBS)算法框架的下层单机规划过程中,通... 轻载环境中,复杂障碍物区域将引起机器人之间局部冲突加剧,进而导致路径求解效率下降,针对该问题,提出轻载环境下带障碍物惩罚因子的多机器人路径规划方法。在基于冲突搜索(conflict-based search,CBS)算法框架的下层单机规划过程中,通过对即将拓展机器人位置的周围障碍物分布类型进行判断,赋予与之对应的障碍物惩罚因子;对路径规划过程中的惩罚因子进行累加,作为单机规划的启发值对路径进行选取;结合CBS算法框架的上层冲突消解策略进行多机器人的路径规划与冲突协调。测试结果表明,在10%障碍物分布的轻载环境中,所提算法的求解时间约为CBS算法的81.38%~83.67%,二叉约束树(constraint tree,CT)拓展量为CBS算法的60.14%~71.66%。在Gazebo中仿真表明,所提方法可减小通过复杂障碍物区域的次数。 展开更多
关键词 轻载环境 多机器人路径规划 惩罚因子 基于冲突搜索算法 约束树
下载PDF
基于无监督深度融合机制的货物在线装箱算法
19
作者 张长勇 姚凯超 王彤 《包装工程》 CAS 北大核心 2024年第11期153-162,共10页
目的针对当前三维装箱算法存在的模型鲁棒性差、泛化性弱、装载率低等问题,设计一种无监督融合机制的在线装箱算法。方法充分考虑货物“即到即码”的实时性需求,以容器空间利用率为优化目标,基于无监督深度融合指针网络端到端学习模型框... 目的针对当前三维装箱算法存在的模型鲁棒性差、泛化性弱、装载率低等问题,设计一种无监督融合机制的在线装箱算法。方法充分考虑货物“即到即码”的实时性需求,以容器空间利用率为优化目标,基于无监督深度融合指针网络端到端学习模型框架,将在线三维装箱的码垛过程公式化地表述为马尔科夫决策过程,设计强化学习要素,并以深度强化学习算法为主,融入蒙特卡洛树搜索,对智能体的决策动作进行训练,以生成具有较优“学习”能力的在线三维装箱模型。结果采用125种不同尺寸和方向随机生成货物数据集,并在7种约束条件下验证,实验结果表明,容器的平均利用率可达84.6%。结论该算法的泛化性较好,且其装载率远优于当前效果较好的启发式算法、深度学习方法,为货物的在线装箱提供了理论依据及参考。 展开更多
关键词 在线三维装箱 无监督融合机制 马尔科夫决策 指针网络 蒙特卡洛树搜索
下载PDF
回合制轨道博弈中MCTS算法的改进与应用
20
作者 郑鑫宇 张轶 +3 位作者 周杰 唐佩佳 彭升人 党朝辉 《中国空间科学技术(中英文)》 CSCD 北大核心 2024年第5期75-82,共8页
航天器回合制追逃博弈中的变轨感知延迟使得微分对策法求解困难,基于深度强化学习的博弈算法可解释性弱,在工程上的运用仍存在风险。针对航天器回合制追逃博弈问题,提出了一种预测价值积累的蒙特卡洛树搜索(PVA-MCTS)算法。该算法基于... 航天器回合制追逃博弈中的变轨感知延迟使得微分对策法求解困难,基于深度强化学习的博弈算法可解释性弱,在工程上的运用仍存在风险。针对航天器回合制追逃博弈问题,提出了一种预测价值积累的蒙特卡洛树搜索(PVA-MCTS)算法。该算法基于航天器轨道运动的可预知性,对博弈过程中的决策价值进行预测并积累,解决了航天器回合制追逃博弈奖励稀疏、时间跨度大的问题,采用的自适应扩展方法提升了学习效率。将其用于求解航天器回合制追逃博弈问题,并与蒙特卡洛树搜索(MCTS)算法求解得到的结果对比,结果表明PVA-MCTS算法对追踪航天器和逃逸航天器分别有约27.6%的追捕用时缩短和约6.8%的逃逸时间延长。该算法的提出可加快推进后续轨道博弈技术在非合作目标接近、碰撞规避等领域应用的落实落地。 展开更多
关键词 航天器追逃 回合制追逃博弈 蒙特卡洛树搜索 变轨感知延迟 预测价值积累
下载PDF
上一页 1 2 46 下一页 到第
使用帮助 返回顶部