期刊文献+
共找到24篇文章
< 1 2 >
每页显示 20 50 100
基于深度分层特征表示的行人识别方法 被引量:4
1
作者 孙锐 张广海 高隽 《电子与信息学报》 EI CSCD 北大核心 2016年第6期1528-1535,共8页
该文针对行人识别中的特征表示问题,提出一种混合结构的分层特征表示方法,这种混合结构结合了具有表示能力的词袋结构和学习适应性的深度分层结构。首先利用基于梯度的HOG局部描述符提取局部特征,再通过一个由空间聚集受限玻尔兹曼机组... 该文针对行人识别中的特征表示问题,提出一种混合结构的分层特征表示方法,这种混合结构结合了具有表示能力的词袋结构和学习适应性的深度分层结构。首先利用基于梯度的HOG局部描述符提取局部特征,再通过一个由空间聚集受限玻尔兹曼机组成的深度分层编码方法进行编码。对于每个编码层,利用稀疏性和选择性正则化进行无监督受限玻尔兹曼机学习,再应用监督微调来增强分类任务中视觉特征表示,采用最大池化和空间金字塔方法得到高层图像特征表示。最后采用线性支持向量机进行行人识别,提取深度分层特征遮挡等与目标无关部分自然分离,有效提高了后续识别的准确性。实验结果证明了所提出方法具有较高的识别率。 展开更多
关键词 行人识别 混合结构 深度学习 深度分层编码 受限玻尔兹曼机
下载PDF
GIS局部放电深度分层放电类型诊断方法研究 被引量:3
2
作者 张连根 路士杰 +2 位作者 李成榕 唐铭泽 唐志国 《高压电器》 CAS CSCD 北大核心 2019年第10期25-32,共8页
现有的GIS局部放电类型诊断主流采用单一分类器直接进行多类型划分,该方法对类间交叉重叠区域敏感,且受单一分类器固有缺陷的影响。文中提出了一种深度分层放电类型诊断方法,以逐层二分决策实现多类划分,在分层决策中优先进行良性样本... 现有的GIS局部放电类型诊断主流采用单一分类器直接进行多类型划分,该方法对类间交叉重叠区域敏感,且受单一分类器固有缺陷的影响。文中提出了一种深度分层放电类型诊断方法,以逐层二分决策实现多类划分,在分层决策中优先进行良性样本的区分,将交叉重叠区域分类问题放至深层节点进行,且在每个二分节点处可择优选用不同分类器。设计了5种典型的GIS放电模型,从放电PRPD谱图、U-Δt序列谱图的统计特征、图像特征出发,构造了16个特征参量,探索了不同分层深度值下的诊断分类正确率,并与传统直接分类方法进行了比较。结果表明:深度分层诊断相比于直接识别诊断,总体识别正确率提高了20%,尤其对直接识别诊断误判率大的沿面、颗粒类缺陷,识别正确率提升明显(30%)。 展开更多
关键词 GIS 局部放电 类型诊断 深度分层
下载PDF
琼东南盆地晚第三纪浮游有孔虫深度分层意义 被引量:3
3
作者 陈平富 《地质科技情报》 CAS CSCD 北大核心 1997年第2期38-42,共5页
依据Keler1985年、Gasperi等1993年有关中新世印度洋和太平洋浅层水、中层水和深层水浮游有孔虫深度分层组合的划分模式,对南海琼东南盆地崖13-1-4井晚第三纪浮游有孔虫作了定量研究,并分析了陆架海区浮游... 依据Keler1985年、Gasperi等1993年有关中新世印度洋和太平洋浅层水、中层水和深层水浮游有孔虫深度分层组合的划分模式,对南海琼东南盆地崖13-1-4井晚第三纪浮游有孔虫作了定量研究,并分析了陆架海区浮游有孔虫不同深度分层组合含量的变化与古地理环境变迁的关系。崖13-1-4井以浅层水、中层水组合为主,深层水组合不发育,反映该区温跃层不发育,不利于深层水浮游有孔虫的生存。滨海区,浮游有孔虫仅为少数几个浅层水的优势种,中层水浮游有孔虫不发育;内浅海区,浅层水浮游有孔虫占绝对优势,中层水浮游有孔虫处于次要地位,所含比例相对较小;外浅海区,浅层水和中层水浮游有孔虫均较发育,中层水浮游有孔虫百分含量相对较高。崖13-1-4井在上新世早、中期曾出现外浅海区。 展开更多
关键词 晚第三纪 浮游有孔虫 深度分层 古地理环境 地层
下载PDF
储粮扦样环节中的深度分层方法研究 被引量:1
4
作者 张玉荣 董永强 +1 位作者 郑佳俊 祝方清 《粮食与油脂》 北大核心 2023年第7期150-154,158,共6页
以模拟试验仓中的储藏小麦为研究对象,划分不同的深度水平,深度水平间隔为20 cm,选取5处扦样点并分别扦取其不同深度水平上的小麦,对其容重、水分、杂质、不完善粒进行测定,通过SPSS做单样本t检验和单因素方差分析,依据不同储藏深度水... 以模拟试验仓中的储藏小麦为研究对象,划分不同的深度水平,深度水平间隔为20 cm,选取5处扦样点并分别扦取其不同深度水平上的小麦,对其容重、水分、杂质、不完善粒进行测定,通过SPSS做单样本t检验和单因素方差分析,依据不同储藏深度水平之间的质量指标差异探讨粮食扦样深度分层方法。结果表明:容重随储藏深度的增加而波动上升,水分随储藏深度的增加而波动下降,不完善粒和杂质与储藏深度无明显联系。对不同深度水平上的小麦进行深度分层,综合以小麦的质量指标为判断依据时可深度分层为0~1、1~4、4~5、5~6 m。 展开更多
关键词 储粮 深度分层 扦样
下载PDF
崖19-1-1井晚第三纪浮游有孔虫深度分层及其古海洋学意义
5
作者 陈平富 董军社 《长春地质学院学报》 CSCD 1997年第3期251-256,共6页
依据GertaKeler和Gasperi,Kennett有关中新世印度洋和太平洋浅层水、中层水和深层水浮游有孔虫深度分层组合的划分模式,对南海琼东南盆地崖19-1-1井晚第三纪浮游有孔虫作了定量研究,并分析了陆架海区... 依据GertaKeler和Gasperi,Kennett有关中新世印度洋和太平洋浅层水、中层水和深层水浮游有孔虫深度分层组合的划分模式,对南海琼东南盆地崖19-1-1井晚第三纪浮游有孔虫作了定量研究,并分析了陆架海区浮游有孔虫不同深度分层组合含量的变化与古地理环境变迁的关系。崖19-1-1井以浅层水、中层水组合为主,深层水组合不发育,反映本区温跃层不发育,不利深层水浮游有孔虫的生存。滨海区,浮游有孔虫仅为少数几个浅层水的优势种,中层水浮游有孔虫不发育;内浅海区,浅层水浮游有孔虫占绝对优势,中层水浮游有孔虫处于次要地位,所含比例相对较小;外浅海区及陆坡半深海区,浅层水和中层水浮游有孔虫均较发育,中层水浮游有孔虫百分含量相对较高。崖19-1-1井在上新世早中期曾出现外浅海至陆坡半深海区。 展开更多
关键词 晚第三纪 浮游有孔虫 深度分层 古海洋学
下载PDF
深度分层强化学习研究与发展 被引量:5
6
作者 黄志刚 刘全 +2 位作者 张立华 曹家庆 朱斐 《软件学报》 EI CSCD 北大核心 2023年第2期733-760,共28页
深度分层强化学习是深度强化学习领域的一个重要研究方向,它重点关注经典深度强化学习难以解决的稀疏奖励、顺序决策和弱迁移能力等问题.其核心思想在于:根据分层思想构建具有多层结构的强化学习策略,运用时序抽象表达方法组合时间细粒... 深度分层强化学习是深度强化学习领域的一个重要研究方向,它重点关注经典深度强化学习难以解决的稀疏奖励、顺序决策和弱迁移能力等问题.其核心思想在于:根据分层思想构建具有多层结构的强化学习策略,运用时序抽象表达方法组合时间细粒度的下层动作,学习时间粗粒度的、有语义的上层动作,将复杂问题分解为数个简单问题进行求解.近年来,随着研究的深入,深度分层强化学习方法已经取得了实质性的突破,且被应用于视觉导航、自然语言处理、推荐系统和视频描述生成等生活领域.首先介绍了分层强化学习的理论基础;然后描述了深度分层强化学习的核心技术,包括分层抽象技术和常用实验环境;详细分析了基于技能的深度分层强化学习框架和基于子目标的深度分层强化学习框架,对比了各类算法的研究现状和发展趋势;接下来介绍了深度分层强化学习在多个现实生活领域中的应用;最后,对深度分层强化学习进行了展望和总结. 展开更多
关键词 人工智能 强化学习 深度强化学习 半马尔可夫决策过程 深度分层强化学习
下载PDF
基于深度分层特征的激光视觉焊缝检测与跟踪系统研究 被引量:34
7
作者 邹焱飚 周卫林 陈向志 《中国激光》 EI CAS CSCD 北大核心 2017年第4期89-100,共12页
针对自适应性低的焊缝跟踪系统在实际焊接环境中易受噪声干扰的问题,结合深度卷积神经网络强大的特征表达能力和自学习功能,研究了基于深度分层特征的焊缝检测和跟踪系统,该系统可精确地从噪声污染的时序图像中确定焊缝位置。为彻底解... 针对自适应性低的焊缝跟踪系统在实际焊接环境中易受噪声干扰的问题,结合深度卷积神经网络强大的特征表达能力和自学习功能,研究了基于深度分层特征的焊缝检测和跟踪系统,该系统可精确地从噪声污染的时序图像中确定焊缝位置。为彻底解决焊枪依循计算轨迹运动所出现的抖振问题,设计了模糊免疫自适应的智能跟踪控制算法。实验结果显示,在强烈弧光和飞溅的干扰下,传感器测量频率达20Hz,焊缝跟踪精度约为0.2060mm,且焊接过程中焊枪末端运行平稳。该系统能实现焊缝平滑的实时跟踪,抗干扰能力强,焊缝轨迹跟踪准确,能满足焊接应用要求。 展开更多
关键词 激光技术 焊缝跟踪 深度分层特征 相关滤波器 非极大值抑制 智能控制
原文传递
基于小波阈值与分层深度图像去噪算法研究 被引量:5
8
作者 陈天宇 张维忠 《青岛大学学报(工程技术版)》 CAS 2021年第2期67-71,共5页
针对Realsense深度相机提取的深度图像中背景噪声和随机噪声对图像分割及目标识别的影响,本文提出一种深度图像分层结合小波阈值去噪的算法。根据深度图像预估图像的噪声强度,确定层级间隔,将图像进行分层,选择需要去噪的图层进行小波... 针对Realsense深度相机提取的深度图像中背景噪声和随机噪声对图像分割及目标识别的影响,本文提出一种深度图像分层结合小波阈值去噪的算法。根据深度图像预估图像的噪声强度,确定层级间隔,将图像进行分层,选择需要去噪的图层进行小波阈值去噪,将完成的分层图像拼合成完整的深度图像,最后选择多幅深度图像进行对比实验。实验结果表明,该算法可有效去除深度图像中某一层级的背景噪声及特定噪声,保留了深度图像的边缘信息,具有良好的去噪效果。该研究在获取深度图像后的图像分割、目标识别、图像修复等方向具有一定的应用价值。 展开更多
关键词 深度图像 背景噪声 小波阈值去噪 深度分层
下载PDF
二维分层深度偏移技术的应用
9
作者 张志让 钟德盈 《石油地球物理勘探》 EI CSCD 北大核心 1997年第4期570-574,共5页
分层深度偏移技术是依据任一目标层段内同相轴的双程旅行时T0(x)和叠加速度VCDP(x)等运动学参数并结合钻井资料,采用正、反演相结合和反复迭代的方法建立反射界面地质模型,然后用此地质模型进行控制,采用克希霍夫积分法在界面处... 分层深度偏移技术是依据任一目标层段内同相轴的双程旅行时T0(x)和叠加速度VCDP(x)等运动学参数并结合钻井资料,采用正、反演相结合和反复迭代的方法建立反射界面地质模型,然后用此地质模型进行控制,采用克希霍夫积分法在界面处对时间剖面作深度偏移处理来实现的。采用该项技术进行目标处理省时省力。其最大的优势是可适用于速度横向变化较大的区域,解决高陡构造成价问题,成像倾角可超过90°。实际应用表明,此法能客观地反映地下构造的准确位置及形态。 展开更多
关键词 地震数据处理 分层深度偏移 地质模型
下载PDF
高光谱图像分类的融合分层深度网络联合稀疏表示算法 被引量:8
10
作者 王军浩 闫德勤 +1 位作者 刘德山 闫汇聪 《模式识别与人工智能》 EI CSCD 北大核心 2020年第4期303-312,共10页
在高光谱图像分类领域中每个像素的局部邻域一旦包含来自不同类别的样本,联合稀疏表示将受邻域内字典原子与测试样本之间同谱异类的影响,严重降低分类性能.根据高光谱图像的特点,文中提出融合分层深度网络的联合稀疏表示算法.在光谱和... 在高光谱图像分类领域中每个像素的局部邻域一旦包含来自不同类别的样本,联合稀疏表示将受邻域内字典原子与测试样本之间同谱异类的影响,严重降低分类性能.根据高光谱图像的特点,文中提出融合分层深度网络的联合稀疏表示算法.在光谱和空间特征学习之间交替提取判别性光谱信息和空间信息,构建兼具空谱特征的学习字典,用于联合稀疏表示.在分类过程中将学习字典与测试样本间的相关系数与分类误差融合并决策.在两个高光谱遥感数据集上的实验验证文中算法的有效性. 展开更多
关键词 高光谱遥感图像 联合稀疏表示 分层深度网络 相关系数
下载PDF
结合分层深度网络与双向五元组损失的跨模态异常检测
11
作者 范烨 彭淑娟 +2 位作者 柳欣 崔振 王楠楠 《计算机研究与发展》 EI CSCD 北大核心 2022年第12期2770-2780,共11页
大数据环境下的跨模态异常检测是一个非常有价值且极具挑战性的工作.针对目前已有跨模态异常检测框架对数据异常值类型检测不全面以及数据利用率较低的问题,提出了一个结合分层深度网络与相似度双向五元组损失的跨模态异常检测方法.首先... 大数据环境下的跨模态异常检测是一个非常有价值且极具挑战性的工作.针对目前已有跨模态异常检测框架对数据异常值类型检测不全面以及数据利用率较低的问题,提出了一个结合分层深度网络与相似度双向五元组损失的跨模态异常检测方法.首先,提出的框架引入一个单视图异常检测网络层,通过模态内近邻样本相似度来检测数据样本中是否存在属性异常与部分属性类别异常点;接着,提出基于相似度双向五元组损失的双分支深度网络用于检测数据中的类别异常与剩余部分的属性类别异常,该损失一方面能够使不同属性数据正交化,另一方面使得相同属性数据之间线性相关,从而有效地加大了不同属性数据之间的特征差异性,以及增加了相同属性之间的特征相关性;同时,提出的双分支网络通过模态间双向约束和模态内的邻域约束,极大提高了数据利用率和模型的泛化能力.实验结果表明,所提出的框架可以全面检测出不同模态中所有的异常类型样本点,并且表现优于现有的可应用于跨模态异常检测的方法,优势明显. 展开更多
关键词 跨模态异常检测 分层深度网络 双向五元组损失 邻域约束 双向约束
下载PDF
深度备课——初中英语分层精选作业的策略研究 被引量:2
12
作者 聂爱萍 《科学大众(智慧教育)》 2018年第5期10-11,共2页
教师在初中英语教学过程中,根据学生的原有知识水平、个体认知水平的差异和学习发展潜力的差异以及接受能力等基点出发,通过深度备课,设置适合学生学情的作业,改变传统的作业布置方式,实施因材施教的教学方法和分层精选作业的教学策略,... 教师在初中英语教学过程中,根据学生的原有知识水平、个体认知水平的差异和学习发展潜力的差异以及接受能力等基点出发,通过深度备课,设置适合学生学情的作业,改变传统的作业布置方式,实施因材施教的教学方法和分层精选作业的教学策略,满足不同学习层次的学生的学习需求。通过实践证明:经过将学生分层、作业分层和作业批改与评价方式分层等,既可以提高教学效率,又可以提高学生学习积极性,还可以减轻师生的学习负担。 展开更多
关键词 初中英语 深度备课分层 策略
下载PDF
面向RGB-D场景解析的三维空间结构化编码深度网络 被引量:1
13
作者 王泽宇 吴艳霞 +1 位作者 张国印 布树辉 《计算机应用》 CSCD 北大核心 2017年第12期3458-3466,共9页
有效的RGB-D图像特征提取和准确的3D空间结构化学习是提升RGB-D场景解析结果的关键。目前,全卷积神经网络(FCNN)具有强大的特征提取能力,但是,该网络无法充分地学习3D空间结构化信息。为此,提出了一种新颖的三维空间结构化编码深度网络... 有效的RGB-D图像特征提取和准确的3D空间结构化学习是提升RGB-D场景解析结果的关键。目前,全卷积神经网络(FCNN)具有强大的特征提取能力,但是,该网络无法充分地学习3D空间结构化信息。为此,提出了一种新颖的三维空间结构化编码深度网络,内嵌的结构化学习层有机地结合了图模型网络和空间结构化编码算法。该算法能够比较准确地学习和描述物体所处3D空间的物体分布。通过该深度网络,不仅能够提取包含多层形状和深度信息的分层视觉特征(HVF)和分层深度特征(HDF),而且可以生成包含3D结构化信息的空间关系特征,进而得到融合上述3类特征的混合特征,从而能够更准确地表达RGB-D图像的语义信息。实验结果表明,在NYUDv2和SUNRGBD标准RGB-D数据集上,该深度网络较现有先进的场景解析方法能够显著提升RGB-D场景解析的结果。 展开更多
关键词 全卷积神经网络 图模型 空间结构化编码算法 分层视觉特征 分层深度特征 空间关系特征 混合特征
下载PDF
基于分层网络与局部约束的高光谱图像分类
14
作者 张景 闫德勤 +1 位作者 于佳宁 刘德山 《智能计算机与应用》 2022年第4期61-69,共9页
高光谱图像存在高维度、带间相关性较高的特点,分类过程中也存在同谱异类的问题。为此,提出一种基于分层网络与局部约束的高光谱图像分类方法。该方法通过空谱信息训练分层深度网络,并与局部约束信息结合实现对高维数据的特征提取。同时... 高光谱图像存在高维度、带间相关性较高的特点,分类过程中也存在同谱异类的问题。为此,提出一种基于分层网络与局部约束的高光谱图像分类方法。该方法通过空谱信息训练分层深度网络,并与局部约束信息结合实现对高维数据的特征提取。同时,融合训练样本与测试样本的类内相似性,以提高分类的准确性。在2个高光谱数据集Indian Pines和Pavia University上的实验结果表明,该算法分类性能比其他分类算法精度上有了较大提高。 展开更多
关键词 高光谱图像 分层深度网络 局部约束 相关系数 稀疏表示
下载PDF
确定岩石抗钻特性空间分布规律的新方法 被引量:10
15
作者 胡棚杰 李忠慧 +3 位作者 蒋战峰 楼一珊 杨明合 张艳 《石油机械》 北大核心 2021年第1期11-19,共9页
现有岩石抗钻特性分布规律的确定方法存在同一深度岩石抗钻特性分布不连续、应用测井资料不能建立岩石抗钻特性空间分布规律的问题。鉴于此,测定了新疆玛湖凹陷百口泉组地层岩心的单轴抗压强度、硬度和可钻性级值等,结合岩心对应深度的... 现有岩石抗钻特性分布规律的确定方法存在同一深度岩石抗钻特性分布不连续、应用测井资料不能建立岩石抗钻特性空间分布规律的问题。鉴于此,测定了新疆玛湖凹陷百口泉组地层岩心的单轴抗压强度、硬度和可钻性级值等,结合岩心对应深度的测井资料,建立了基于测井数据的岩石抗钻特性参数计算模型。将地层岩石抗钻特性参数的空间分布规律问题转化为纵横分布问题,在纵向上采用深度分层归一化处理法,消除了不同井位的地层厚度和海拔高度不同对岩石抗钻特性参数平面分布连续性的影响。在横向上采用克里金插值法,实现抗钻特性参数在横向分布上的最优线性无偏差估计。通过层深坐标系建立岩石抗钻特性参数横向分布规律的纵向联系,实现岩石抗钻特性参数的空间分布,形成了一种分析岩石抗钻特性参数空间分布规律的新方法。应用新方法对玛湖凹陷百口泉组地层的岩石抗钻特性参数空间分布规律进行预测,预测精确度达到90%以上。研究结果可为钻井提速方案的制定提供一定的参考。 展开更多
关键词 岩石 抗钻特性 分布规律 深度分层归一化 克里金插值法
下载PDF
硬件加速的渐进式多边形模型布尔运算 被引量:1
16
作者 赵汉理 孟庆如 +2 位作者 金小刚 黄辉 王明 《计算机辅助设计与图形学学报》 EI CSCD 北大核心 2015年第7期1196-1202,共7页
多边形模型的布尔运算中包含复杂的求交计算以及多边形重建过程,精度控制和处理效率是其中的关键.为了降低布尔运算复杂度,提出一种适合硬件加速的基于渐进式布尔运算的多层次细节网格模型生成方法.该方法采用分层深度图像来近似表示多... 多边形模型的布尔运算中包含复杂的求交计算以及多边形重建过程,精度控制和处理效率是其中的关键.为了降低布尔运算复杂度,提出一种适合硬件加速的基于渐进式布尔运算的多层次细节网格模型生成方法.该方法采用分层深度图像来近似表示多边形实体的封闭边界,将多边形的求交计算简化为坐标轴平行的采样点的实体内外部判断;为了免去各层次细节模型的重复采样过程,渐进式地将边界采样点归并到低分辨率下的立方体中;运用特征保持的多边形重建算法将相同立方体内的边界采样点转换成多边形顶点,根据邻接关系生成网格模型.上述算法使用支持图形硬件加速的CUDA编程并行实现.实验结果表明了算法的可行性. 展开更多
关键词 布尔运算 分层深度图像 GPU
下载PDF
基于分层深度强化学习的机械臂控制方法研究 被引量:2
17
作者 白雪宁 《自动化与仪器仪表》 2019年第10期121-123,共3页
针对现阶段机械臂控制困难、学习效率低的问题,基于分层深度强化学习,提出了通过以非线性微分方程表示的动态运动基元的协调配合来提高机械臂的学习效率和动态适应性的方法。此外,还提出了元控制器和子控制器的概念,分别用于策略的学习... 针对现阶段机械臂控制困难、学习效率低的问题,基于分层深度强化学习,提出了通过以非线性微分方程表示的动态运动基元的协调配合来提高机械臂的学习效率和动态适应性的方法。此外,还提出了元控制器和子控制器的概念,分别用于策略的学习与目标任务的实现,从而实现层级概念和深度强化学习的结合。通过到达指定目标的仿真实验,验证了基于动态运动基元的分层强化学习方法的有效性。 展开更多
关键词 分层深度强化学习 机械臂 动态运动基元
原文传递
基于分层深度强化学习的移动机器人导航方法 被引量:9
18
作者 王童 李骜 +2 位作者 宋海荦 刘伟 王明会 《控制与决策》 EI CSCD 北大核心 2022年第11期2799-2807,共9页
针对现有基于深度强化学习(deep reinforcement learning,DRL)的分层导航方法在包含长廊、死角等结构的复杂环境下导航效果不佳的问题,提出一种基于option-based分层深度强化学习(hierarchical deep reinforcement learning,HDRL)的移... 针对现有基于深度强化学习(deep reinforcement learning,DRL)的分层导航方法在包含长廊、死角等结构的复杂环境下导航效果不佳的问题,提出一种基于option-based分层深度强化学习(hierarchical deep reinforcement learning,HDRL)的移动机器人导航方法.该方法的模型框架分为高层和低层两部分,其中低层的避障和目标驱动控制模型分别实现避障和目标接近两种行为策略,高层的行为选择模型可自动学习稳定、可靠的行为选择策略,从而有效避免对人为设计调控规则的依赖.此外,所提出方法通过对避障控制模型进行优化训练,使学习到的避障策略更加适用于复杂环境下的导航任务.在与现有DRL方法的对比实验中,所提出方法在全部仿真测试环境中均取得最高的导航成功率,同时在其他指标上也具有整体优势,表明所提出方法可有效解决复杂环境下导航效果不佳的问题,且具有较强的泛化能力.此外,真实环境下的测试进一步验证了所提出方法的潜在应用价值. 展开更多
关键词 深度强化学习 分层深度强化学习 移动机器人 导航 避障 策略学习
原文传递
基于优化子目标数的Option-Critic算法 被引量:3
19
作者 刘成浩 朱斐 刘全 《计算机学报》 EI CAS CSCD 北大核心 2021年第9期1922-1933,共12页
时间抽象是分层强化学习中的重要研究方向,而子目标是时间抽象形成的核心元素.目前,大部分分层强化学习需要人工给出子目标或设定子目标数量.然而,在很多情况下,这不仅需要大量的人工干预,而且所作设定未必适合对应场景,在动态环境未知... 时间抽象是分层强化学习中的重要研究方向,而子目标是时间抽象形成的核心元素.目前,大部分分层强化学习需要人工给出子目标或设定子目标数量.然而,在很多情况下,这不仅需要大量的人工干预,而且所作设定未必适合对应场景,在动态环境未知的指导下,这一问题尤为突出.针对此,提出基于优化子目标数的Option-Critic算法(Option-Critic algorithm based on Sub-goal Quantity Optimization,OC-SQO),增加了智能体对环境的探索部分,通过与环境的简单交互,得到适用于应用场景的初始子目标数量估值,并在此基础上识别子目标,然后利用通过策略梯度生成对应的抽象,使用初态、内部策略和终止函数构成的三元组表示,以此进行训练,根据交互得到的抽象改变当前状态,不断迭代优化.OC-SQO算法可以在任意状态下开始执行,不要求预先指定子目标和参数,在执行过程中使用策略梯度生成内部策略、抽象间策略和终止函数,不需要提供内部奖赏信号,也无需获取子目标的情况,尽可能地减少了人工干预.实验验证了算法的有效性. 展开更多
关键词 分层深度强化学习 时间抽象 子目标 强化学习 OPTION
下载PDF
关于箱形基础设计
20
作者 徐黎韵 《上海冶金设计》 1993年第4期54-54,共1页
关键词 箱形基础 设计计算 温光勘法 郭尔布诺尔法 有限深度分层综合法
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部