期刊文献+
共找到542篇文章
< 1 2 28 >
每页显示 20 50 100
Application of the asynchronous advantage actor–critic machine learning algorithm to real-time accelerator tuning 被引量:3
1
作者 Yun Zou Qing-Zi Xing +4 位作者 Bai-Chuan Wang Shu-Xin Zheng Cheng Cheng Zhong-Ming Wang Xue-Wu Wang 《Nuclear Science and Techniques》 SCIE CAS CSCD 2019年第10期133-141,共9页
This paper describes a real-time beam tuning method with an improved asynchronous advantage actor–critic(A3C)algorithm for accelerator systems.The operating parameters of devices are usually inconsistent with the pre... This paper describes a real-time beam tuning method with an improved asynchronous advantage actor–critic(A3C)algorithm for accelerator systems.The operating parameters of devices are usually inconsistent with the predictions of physical designs because of errors in mechanical matching and installation.Therefore,parameter optimization methods such as pointwise scanning,evolutionary algorithms(EAs),and robust conjugate direction search are widely used in beam tuning to compensate for this inconsistency.However,it is difficult for them to deal with a large number of discrete local optima.The A3C algorithm,which has been applied in the automated control field,provides an approach for improving multi-dimensional optimization.The A3C algorithm is introduced and improved for the real-time beam tuning code for accelerators.Experiments in which optimization is achieved by using pointwise scanning,the genetic algorithm(one kind of EAs),and the A3C-algorithm are conducted and compared to optimize the currents of four steering magnets and two solenoids in the low-energy beam transport section(LEBT)of the Xi’an Proton Application Facility.Optimal currents are determined when the highest transmission of a radio frequency quadrupole(RFQ)accelerator downstream of the LEBT is achieved.The optimal work points of the tuned accelerator were obtained with currents of 0 A,0 A,0 A,and 0.1 A,for the four steering magnets,and 107 A and 96 A for the two solenoids.Furthermore,the highest transmission of the RFQ was 91.2%.Meanwhile,the lower time required for the optimization with the A3C algorithm was successfully verified.Optimization with the A3C algorithm consumed 42%and 78%less time than pointwise scanning with random initialization and pre-trained initialization of weights,respectively. 展开更多
关键词 REAL-TIME BEAM tuning Parameter optimization ASYNCHRONOUS ADVANTAGE actor–critic algorithm Low-energy BEAM transport
下载PDF
基于兴趣函数的多样化Option-Critic算法
2
作者 栗军伟 刘全 +1 位作者 黄志刚 徐亚鹏 《计算机研究与发展》 EI CSCD 北大核心 2024年第12期3108-3120,共13页
Option框架作为分层强化学习的一种常用时序抽象方法,允许智能体在不同的时间尺度上学习策略,可以有效解决稀疏奖励问题.为了保证Option可以引导智能体访问更多的状态空间,一些方法通过引入基于互信息的内部奖励和终止函数来提升Option... Option框架作为分层强化学习的一种常用时序抽象方法,允许智能体在不同的时间尺度上学习策略,可以有效解决稀疏奖励问题.为了保证Option可以引导智能体访问更多的状态空间,一些方法通过引入基于互信息的内部奖励和终止函数来提升Option内部策略的多样性.但这会导致算法学习速度慢和内部策略的知识迁移能力低等问题,严重影响了算法性能.针对以上问题,提出基于兴趣函数优化的多样化Option-Critic算法(diversity-enriched Option-Critic algorithm with interest functions,DEOC-IF).该算法在多样化Option-Critic算法(diversity-enriched Option-Critic,DEOC)的基础上,通过引入兴趣函数约束上层策略对Option内部策略的选择,既保证了Option集合的多样性,又使得学习到的内部策略可以关注状态空间的不同区域,有利于提高算法的知识迁移能力,加快学习速度.此外,DEOC-IF算法引入一种新的兴趣函数更新梯度,有利于提高算法的探索能力.为了验证算法的有效性和知识迁移能力,分别在4房间导航任务、Mujoco和MiniWorld实验环境中,将DEOC-IF算法与其他最新算法进行对比实验.结果表明,DEOC-IF算法具有更好的性能优势和策略迁移能力. 展开更多
关键词 强化学习 时序抽象 Option框架 兴趣函数 Option-critic算法
下载PDF
EZDCP:A new static task scheduling algorithm with edge-zeroing based on dynamic critical paths 被引量:1
3
作者 陈志刚 华强胜 《Journal of Central South University of Technology》 2003年第2期140-144,共5页
A new static task scheduling algorithm named edge-zeroing based on dynamic critical paths is proposed. The main ideas of the algorithm are as follows: firstly suppose that all of the tasks are in different clusters; s... A new static task scheduling algorithm named edge-zeroing based on dynamic critical paths is proposed. The main ideas of the algorithm are as follows: firstly suppose that all of the tasks are in different clusters; secondly, select one of the critical paths of the partially clustered directed acyclic graph; thirdly, try to zero one of graph communication edges; fourthly, repeat above three processes until all edges are zeroed; finally, check the generated clusters to see if some of them can be further merged without increasing the parallel time. Comparisons of the previous algorithms with edge-zeroing based on dynamic critical paths show that the new algorithm has not only a low complexity but also a desired performance comparable or even better on average to much higher complexity heuristic algorithms. 展开更多
关键词 EZDCP directed ACYCLIC graph DYNAMIC critical PATH TASK scheduling algorithm
下载PDF
Actor-critic框架下的二次指派问题求解方法
4
作者 李雪源 韩丛英 《中国科学院大学学报(中英文)》 CAS CSCD 北大核心 2024年第2期275-284,共10页
二次指派问题(QAP)属于NP-hard组合优化问题,在现实生活中有着广泛应用。目前相对成熟的启发式算法通常以问题为导向来设计定制化算法,缺乏迁移泛化能力。为提供一个统一的QAP求解策略,将QAP问题的流量矩阵及距离矩阵抽象成两个无向完... 二次指派问题(QAP)属于NP-hard组合优化问题,在现实生活中有着广泛应用。目前相对成熟的启发式算法通常以问题为导向来设计定制化算法,缺乏迁移泛化能力。为提供一个统一的QAP求解策略,将QAP问题的流量矩阵及距离矩阵抽象成两个无向完全图并构造相应的关联图,从而将设施和地点的指派任务转化为关联图上的节点选择任务,基于actor-critic框架,提出一种全新的求解算法ACQAP。首先,利用多头注意力机制构造策略网络,处理来自图卷积神经网络的节点表征向量;然后,通过actor-critic算法预测每个节点被作为最优节点输出的概率;最后,依据该概率在可行时间内输出满足目标奖励函数的动作决策序列。该算法摆脱人工设计,且适用于不同规模的输入,更加灵活可靠。实验结果表明,在QAPLIB实例上,本算法在精度媲美传统启发式算法的前提下,迁移泛化能力更强;同时相对于NGM等基于学习的算法,求解的指派费用与最优解之间的偏差最小,且在大部分实例中,偏差均小于20%。 展开更多
关键词 二次指派问题 图卷积神经网络 深度强化学习 多头注意力机制 actor-critic算法
下载PDF
基于CRITIC赋权法与PSO-SVR模型的滑坡地表位移预测
5
作者 曾子健 肖慧 +2 位作者 徐哈宁 胡佳超 范凌峰 《科学技术与工程》 北大核心 2024年第35期14940-14946,共7页
针对支持向量机在滑坡位移预测中输入项权值无差异,从而影响模型预测精度的问题,提出一种基于CRITIC(criteria importance though intercrieria correlation)赋权法与粒子群优化算法(particle swarm optimization,PSO)支持向量回归机(su... 针对支持向量机在滑坡位移预测中输入项权值无差异,从而影响模型预测精度的问题,提出一种基于CRITIC(criteria importance though intercrieria correlation)赋权法与粒子群优化算法(particle swarm optimization,PSO)支持向量回归机(support vector regression,SVR)的滑坡位移预测模型。该模型首先采用皮尔逊相关性分析法,选取与模型输出项相关性较强的三项影响因素,然后由CRITIC赋权法求得对应权值,将加权后的训练集输入基于CRITIC赋权法与PSO-SVR的预测模型,以实现对滑坡地表位移的预测。结果表明:相比SVR、PSO-SVR以及基于熵权法与PSO-SVR的预测模型,本模型具有良好的泛化能力,均方根误差和判定系数分别比未赋权模型降低38.24%和提高6.64%,能有效提高预测精度,预测效果优于其他对比模型。 展开更多
关键词 滑坡位移预测 critic赋权法 粒子群优化算法 支持向量回归机
下载PDF
基于CRITIC和多策略秃鹰优化BiLSTM的水质预测研究
6
作者 雷冰冰 韩镏 +2 位作者 石佳圆 马占有 牟云飞 《安全与环境学报》 CAS CSCD 北大核心 2024年第9期3688-3702,共15页
科学有效地预测水质对于水环境的可持续发展和人类健康具有重要意义,为此以固原市某黄河断面的水质监测数据为研究对象,提出了基于指标客观性的权重赋权(Criteria Importance Though Intercriteria Correlation,CRITIC)法和改进的秃鹰搜... 科学有效地预测水质对于水环境的可持续发展和人类健康具有重要意义,为此以固原市某黄河断面的水质监测数据为研究对象,提出了基于指标客观性的权重赋权(Criteria Importance Though Intercriteria Correlation,CRITIC)法和改进的秃鹰搜索(Improved Bald Eagle Search,IBES)算法优化双向长短时记忆网络(Bidirectional Long Short-Term Memory Network,BiLSTM)的组合水质等级预测模型。首先,采用CRITIC法确定各水质指标的权重,加权求和获得一项综合水质指标,从而提出一种改进的水质评价指标体系,以为BiLSTM提供更丰富、更可靠的水质特征信息。其次,在训练过程中引入Logistic映射和莱维飞行策略,并设计交叉共享及准反向搜索策略优化秃鹰搜索(Bald Eagle Search,BES)算法,以提升其种群多样性,增强寻优能力。最后,通过IBES算法迭代寻找BiLSTM的最佳学习率、隐藏层节点数以及正则化系数的超参数组合,进一步提高其预测水平。结果显示:与IBES-BiLSTM、BES-BiLSTM、GA-BiLSTM、PSO-BiLSTM和BiLSTM等模型相比,CRITIC-IBES-BiLSTM模型进行水质等级预测的准确率、精准率、召回率及F_(1)均最高,且具有更好的稳定性。 展开更多
关键词 环境工程学 水质预测 指标客观性的权重赋权法(critic)法 改进的秃鹰搜索算法 双向长短时记忆网络(BiLSTM)
下载PDF
Actor-Critic框架下的数据驱动异步电机离线参数辨识方法 被引量:8
7
作者 漆星 张倩 《电工技术学报》 EI CSCD 北大核心 2019年第9期1875-1885,共11页
电动汽车用电机的参数辨识可以使电机在任意转速下尽可能输出更高的转矩及效率,是优化电机输出性能的重要手段。传统的基于模型驱动的参数辨识方法的缺点为易受模型误差的影响、抗干扰能力差以及无法实现全转速范围内的转矩最优。鉴于... 电动汽车用电机的参数辨识可以使电机在任意转速下尽可能输出更高的转矩及效率,是优化电机输出性能的重要手段。传统的基于模型驱动的参数辨识方法的缺点为易受模型误差的影响、抗干扰能力差以及无法实现全转速范围内的转矩最优。鉴于上述缺点,该文研究了一种完全基于实际数据的电动汽车用异步电机离线参数辨识方法,对电机的转子电阻和励磁电感在任意转速下进行了优化,从而使电机能够在特定转速和特定电流下输出最优转矩。为达到电机在特定转速和电流下输出转矩最优的目的,研究了一种基于Actor-Critic框架的电动汽车用异步电机离线参数辨识方法,确定了框架中的观测、奖励和动作的设计。实验证明相对于传统参数辨识方法,该文方法具有更高的精确性和鲁棒性,同时确保了电动汽车用异步电机在任意转速下的输出转矩最优。 展开更多
关键词 异步电机参数辨识数据驱动Actor-critic 框架
下载PDF
基于改进Actor-Critic算法的多传感器交叉提示技术
8
作者 韦道知 张曌宇 +1 位作者 谢家豪 李宁 《系统工程与电子技术》 EI CSCD 北大核心 2023年第6期1624-1632,共9页
针对在减少战场资源浪费、平衡战场效费比的同时提高目标探测概率,保证目标的可持续跟踪,提出利用改进Actor-Critic算法的多传感器交叉提示技术进行目标探测。首先,综合传感器探测、能耗、时效等因素搭建基于“交叉提示”传感器的动态... 针对在减少战场资源浪费、平衡战场效费比的同时提高目标探测概率,保证目标的可持续跟踪,提出利用改进Actor-Critic算法的多传感器交叉提示技术进行目标探测。首先,综合传感器探测、能耗、时效等因素搭建基于“交叉提示”传感器的动态管理评估模型;其次,重点分析利用Actor-Critic交叉提示算法的传感器管理决策规则,并且提出了Actor-Critic算法,以根据任务自身需求组建中央评价网络,加大传感器与外部环境的交互。仿真结果表明,改进的算法可以加速网络收益,实现对目标的持续性探测,加强传感器之间的交叉提示功能,提升调度的智能化水平,具有较大的应用价值。 展开更多
关键词 多传感器交叉提示 Actor-critic算法 强化学习 目标探测 传感器资源调度
下载PDF
基于CRITIC算法的绿色制造合作伙伴选择 被引量:3
9
作者 刘嘉 汪永超 陈坤 《工具技术》 北大核心 2021年第2期43-47,共5页
绿色制造综合考虑了经济效益和环境影响,在现代制造中具有举足轻重的地位。由于实际生产运营中决策者对合作伙伴的选择涉及多指标多方案,因此存在主观性和模糊性等不足,而运用CRITIC算法可以解决面向绿色制造供应链合作伙伴的多目标选... 绿色制造综合考虑了经济效益和环境影响,在现代制造中具有举足轻重的地位。由于实际生产运营中决策者对合作伙伴的选择涉及多指标多方案,因此存在主观性和模糊性等不足,而运用CRITIC算法可以解决面向绿色制造供应链合作伙伴的多目标选择问题。本文运用可拓层次分析法,综合企业生产能力、质量评估、业务能力、合作互补性以及环境影响等因素来建立合作伙伴选择方案模型,并以某工厂的合作伙伴选择为例,验证了该方法对供应链合作伙伴选择具有可行性。 展开更多
关键词 合作伙伴 绿色制造 critic算法 组合赋权
下载PDF
基于Actor-Critic算法的多无人机协同空战目标重分配方法 被引量:2
10
作者 陈宇轩 王国强 +1 位作者 罗贺 马滢滢 《无线电工程》 北大核心 2022年第7期1266-1275,共10页
目标重分配问题是多无人机协同空战中亟需解决的关键问题之一。考虑到空战中的不确定性、实时性等特点,建立了多无人机协同空战目标重分配问题的数学模型,结合强化学习核心概念,提出了基于Actor-Critic算法的多无人机协同空战目标重分... 目标重分配问题是多无人机协同空战中亟需解决的关键问题之一。考虑到空战中的不确定性、实时性等特点,建立了多无人机协同空战目标重分配问题的数学模型,结合强化学习核心概念,提出了基于Actor-Critic算法的多无人机协同空战目标重分配框架,构建了基于目标重分配的马尔科夫决策过程、Actor网络结构和Critic网络结构。针对强化学习算法中存在的奖励稀疏问题,设计了局部回报和全局汇报相结合的双层回报函数。在基于VR-Forces仿真平台中验证了该方法的有效性。实验结果表明,提出的多无人机协同空战目标重分配方法能够有效地提升空战对抗的胜率。 展开更多
关键词 无人机 空战 目标重分配 强化学习 Actor-critic算法
下载PDF
基于actor-critic算法的分数阶多自主体系统最优主-从一致性控制 被引量:4
11
作者 马丽新 刘晨 刘磊 《应用数学和力学》 CSCD 北大核心 2022年第1期104-114,共11页
研究了分数阶多自主体系统的最优主-从一致性问题.在考虑控制器周期间歇的前提下,将分数阶微分的一阶近似逼近式、事件触发机制和强化学习中的actor-critic算法有机整合,设计了基于周期间歇事件触发策略的强化学习算法结构.最后,通过数... 研究了分数阶多自主体系统的最优主-从一致性问题.在考虑控制器周期间歇的前提下,将分数阶微分的一阶近似逼近式、事件触发机制和强化学习中的actor-critic算法有机整合,设计了基于周期间歇事件触发策略的强化学习算法结构.最后,通过数值仿真实验证明了该算法的可行性和有效性. 展开更多
关键词 分数阶多自主体系统 actor-critic算法 最优主-从一致性 事件触发 间歇
下载PDF
基于CRITIC权与灰色关联的隐写分析算法综合评估 被引量:9
12
作者 王磊 高茂庭 《计算机工程》 CAS CSCD 北大核心 2017年第4期154-159,共6页
在基于灰色关联分析的隐写分析算法评估过程中,针对权值分配不合理的问题,采用标准间重要性相关性方法确定各指标的初始权重,结合决策情况对待主动修改的指标权重进行增减,并将这些增减的权重平均分配给被动变化的指标,从而实现对权重... 在基于灰色关联分析的隐写分析算法评估过程中,针对权值分配不合理的问题,采用标准间重要性相关性方法确定各指标的初始权重,结合决策情况对待主动修改的指标权重进行增减,并将这些增减的权重平均分配给被动变化的指标,从而实现对权重的调整,得到各指标的最终权值。运用灰色关联分析法计算各个待评价对象与最优序列之间的加权灰色关联度,并依据加权关联度的大小完成对隐写分析算法的评估。仿真结果表明,与其他隐写分析算法相比,该方法能更加有效地评估各类隐写分析算法的优劣。 展开更多
关键词 隐写分析 算法性能评估 标准间重要性相关性权 灰色关联分析 权值分配
下载PDF
基于AHP-CRITIC算法的线损异常分析方法研究 被引量:5
13
作者 徐凌燕 杨凤欣 +1 位作者 张海鑫 陈晓峰 《信息技术》 2020年第12期116-120,共5页
传统方法在对配电网配电线损异常进行分析时,未进行馈线分类,线损率误差较大,配电网安全性不佳。为此,引入AHP-CRITIC算法,对配电网配电线损异常分析问题进行优化。根据AHP方法确定相关指标属性的主观权重,利用CRITIC方法确定相关指标... 传统方法在对配电网配电线损异常进行分析时,未进行馈线分类,线损率误差较大,配电网安全性不佳。为此,引入AHP-CRITIC算法,对配电网配电线损异常分析问题进行优化。根据AHP方法确定相关指标属性的主观权重,利用CRITIC方法确定相关指标属性的客观权重,再设置综合权重向量,提取所需聚类指标参数实现配电网配电馈线的分类。通过等值电阻法计算配电网配电极限线损率,根据馈线分类结果,实现配电网配电多种馈线线损异常分析。结果表明,所提方法对配电网的极限线损率分析误差极小,可准确分析配电网配电线损异常问题。 展开更多
关键词 AHP critic算法 配电网 线损 异常
下载PDF
基于Actor-Critical架构的5G Massive MIMO波束能效的研究与应用
14
作者 乔勇 葛昌帅 +1 位作者 张天兴 鲁晓峰 《通信技术》 2022年第12期1642-1649,共8页
大规模阵列天线技术(Massive Multiple Input Multiple Output,Massive MIMO)作为第五代移动通信(5G)的无线核心技术,实现了多波束空间覆盖增强,然而5G Massive MIMO的多波束射频高能耗、多波束碰撞和增加的干扰造会成5G网络能效下降,... 大规模阵列天线技术(Massive Multiple Input Multiple Output,Massive MIMO)作为第五代移动通信(5G)的无线核心技术,实现了多波束空间覆盖增强,然而5G Massive MIMO的多波束射频高能耗、多波束碰撞和增加的干扰造会成5G网络能效下降,运营成本增高。基于3D数字地图、基站工程参数、终端上报的测量报告/最小化路测(Measurement Report/Minimization of Drive Test,MR/MDT)数据、用户/业务分布构建的三维数字孪生栅格,通过卷积长短期记忆(Convolutional Long Short Term Memory,Conv-LSTM)算法对栅格内的用户分布、业务分布进行分析和预测,通过Actor-Critic架构对5G波束配置和优化策略进行评估,实现不同场景、时段的5G波束最佳能效,智能适应5G网络潮汐效应,实现“网随业动”。 展开更多
关键词 大规模阵列天线技术 数字孪生 Actor-critic算法架构 波束能效
下载PDF
基于柔性演员-评论家算法的决策规划协同研究 被引量:1
15
作者 唐斌 刘光耀 +3 位作者 江浩斌 田宁 米伟 王春宏 《交通运输系统工程与信息》 EI CSCD 北大核心 2024年第2期105-113,187,共10页
为了解决基于常规深度强化学习(Deep Reinforcement Learning, DRL)的自动驾驶决策存在学习速度慢、安全性及合理性较差的问题,本文提出一种基于柔性演员-评论家(Soft Actor-Critic,SAC)算法的自动驾驶决策规划协同方法,并将SAC算法与... 为了解决基于常规深度强化学习(Deep Reinforcement Learning, DRL)的自动驾驶决策存在学习速度慢、安全性及合理性较差的问题,本文提出一种基于柔性演员-评论家(Soft Actor-Critic,SAC)算法的自动驾驶决策规划协同方法,并将SAC算法与基于规则的决策规划方法相结合设计自动驾驶决策规划协同智能体。结合自注意力机制(Self Attention Mechanism, SAM)和门控循环单元(Gate Recurrent Unit, GRU)构建预处理网络;根据规划模块的具体实现方式设计动作空间;运用信息反馈思想设计奖励函数,给智能体添加车辆行驶条件约束,并将轨迹信息传递给决策模块,实现决策规划的信息协同。在CARLA自动驾驶仿真平台中搭建交通场景对智能体进行训练,并在不同场景中将所提出的决策规划协同方法与常规的基于SAC算法的决策规划方法进行比较,结果表明,本文所设计的自动驾驶决策规划协同智能体学习速度提高了25.10%,由其决策结果生成的平均车速更高,车速变化率更小,更接近道路期望车速,路径长度与曲率变化率更小。 展开更多
关键词 智能交通 自动驾驶 柔性演员-评论家算法 决策规划协同 深度强化学习
下载PDF
Cellular automation model of faults and algorithmic complexity
16
作者 陆远忠 吕悦军 《Acta Seismologica Sinica(English Edition)》 CSCD 1994年第2期235-244,共10页
In this paper, we use the cellular automation model to imitate earthquake process and draw some conclusionsof general applicability. First, it is confirmed that earthquake process has some ordering characters, and it ... In this paper, we use the cellular automation model to imitate earthquake process and draw some conclusionsof general applicability. First, it is confirmed that earthquake process has some ordering characters, and it isshown that both the existence and their mutual arrangement of faults could obviously influence the overallcharacters of earthquake process. Then the characters of each stage of model evolution are explained withself-organized critical state theory. Finally, earthquake sequences produced by the models are analysed interms pf algorithmic complexity and the result shows that AC-values of algorithmic complexity could be usedto study earthquake process and evolution. 展开更多
关键词 cellular automation model algorithmic complexity self-organized critical state EVOLUTION FAULT
下载PDF
基于改进的AHP-CRITIC组合赋权与可拓评估模型的配电网综合评价方法 被引量:54
17
作者 罗宁 贺墨琳 +6 位作者 高华 姜志筠 张天东 赵佳伟 吴国鼎 李智 胡钋 《电力系统保护与控制》 CSCD 北大核心 2021年第16期86-96,共11页
针对配电网综合评价问题,提出了一种改进的基于最小二乘的AHP-CRITIC组合赋权与可拓评估模型。针对单一赋权法具有一定偏向性的问题,通过层次分析法和CRITIC法分别确定主观权重与客观权重,构建基于最小二乘的组合赋权模型并采用遗传算... 针对配电网综合评价问题,提出了一种改进的基于最小二乘的AHP-CRITIC组合赋权与可拓评估模型。针对单一赋权法具有一定偏向性的问题,通过层次分析法和CRITIC法分别确定主观权重与客观权重,构建基于最小二乘的组合赋权模型并采用遗传算法求解,从而确定综合权重。针对传统可拓评估模型中经典域确定的主观性,引入三角模糊数对其进行构建。针对现有关联度与等级变量特征值计算的准确性问题,分别提出了关联度的修正方法与等级扩展方法。算例表明,所提方法能够对配电网进行科学合理的分类,评价结果可信度高。 展开更多
关键词 配电网评价 改进AHP-critic 改进可拓评估模型 最小二乘法 遗传算法
下载PDF
基于ENTROPY-TOPSIS算法的电路实验课程综合成绩评定方法
18
作者 徐航 孙曼 +2 位作者 印月 王东平 吴海祥 《实验科学与技术》 2024年第2期108-112,共5页
针对高校实践教学成绩评定环节中存在的不足,该文将基于修正ENTROPY-TOPSIS算法应用到实验课程成绩评定当中,并推导了具体算法原理。同时将该算法与常用权值算法层次分析法以及CRITIC算法在电路实践成绩客观赋权过程中进行了横向对比。... 针对高校实践教学成绩评定环节中存在的不足,该文将基于修正ENTROPY-TOPSIS算法应用到实验课程成绩评定当中,并推导了具体算法原理。同时将该算法与常用权值算法层次分析法以及CRITIC算法在电路实践成绩客观赋权过程中进行了横向对比。结果显示该方法可以为多源异构数据的科学赋权提供理论依据,有效消除因主观因素带来的不合理性,使教师在实验成绩的评定上更加趋向于客观化、科学化。 展开更多
关键词 成绩评价 critic算法 ENTROPY算法 TOPSIS算法 赋权
下载PDF
基于Actor-Critic框架的渗透测试路径技术研究
19
作者 陆燕 杨秋芬 《科技资讯》 2022年第21期5-10,共6页
该文将层次强化学习与渗透测试相结合,将渗透测试过程建模为半马尔可夫决策模型,训练Agent在模拟网络环境中完成渗透测试路径发现,并提出了一种改进的基于Actor-Critic框架改进的自动分层记忆AHM-DQN算法(Automatic hierarchical memory... 该文将层次强化学习与渗透测试相结合,将渗透测试过程建模为半马尔可夫决策模型,训练Agent在模拟网络环境中完成渗透测试路径发现,并提出了一种改进的基于Actor-Critic框架改进的自动分层记忆AHM-DQN算法(Automatic hierarchical memory Deep Q Networks,AHM-DQN)。首先,在Actor网络中加入一个双向递归神经网络作为同一Agent的信息交换层;其次,在Critic网络加入其他种类的Agent信息来学习多种Agent协同策略。该算法在Actor-Critic算法上进行了以下改进:一是集成了自动分层功能,对任务目标和动作的选择进行自动分层,提高了算法的效率;二是结合记忆因子,帮助Agent有效地记忆和学习,解决奖励值的稀疏性问题,提高算法精度。该算法在学习效率和收敛速度上优于传统的分层学习算法,解决了渗透测试主要依靠人工进行的问题。 展开更多
关键词 渗透测试 分层学习算法 AHM-DQN算法 Actor-critic框架
下载PDF
执行时间预测驱动的工作流作业调度
20
作者 胡亚红 邱圆圆 毛家发 《国防科技大学学报》 EI CAS CSCD 北大核心 2024年第5期228-238,共11页
针对工作流作业调度问题,提出使用关键路径法进行工作流的执行时间预测和资源分配。工作流执行时间预测算法使用并行应用有向无环图描述工作流中子作业的执行顺序。基于此顺序,为子作业进行系统资源的逻辑分配。根据子作业的特征和资源... 针对工作流作业调度问题,提出使用关键路径法进行工作流的执行时间预测和资源分配。工作流执行时间预测算法使用并行应用有向无环图描述工作流中子作业的执行顺序。基于此顺序,为子作业进行系统资源的逻辑分配。根据子作业的特征和资源分配信息,使用梯度提升决策树进行子作业执行时间预测,并计算工作流的关键路径。关键路径上所有子作业的完成时间之和即为工作流的执行时间。若预测的工作流执行时间满足用户要求,则根据子作业执行顺序和资源分配方案进行作业调度,执行工作流。对比实验表明,两个工作流的执行时间预测误差分别为5.72%和1.57%。与Spark默认调度算法相比,工作流调度算法将两个工作流的完成时间分别缩短了15.71%和15.44%。 展开更多
关键词 工作流 时间预测 关键路径 调度算法 梯度提升决策树
下载PDF
上一页 1 2 28 下一页 到第
使用帮助 返回顶部