期刊文献+
共找到10,740篇文章
< 1 2 250 >
每页显示 20 50 100
基于改进TD3算法的智能通信干扰决策方法研究
1
作者 安国臣 毕胜 王晓君 《信息化研究》 2024年第1期13-17,23,共6页
本文对通信对抗中干扰决策方法展开研究,旨在解决人为手动干扰决策带来的对抗方式单一、极易被敌军发现、干扰效率不佳等问题。随着科技的发展,各种电子技术层出不穷,这就导致电子战争中的环境变得越来越复杂,为了应对这种复杂的环境,... 本文对通信对抗中干扰决策方法展开研究,旨在解决人为手动干扰决策带来的对抗方式单一、极易被敌军发现、干扰效率不佳等问题。随着科技的发展,各种电子技术层出不穷,这就导致电子战争中的环境变得越来越复杂,为了应对这种复杂的环境,并达到预期的干扰效果,本文提出一种基于改进双延迟深度确定性策略梯度算法(TD3)的智能通信干扰决策方法,以解决通信干扰过程中的干扰决策问题。TD3算法不仅能够应对连续动作空间而且具有高稳定性的特点。另外,改进的TD3算法使学习的过程更加迅速,算法的结果也更加收敛。仿真结果表明,基于该算法的改进,通信干扰成功率比原算法提升了28%。 展开更多
关键词 通信干扰 深度强化学习 td3 干扰决策
下载PDF
Multiple thoracic and abdominal foregut duplication cysts:A case report
2
作者 Tuqa Adil Alsinan Tariq Ibrahim Altokhais 《World Journal of Clinical Cases》 SCIE 2024年第8期1504-1509,共6页
BACKGROUND Congenital enteric duplication cysts are tubular or cystic structures that normally lie alongside the gastrointestinal(GI)tract.Enteric duplication cysts are typically solitary lesions that occur anywhere n... BACKGROUND Congenital enteric duplication cysts are tubular or cystic structures that normally lie alongside the gastrointestinal(GI)tract.Enteric duplication cysts are typically solitary lesions that occur anywhere near the GI tract from the neck to the rectum,but having multiple duplication cysts is rare,and presentation within the pancreas is extremely rare.CASE SUMMARY We herein demonstrate a case of esophageal,gastric,and gastric-type duplication cyst of the pancreas in a seventeen-month-old girl who presented with failure to thrive,abdominal pain,vomiting,hematemesis,and melena since the age of three months.The cysts were excised by thoracoscopy and laparoscopy in the same setting.To our knowledge,no such case has been published.CONCLUSION Enteric duplications can occur throughout the entire alimentary tract.When they occur in the pancreas,they present a formidable challenge in both diagnosis and treatment.Due to the risk of complications and malignant transformation,surgical removal is the recommended treatment of all duplication cysts. 展开更多
关键词 Congenital duplication cyst Foregut duplication Gastric duplication PANCREAS Case report
下载PDF
改进TD3算法在电机PID控制器中的应用
3
作者 张梦杰 陈姚节 邓江 《计算机系统应用》 2024年第5期262-270,共9页
本文针对永磁同步电机(PMSM)在工业领域中的多变量、非线性和强耦合特性以及传统PID控制在应对其变化时可能导致参数调整困难、响应延迟、鲁棒性差以及适应性问题,提出一种结合双延迟深度确定性策略梯度(TD3)算法和PID控制的创新方案,... 本文针对永磁同步电机(PMSM)在工业领域中的多变量、非线性和强耦合特性以及传统PID控制在应对其变化时可能导致参数调整困难、响应延迟、鲁棒性差以及适应性问题,提出一种结合双延迟深度确定性策略梯度(TD3)算法和PID控制的创新方案,以优化PID参数调整,实现更精确的电机速度控制.在本文的方法中,融合双向长短期记忆网络(BiLSTM)到Actor和Critic网络中,极大增强了对PMSM动态行为的时间序列数据处理能力,使得系统不仅能够准确捕捉当前状态,还能预测未来趋势,从而实现对PID参数更精确和适应性强的自整定.此外,通过整合熵正则化和好奇心驱动的探索方法进一步增强策略的多样性,避免过早收敛到次优策略,并鼓励模型对未知环境进行深入探索.为验证方法的有效性,设计了一个永磁同步电机的仿真模型,并将本文提出的方法BiLSTM-TD3-ICE与传统的TD3以及经典的Ziegler-Nichols (Z-N)方法进行对比.实验结果充分证明了本文提出的策略在控制性能上具有显著的优势. 展开更多
关键词 深度强化学习 td3算法 永磁同步电机 PID参数自整定 BiLSTM 内在好奇心 熵正则化
下载PDF
大补偿量小型化TD板联轴节应用研究
4
作者 刘克伟 赵亚男 《机车车辆工艺》 2024年第2期54-57,共4页
针对现有TD板联轴节体积大,轴向、径向补偿量较小,且安装空间较大的问题,文章开展TD板联轴节小型化的应用研究。通过将中间体与防撞板设计成一体结构,大幅减小TD板联轴节的体积。同时,采用了柔性强度结构,极大地提高了小型化TD联轴节的... 针对现有TD板联轴节体积大,轴向、径向补偿量较小,且安装空间较大的问题,文章开展TD板联轴节小型化的应用研究。通过将中间体与防撞板设计成一体结构,大幅减小TD板联轴节的体积。同时,采用了柔性强度结构,极大地提高了小型化TD联轴节的补偿能力。小型化TD板联轴节体积为原有体积的58%,径向补偿能力由±9.7 mm提高到±14.5 mm,轴向补偿能力由±8.0 mm提高到±10.5 mm。 展开更多
关键词 大补偿量 小型化 td板联轴节 封闭式结构
下载PDF
TDS智能干选系统在哈尔乌素选煤厂的应用实践
5
作者 闫永礼 《煤炭加工与综合利用》 CAS 2024年第4期22-25,共4页
为解决浅槽分选机入选量大、后续煤泥水系统负荷较大等问题,准能哈尔乌素选煤厂采用TDS智能干选机分选200~(70)50 mm块煤。生产实践表明,TDS智能干选机运行平稳,矸中带煤率2.42%、中煤发热量9.21 MJ/kg、精煤发热量22.00 MJ/kg;减少了... 为解决浅槽分选机入选量大、后续煤泥水系统负荷较大等问题,准能哈尔乌素选煤厂采用TDS智能干选机分选200~(70)50 mm块煤。生产实践表明,TDS智能干选机运行平稳,矸中带煤率2.42%、中煤发热量9.21 MJ/kg、精煤发热量22.00 MJ/kg;减少了浅槽分选机的处理量,降低了煤泥水系统负荷;增加了全厂销售收入,降低了生产成本,提高了经济效益。 展开更多
关键词 tdS智能干选机 块煤干法分选 双源识别 分选精度 降本增效
下载PDF
大肠杆菌耐药基因TD-PCR检测方法的建立及应用
6
作者 潘永 王可人 +4 位作者 李婷 杨莉 李刚 张亚楠 徐景峨 《中国预防兽医学报》 CAS CSCD 北大核心 2024年第3期269-277,共9页
为建立一种检测大肠杆菌主要耐药基因(ARG)的通用降落PCR(TD-PCR)方法,本研究参考大肠杆菌标准菌株K12 MG1655 yeeJ基因序列设计合成不同Tm值引物、不同产物长度引物、不同长度引物,并参考Gen Bank中登录的β-内酰胺酶、氨基糖苷类、酰... 为建立一种检测大肠杆菌主要耐药基因(ARG)的通用降落PCR(TD-PCR)方法,本研究参考大肠杆菌标准菌株K12 MG1655 yeeJ基因序列设计合成不同Tm值引物、不同产物长度引物、不同长度引物,并参考Gen Bank中登录的β-内酰胺酶、氨基糖苷类、酰胺醇类、喹诺酮类和黏菌素类部分ARG序列设计合成共29对引物。以大肠杆菌标准菌株K12 MG1655总DNA为模板,采用TD-PCR和普通PCR方法,分别利用不同Tm值引物(P1~P8)、不同产物长度引物(P9~P16)、不同长度的引物(P17~P22)分别扩增yeeJ基因,均用于检测TD-PCR方法的特异性;利用引物P5扩增yeeJ基因,根据目的条带平均亮度值,对TD-PCR方法的扩增产物量分析。不同Tm值引物的扩增结果显示,TD-PCR方法中利用8对不同Tm值引物扩增后均出现目的条带,且均无非特异性条带,而普通PCR方法仅有部分引物扩增后出现目的条带,表明以不同Tm值引物扩增时,TD-PCR方法特异性更强,且适用引物Tm值范围较广。不同产物长度扩增结果显示,TD-PCR方法中利用8对引物扩增后均出现相应目的条带,且无非特异条带,而普通PCR方法虽然均出现目的条带,但部分引物扩增后还出现了非特异性条带,表明以不同产物长度引物扩增时,TD-PCR方法的特异性更强。不同长度的引物扩增结果显示,TD-PCR方法中利用6对不同长度的引物扩增后均出现目的条带,且无非特异条带,而普通PCR方法在52℃退火温度时引物P22出现非特异性扩增,表明TD-PCR方特异性更强。扩增产物量分析结果显示,TD-PCR和普通PCR方法扩增的目的条带平均亮度值均随反应总循环数的增加而上升,但普通PCR方法扩增的产物目的条带平均亮度值始终高于TD-PCR,表明TD-PCR方法的扩增产物量低于普通PCR。以24株临床分离的鹅源大肠杆菌总DNA为模板,采用TD-PCR和普通PCR方法,分别对β-内酰胺酶、氨基糖苷类、酰胺醇类、喹诺酮类和黏菌素类共29种ARG进行检测。结果显示,TD-PCR方法对其中25种ARG的检测结果与普通PCR相同,二者符率为100%;而对另外4种ARG检测结果显示,与普通PCR相比,TD-PCR方法的非特异条带明显减少,且无假阳性。表明TD-PCR在检测ARG方面比普通PCR具有更强的特异性。本研究建立了一种特异性较强的检测大肠杆菌主要ARG的TD-PCR通用方法,为细菌耐药性的研究提供了便捷高效的检测技术手段。 展开更多
关键词 大肠杆菌 耐药基因 td-PCR 特异性
下载PDF
TDS智能干选机的优化改造应用
7
作者 李嘉 《工程建设(维泽科技)》 2024年第4期69-71,共3页
TDS智能干选机作为关键设备在矿山和冶金工业中扮演着重要角色。优化改造其功能和性能对提高生产效率、减少能源消耗和降低成本具有重要意义。本篇文章将探讨TDS智能干选机优化改造的重要性、存在的问题,并提出相应的改造方案,以期为相... TDS智能干选机作为关键设备在矿山和冶金工业中扮演着重要角色。优化改造其功能和性能对提高生产效率、减少能源消耗和降低成本具有重要意义。本篇文章将探讨TDS智能干选机优化改造的重要性、存在的问题,并提出相应的改造方案,以期为相关行业提供更有效的技术支持和改进方案。 展开更多
关键词 tdS智能干选机 优化改造 生产效率 成本降低
下载PDF
基于改进型TD3算法的车载边缘计算任务卸载决策
8
作者 李亚 王卫岗 +1 位作者 张原 刘瑞鹏 《电子测量技术》 北大核心 2024年第6期64-70,共7页
为满足复杂车辆任务在时延、能耗和计算性能方面的要求,同时减少网络资源的竞争和消耗,设计了一种基于车载边缘计算(VEC)的任务卸载策略,以最小化任务处理延迟和能源消耗之间平衡的长期成本为目标,将车联网中的任务卸载问题建模为马尔... 为满足复杂车辆任务在时延、能耗和计算性能方面的要求,同时减少网络资源的竞争和消耗,设计了一种基于车载边缘计算(VEC)的任务卸载策略,以最小化任务处理延迟和能源消耗之间平衡的长期成本为目标,将车联网中的任务卸载问题建模为马尔可夫决策过程(MDP),提出了在传统双延时深度确定性策略梯度(TD3)的基础上,利用长短期记忆网络(LSTM)来逼近策略函数和价值函数,将系统状态进行归一化处理以加速网络收敛并增强训练稳定性的改进算法(LN-TD3)。仿真结果表明,LN-TD3性能与全部本地计算和全部卸载计算相比提高了两倍以上;收敛速度上与深度确定性策略梯度DDPG、TD3相比提高了约20%。 展开更多
关键词 车载边缘计算 td3算法 任务卸载 深度强化学习 马尔可夫决策过程
下载PDF
数字化时代下汉剧非遗保育与传承——以“数·剧”TD项目为例
9
作者 吴杨婷 《丝网印刷》 2024年第9期105-107,共3页
传统汉剧是国家级非物质文化遗产。为加强其文化传承教育,推出“数·剧”TD项目,旨在通过数字化技术、虚拟IP、交互技术、TD生成,为汉剧注入新的生命力。
关键词 汉剧数字化传承 td技术应用 传统文化保护 文化艺术创新
下载PDF
基于TD-Mask R-CNN的机械装配体图像实例分割
10
作者 唐若仪 陈成军 +1 位作者 王金磊 代成刚 《组合机床与自动化加工技术》 北大核心 2024年第4期135-140,共6页
在机械产品装配过程中,为了准确识别机械装配体零件信息以减少零件漏装、错装等现象,提出一种改进的机械装配体图像实例分割方法TD-Mask R-CNN。首先,在主干网络ResNet101中引入可变形卷积(deformable convolutional networks, DCN)以... 在机械产品装配过程中,为了准确识别机械装配体零件信息以减少零件漏装、错装等现象,提出一种改进的机械装配体图像实例分割方法TD-Mask R-CNN。首先,在主干网络ResNet101中引入可变形卷积(deformable convolutional networks, DCN)以增加网络模型的泛化能力;其次,使用Transfiner结构作为掩码分支以提高机械零件边缘的分割精度;最后,在Transfiner结构中引入离散余弦变换(discrete cosine transform, DCT)模块以提升模型对机械装配体图像整体的分割能力。实验结果表明,提出的实例分割方法在合成深度图像数据集和真实彩色图像数据集上得到的掩码平均精度(average precision, AP)分别为87.7%和92.0%,与其他主流实例分割算法相比均有所提升。 展开更多
关键词 深度学习 装配监测 实例分割 td-Mask R-CNN
下载PDF
Theoretical Study of Benzothiazole and Its Derivatives: Molecular Structure, Spectroscopic Properties, NBO, MEP and TD-DFT Analyses
11
作者 Konaté Abdoulaye Bédé Affoué Lucie +2 位作者 Ouattara Lamoussa Koné Soleymane Bamba Kafoumba 《Journal of Materials Science and Chemical Engineering》 2024年第3期31-50,共20页
Benzothiazole (BTH) and its derivatives are organic molecules with biologic actions. Because of their many applications, they are produced on a massive scale and used in a number of environmental compartments. Their d... Benzothiazole (BTH) and its derivatives are organic molecules with biologic actions. Because of their many applications, they are produced on a massive scale and used in a number of environmental compartments. Their discharge into water produces environmental problems, exposing our environment to public health problems. A solution that can contribute to their deterioration is becoming a necessity. For this reason, a conceptual analysis of the reactivity of benzothiazole and four of its compounds was undertaken in order to investigate certain aspects of their biodegradability. A theoretical investigations of the compounds studied were conducted in the gas and water phases with the most widely used density functional theory method, Becke-3-Parameter-Lee-Yang-Parr (B3LYP) with 6-31G+ (d, p) basis. Reactivity study calculated global indices of reactivity revealed that 2-SCH3_BTH is the most reactive. Dipole moment values analysis reveals that 2-NH2_BTH is the most soluble in water, while the lipophilicity shows that 2-NH2_BTH is the most hydrophilic compound. Thermodynamic parameters values reflect that reactions are respectively exothermic and spontaneous. By analyzing an Electrostatic Molecular Potential (EMP) map, researchers can pinpoint reactive sites on a molecule and anticipate its reactivity. This assessment is further enhanced by incorporating global and local reactivity descriptors. Additionally, an exploration of frontier molecular orbitals offers valuable insights into the molecule’s charge transfer characteristics. Moreover, a combined examination of internal and external molecular interactions unveils hyperconjugative interactions arising from charge delocalization, as elucidated through natural bond orbital (NBO) analysis. 展开更多
关键词 BENZOTHIAZOLE REACTIVITY DFT/B3LYP Stability td-DFT
下载PDF
深度强化学习TD3算法在倒立摆系统中的应用 被引量:3
12
作者 何卫东 刘小臣 +1 位作者 张迎辉 姚世选 《大连交通大学学报》 CAS 2023年第1期38-44,共7页
针对现有控制算法在倒立摆系统控制中存在的局限性,融合强化学习和深度学习方法,提出一种基于双延迟深度确定性策略梯度(TD3)的倒立摆端到端控制方法。首先,利用倒立摆动力学模型搭建虚拟仿真环境,设计稀疏奖励函数;其次,通过深度神经... 针对现有控制算法在倒立摆系统控制中存在的局限性,融合强化学习和深度学习方法,提出一种基于双延迟深度确定性策略梯度(TD3)的倒立摆端到端控制方法。首先,利用倒立摆动力学模型搭建虚拟仿真环境,设计稀疏奖励函数;其次,通过深度神经网络构建从倒立摆状态输入到执行动作输出的端到端控制模型,分析倒立摆特性,来确定神经网络结构和参数;最后,将虚拟仿真环境中生成的模型移植到倒立摆实物平台并进行优化。试验结果表明:该方法生成的模型能够有效地建立倒立摆状态和执行动作之间的映射关系,在运动控制中具有一定的借鉴意义。 展开更多
关键词 深度强化学习 倒立摆控制 td3 端到端 稀疏奖励函数
下载PDF
基于Copula函数的人民胜利渠灌区地下水埋深与TDS联合分布分析
13
作者 刘中培 阿长松 +4 位作者 冯邵依 李鑫 韩宇平 曹润祥 冷静 《人民黄河》 CAS 北大核心 2023年第12期88-95,共8页
为了查明不同埋深区域地下水溶解性总固体(TDS)变化规律,选择人民胜利渠灌区为研究区,根据地下水TDS值将灌区划分为高值区域、过渡区域和低值区域,采用AIC准则筛选出最优Copula函数,采用最优Copula函数构建不同区域地下水埋深与TDS之间... 为了查明不同埋深区域地下水溶解性总固体(TDS)变化规律,选择人民胜利渠灌区为研究区,根据地下水TDS值将灌区划分为高值区域、过渡区域和低值区域,采用AIC准则筛选出最优Copula函数,采用最优Copula函数构建不同区域地下水埋深与TDS之间的联合分布,对两者的关系进行分析。结果表明:不同区域地下水埋深与TDS之间均具有较强的正相关关系,高值区域地下水埋深和TDS最优边缘分布均为Gamma分布,过渡区域和低值区域地下水埋深最优边缘分布均为Weibull分布、TDS最优边缘分布均为Gamma分布。各典型观测井埋深-TDS最优联合分布函数均为Frank Copula函数。根据联合概率等值线可得当地下水埋深与TDS增大时,联合概率值也增大;当联合概率值一定时,TDS随着地下水埋深的增大而降低,并趋于稳定;联合概率等值线也可以反映任意埋深下TDS所发生的概率,以及同一概率下不同埋深与TDS之间可能出现的组合。 展开更多
关键词 地下水埋深 tdS COPULA函数 联合概率 人民胜利渠灌区
下载PDF
基于改进TD3的MEC多任务计算卸载
14
作者 于波 毛鑫浩 《计算机系统应用》 2023年第12期95-103,共9页
在多用户多任务场景下,使用传统的决策算法去对短时间内接踵而来的任务进行计算卸载决策,已经不能满足用户对决策效率和资源利用率的要求.因此有研究提出使用深度强化学习算法来进行卸载决策以满足各种场景下的需求,但是这些算法大多只... 在多用户多任务场景下,使用传统的决策算法去对短时间内接踵而来的任务进行计算卸载决策,已经不能满足用户对决策效率和资源利用率的要求.因此有研究提出使用深度强化学习算法来进行卸载决策以满足各种场景下的需求,但是这些算法大多只考虑卸载优先的策略,这种策略使用户设备(UE)被大量闲置.我们提高了移动边缘计算(MEC)服务器和用户设备(UE)的资源利用率,降低计算卸载的错误率,提出了一种本地优先和改进TD3(twin delayed deep deterministic policy gradient)算法相结合的决策卸载模型,并设计了仿真实验,通过实验证明该模型确实可以提高MEC服务器和UE的资源利用率并降低错误率. 展开更多
关键词 移动边缘计算 计算卸载 双延迟深度确定性策略梯度(td3) 资源分配
下载PDF
45钢表面TD-Cr/PVD-CrN复合涂层磨蚀性能 被引量:1
15
作者 罗银 万强 +5 位作者 曹道成 杨泽华 李善军 孟亮 肖洋轶 韩明兴 《表面技术》 EI CAS CSCD 北大核心 2023年第7期455-463,共9页
目的采用热扩散(TD)渗金属技术和物理气相沉积(PVD)技术对45钢表面进行强化,以提升45钢表面硬度和抗磨蚀性能,延长45钢的使用寿命。方法采用热扩散渗金属技术和物理气相沉积技术制备TD-Cr、PVD-CrN及TD-Cr/PVD-Cr N(Cr/CrN复合涂层)3种... 目的采用热扩散(TD)渗金属技术和物理气相沉积(PVD)技术对45钢表面进行强化,以提升45钢表面硬度和抗磨蚀性能,延长45钢的使用寿命。方法采用热扩散渗金属技术和物理气相沉积技术制备TD-Cr、PVD-CrN及TD-Cr/PVD-Cr N(Cr/CrN复合涂层)3种涂层。利用扫描电镜(SEM)、X射线衍射仪(XRD)研究涂层的微观形貌、元素分布和物相组成。通过纳米压痕研究涂层的硬度、弹性模量。通过摩擦磨损实验和电化学腐蚀实验,研究涂层的摩擦性能和腐蚀性能。结果TD-Cr、PVD-Cr N、TD-Cr/PVD-Cr N 3种涂层的组织结构均致密均匀,厚度分别为19.78、1.075、32.24μm。TD-Cr/PVD-Cr N涂层的硬度达到28.7 GPa,高于其他涂层,同时,Cr/Cr N复合涂层的弹性模量和弹性恢复能力均优于其他涂层。在盐水环境下,TD-Cr、PVD-Cr N、TD-Cr/PVD-CrN的摩擦因数分别为0.52、0.38、0.35,磨损体积分别为26、0.15、0.05,TD-Cr/PVD-CrN展现出较好的耐磨性能。在盐水环境下,TD-Cr/PVD-CrN涂层的抗腐蚀性能略低于TD-CrN涂层。结论综合看来,TD-Cr/PVD-CrN复合涂层可以有效提升45钢的表面抗磨蚀能力,延长其使用寿命。 展开更多
关键词 45钢 td-Cr/PVD-CrN涂层 力学性能 摩擦磨损 抗腐蚀性能
下载PDF
模具表面TD法制备碳化物薄膜研究进展
16
作者 王兴雨 刘宁 《热处理》 CAS 2023年第4期1-7,共7页
随着制造业的快速发展,对模具表面性能的要求越来越高。与物理气相沉积、化学气相沉积和热喷涂等表面改性技术相比,TD法具有操作简单、成本低等特点,能在模具表面制备高硬度薄膜,从而提高模具的耐磨性和使用寿命。TD法所用盐浴有硼砂盐... 随着制造业的快速发展,对模具表面性能的要求越来越高。与物理气相沉积、化学气相沉积和热喷涂等表面改性技术相比,TD法具有操作简单、成本低等特点,能在模具表面制备高硬度薄膜,从而提高模具的耐磨性和使用寿命。TD法所用盐浴有硼砂盐浴、中性盐浴、混合盐浴和低温氯化物盐浴。采用TD法制备的薄膜有单元碳化物薄膜和性能更好的多元碳化物薄膜及高熵合金碳化物薄膜。目前TD法已在模具制造行业得到了广泛应用。今后TD法将从制备单元碳化物薄膜向制备多元碳化物和高熵合金碳化物薄膜的方向发展。 展开更多
关键词 td 碳化物薄膜 模具 耐磨性
下载PDF
带Q网络过滤的两阶段TD3深度强化学习方法 被引量:2
17
作者 周娴玮 包明豪 +1 位作者 叶鑫 余松森 《计算机技术与发展》 2023年第10期101-108,共8页
常规的深度强化学习模型训练方式从“零”开始,其起始策略为随机初始化,这将导致智能体在训练前期阶段探索效率低、样本学习率低,网络难以收敛,该阶段也被称为冷启动过程。为解决冷启动问题,目前大多数工作使用两阶段深度强化学习训练方... 常规的深度强化学习模型训练方式从“零”开始,其起始策略为随机初始化,这将导致智能体在训练前期阶段探索效率低、样本学习率低,网络难以收敛,该阶段也被称为冷启动过程。为解决冷启动问题,目前大多数工作使用两阶段深度强化学习训练方式;但是使用这种方式的智能体由模仿学习过渡至深度强化学习阶段后可能会出现遗忘演示动作的情况,表现为性能和回报突然性回落。因此,该文提出一种带Q网络过滤的两阶段TD3深度强化学习方法。首先,通过收集专家演示数据,使用模仿学习-行为克隆以及TD3模型Q网络更新公式分别对Actor网络与Critic网络进行预训练工作;进一步地,为避免预训练后的Actor网络在策略梯度更新时误选择估值过高的演示数据集之外动作,从而遗忘演示动作,提出Q网络过滤算法,过滤掉预训练Critic网络中过高估值的演示数据集之外的动作估值,保持演示动作为最高估值动作,有效缓解遗忘现象。在Deep Mind提供的Mujoco机器人仿真平台中进行实验,验证了所提算法的有效性。 展开更多
关键词 两阶段深度强化学习 冷启动问题 模仿学习 预训练网络 td3
下载PDF
TDS与高校合作背景下学前教育见习生保教能力提升策略——以湖州S幼儿园为例 被引量:1
18
作者 邵佳乐 慎蓓蓉 王京龙 《科教导刊》 2023年第24期150-152,共3页
浙江省自2017年发布《教师发展学校建设标准》以来,TDS(教师发展学校)在教育行政部门、高校和幼儿园三方协同机制的作用下,在培养学前教育人才方面通过有效的优势互补使,使人才质量总体得到提升。但是,在本地TDS幼儿园和地方高校的合作... 浙江省自2017年发布《教师发展学校建设标准》以来,TDS(教师发展学校)在教育行政部门、高校和幼儿园三方协同机制的作用下,在培养学前教育人才方面通过有效的优势互补使,使人才质量总体得到提升。但是,在本地TDS幼儿园和地方高校的合作实践中,发现见习生保教能力方面存在集中活动的组织不到位、缺乏批判性思维的问题,同时高校方面的指导亦存在不足。对此,本研究提出了相应的解决策略。 展开更多
关键词 tdS 学前教育 见习生 保教能力
下载PDF
基于TD3算法的热管堆功率控制算法优化研究
19
作者 宋霄森 余刃 +1 位作者 毛伟 殷少轩 《舰船电子工程》 2023年第8期104-109,共6页
核反应堆功率控制仍多采用PID控制算法,但其控制参数往往难以选择,也难以在不同功率水平下均保持最优的控制效果。论文针对热管冷却核反应堆的功率控制设计PID控制算法,并基于深度强化学习TD3算法来实现对PID控制器的参数寻优。对比基... 核反应堆功率控制仍多采用PID控制算法,但其控制参数往往难以选择,也难以在不同功率水平下均保持最优的控制效果。论文针对热管冷却核反应堆的功率控制设计PID控制算法,并基于深度强化学习TD3算法来实现对PID控制器的参数寻优。对比基于试凑法和参数寻优选取的PID参数的控制效果,采用深度强化学习TD3算法寻优参数可以获得更快速稳定的控制效果。 展开更多
关键词 热管冷却核反应堆 深度强化学习 td3算法 功率控制
下载PDF
基于SAC和TD3的含电动汽车虚拟电厂调度策略 被引量:1
20
作者 陶力 杨夏喜 +3 位作者 顾金辉 魏兵兵 张琳 王嘉宁 《电气传动》 2023年第9期25-34,共10页
虚拟电厂(VPP)可以聚合分布式电源(DER)参与电力市场和辅助服务市场运行,为配电网和输电网提供管理和辅助服务,其运行和控制得到广泛关注。针对含电动汽车(EV)充电站的虚拟电厂,构建了基于柔性行动器-评判器(SAC)算法和双延迟深度确定... 虚拟电厂(VPP)可以聚合分布式电源(DER)参与电力市场和辅助服务市场运行,为配电网和输电网提供管理和辅助服务,其运行和控制得到广泛关注。针对含电动汽车(EV)充电站的虚拟电厂,构建了基于柔性行动器-评判器(SAC)算法和双延迟深度确定性策略梯度(TD3)算法的VPP与EV充电站主从博弈模型。通过训练主从博弈网络参数,计算博弈均衡时的策略和解。算例结果表明,上述模型训练完成后,可以有效地降低EV充电站运行费用以及平缓功率,基于SAC强化学习方法能够整合VPP内部DER,并引导电动汽车有序充电。在VPP作为价格接受者参与日前电力市场时,也能够给出优化的交易策略;当VPP与EV之间存在主从博弈时,EV用确定性策略算法可以降低充电成本,VPP用随机性策略算法则可以提高收益。 展开更多
关键词 虚拟电厂 SAC算法 td3算法 电动汽车 主从博弈 实时调度
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部