期刊文献+
共找到378篇文章
< 1 2 19 >
每页显示 20 50 100
Quantization of Action for Elementary Particles and the Principle of Least Action
1
作者 Shuming Wen 《Journal of Modern Physics》 2024年第9期1430-1447,共18页
The uncertainty principle is a fundamental principle of quantum mechanics, but its exact mathematical expression cannot obtain correct results when used to solve theoretical problems such as the energy levels of hydro... The uncertainty principle is a fundamental principle of quantum mechanics, but its exact mathematical expression cannot obtain correct results when used to solve theoretical problems such as the energy levels of hydrogen atoms, one-dimensional deep potential wells, one-dimensional harmonic oscillators, and double-slit experiments. Even after approximate treatment, the results obtained are not completely consistent with those obtained by solving Schrödinger’s equation. This indicates that further research on the uncertainty principle is necessary. Therefore, using the de Broglie matter wave hypothesis, we quantize the action of an elementary particle in natural coordinates and obtain the quantization condition and a new deterministic relation. Using this quantization condition, we obtain the energy level formulas of an elementary particle in different conditions in a classical way that is completely consistent with the results obtained by solving Schrödinger’s equation. A new physical interpretation is given for the particle eigenfunction independence of probability for an elementary particle: an elementary particle is in a particle state at the space-time point where the action is quantized, and in a wave state in the rest of the space-time region. The space-time points of particle nature and the wave regions of particle motion constitute the continuous trajectory of particle motion. When an elementary particle is in a particle state, it is localized, whereas in the wave state region, it is nonlocalized. 展开更多
关键词 Elementary Particle Quantization of action Deterministic Relation Inherent state Nonprobabilistic Interpretation Localization Region Nonlocalization Region
下载PDF
THE SURFACE STATE OF MACROPHAGE MEMBRANE UNDER THE ACTION OF Ca^(2+) AND Con A.
2
作者 Dong Xiaumin, Dai Janwu, Su Yaxian. Dept. of Cell Biology, Beijing Medical University, Beijing, China. Zhu Changxin, Ma Zili, Pang Shijin. Beijing Laboratory of Vacuum Physics, Academia Sinica, Beijing, China. 《真空科学与技术学报》 EI CAS CSCD 1992年第Z1期271-274,共4页
The effects of Ca<sup>2+</sup> and Con A on the membrane surface of macrophage were studied by STM. Higher peaks correspond to the membrane proteins which were aggregated. Some band-like and lower furrows ... The effects of Ca<sup>2+</sup> and Con A on the membrane surface of macrophage were studied by STM. Higher peaks correspond to the membrane proteins which were aggregated. Some band-like and lower furrows were expressed in the domain of membrane lipids. 展开更多
关键词 action AND Con A THE SURFACE state OF MACROPHAGE MEMBRANE UNDER THE action OF Ca
下载PDF
潜在空间中的策略搜索强化学习方法
3
作者 赵婷婷 王莹 +3 位作者 孙威 陈亚瑞 王嫄 杨巨成 《计算机科学与探索》 CSCD 北大核心 2024年第4期1032-1046,共15页
策略搜索是深度强化学习领域中一种能够解决大规模连续状态空间和动作空间问题的高效学习方法,被广泛应用在现实问题中。然而,此类方法通常需要花费大量的学习样本和训练时间,且泛化能力较差,学到的策略模型难以泛化至环境中看似微小的... 策略搜索是深度强化学习领域中一种能够解决大规模连续状态空间和动作空间问题的高效学习方法,被广泛应用在现实问题中。然而,此类方法通常需要花费大量的学习样本和训练时间,且泛化能力较差,学到的策略模型难以泛化至环境中看似微小的变化。为了解决上述问题,提出了一种基于潜在空间的策略搜索强化学习方法。将学习状态表示的思想拓展到动作表示上,即在动作表示的潜在空间中学习策略,再将动作表示映射到真实动作空间中。通过表示学习模型的引入,摒弃端到端的训练方式,将整个强化学习任务划分成大规模的表示模型部分和小规模的策略模型部分,使用无监督的学习方法来学习表示模型,使用策略搜索强化学习方法学习小规模的策略模型。大规模的表示模型能保留应有的泛化性和表达能力,小规模的策略模型有助于减轻策略学习的负担,从而在一定程度上缓解深度强化学习领域中样本利用率低、学习效率低和动作选择泛化性弱的问题。最后,在智能控制任务CarRacing和Cheetah中验证了引入潜在空间中的状态表示和动作表示的有效性。 展开更多
关键词 无模型强化学习 策略模型 状态表示 动作表示 连续动作空间 策略搜索强化学习方法
下载PDF
国企改革三年行动收官后国企改革重点方向思路研究 被引量:2
4
作者 刘方 《当代经济管理》 北大核心 2024年第6期53-61,共9页
国企是推进中国式现代化的核心主体,是实现中华民族伟大复兴和有效应对世界百年未有之大变局的重要力量。文章重点描述国企改革三年行动取得的主要成绩,通过三年行动破除了一批体制机制障碍,有效解决了一批长期没有解决的难题,在许多重... 国企是推进中国式现代化的核心主体,是实现中华民族伟大复兴和有效应对世界百年未有之大变局的重要力量。文章重点描述国企改革三年行动取得的主要成绩,通过三年行动破除了一批体制机制障碍,有效解决了一批长期没有解决的难题,在许多重要领域和关键环节实现重塑、重构;同时,阐述了当前国企改革存在的问题,在支撑企业核心竞争力提高和核心功能增强方面还有不足,在支撑中国式现代化建设中还存在诸多体制机制障碍;最后,提出了未来进一步推进国企改革的主要思路。研究得出,要继续通过实施更具战略性、系统性、突破性、实质性的国企改革提升行动,建设中国特色现代新国企,充分发挥在建设现代化产业体系、构建新发展格局中的科技创新、产业控制、安全支撑、国计民生、公共服务功能与作用。 展开更多
关键词 国企改革 三年行动 重点方向 思路
下载PDF
基于混合强化学习的主动配电网故障恢复方法
5
作者 徐岩 陈嘉岳 马天祥 《电力系统及其自动化学报》 CSCD 北大核心 2024年第4期50-58,共9页
针对高比例新能源接入的配电网故障恢复问题,提出一种基于混合强化学习的主动配电网故障恢复方法。首先,以故障损失最小为恢复目标、配电网安全运行要求为约束条件,构造主动配电网的故障恢复模型;其次,建立用于故障恢复的强化学习环境,... 针对高比例新能源接入的配电网故障恢复问题,提出一种基于混合强化学习的主动配电网故障恢复方法。首先,以故障损失最小为恢复目标、配电网安全运行要求为约束条件,构造主动配电网的故障恢复模型;其次,建立用于故障恢复的强化学习环境,根据状态空间和动作空间特点,提出一种混合强化学习方法,该方法使用竞争架构双深度Q网络算法处理离散动作空间,进行开关动作;然后,使用深度确定性策略梯度算法处理连续动作空间,调节电源出力;最后,通过IEEE33节点系统仿真实验验证所提方法的可行性和优越性。 展开更多
关键词 主动配电网 故障恢复 混合强化学习 状态空间 动作空间
下载PDF
国家介入与地方行动:乡村内生发展的张力及其化解 被引量:3
6
作者 文军 陈雪婧 《南京农业大学学报(社会科学版)》 北大核心 2024年第1期1-13,共13页
基层社会发展离不开国家的适时介入与有效引领。在乡村内生发展的现实背景下,国家适时介入并有效引领乡村社会的良性变革,是乡村建设的主要路径和基本内容,然而其中存在的一定的现实张力也给乡村内生发展实践带来了挑战。本文从新内生... 基层社会发展离不开国家的适时介入与有效引领。在乡村内生发展的现实背景下,国家适时介入并有效引领乡村社会的良性变革,是乡村建设的主要路径和基本内容,然而其中存在的一定的现实张力也给乡村内生发展实践带来了挑战。本文从新内生发展的视角,梳理乡村发展实践中国家介入和乡村自主行动的具体方式,并分析在此过程中国家介入与地方行动之间的张力,其具体表现为:第一,在政策定位层面,国家宏观政策与基层行动策略难以统合,构成国家本位和地方本位的张力;第二,在治理形态层面,他治与自治的合作缺乏弹性空间,构成行政化他治和地方性自治的张力;第三,在资源配置层面,基层政绩要求和能力欠缺,构成重点帮扶和均等投放的张力;第四,在行动主体层面,国家介入农民行动的边界不清,构成国家主导和农民自主行动的张力。在多重张力并存的情况下,国家与农民互构式的新内生发展机制可以缓解张力之冲突,通过合作式吸纳、培育农民自组织、完善资源分配方式、建立超地方的行动者网络等方式,或能促进国家介入与地方行动的协调互动,共同推动乡村迈向内生发展的新阶段。 展开更多
关键词 内生发展 国家介入 地方行动 乡村治理
下载PDF
白虎汤纳米相态相关研究进展 被引量:2
7
作者 刘森 韦少强 张世栋 《中兽医医药杂志》 CAS 2024年第2期33-37,共5页
中药汤剂包含真溶液、纳米相态、乳浊液和混悬液,是一种复杂的多分散相体系。中药汤剂的有效成分主要存在于纳米相态中,与中药汤剂相比,中药纳米相态具有溶解性强、稳定性高、药效佳等特点。随着研究的深入,有学者提出汤剂中的纳米粒子... 中药汤剂包含真溶液、纳米相态、乳浊液和混悬液,是一种复杂的多分散相体系。中药汤剂的有效成分主要存在于纳米相态中,与中药汤剂相比,中药纳米相态具有溶解性强、稳定性高、药效佳等特点。随着研究的深入,有学者提出汤剂中的纳米粒子可能起着增溶与靶向递送的作用。白虎汤是清热类经典方剂之一,被称为“寒剂祖方”,由石膏、知母、炙甘草、粳米四味药材配伍而成,用于治疗阳明经证或气分热盛证,现代临床上应用广泛。白虎汤纳米相态可能包裹药物有效成分,实现药物的靶向性治疗。研究发现白虎汤药液的纳米相态中主要药效成分的含量明显高于药液中的其他相态,纳米相态对汤剂中主要解热成分芒果苷、新芒果苷、钙离子、甘草酸和甘草次酸起到了增溶作用,纳米相态是白虎汤发挥解热作用的关键组分。本文从白虎汤纳米相态的形成理论、物质基础、分子表征、药理作用等方面进行综述,为深入探究白虎汤的作用机制、创制纳米相态制剂提供思路,为推动纳米技术在中药方剂创新中的应用提供参考。 展开更多
关键词 白虎汤 纳米相态 物质基础 相态表征 药理作用
下载PDF
基于TinyML的猫咪动作识别方法
8
作者 刘轶群 刘思进 王慧 《科技资讯》 2024年第19期57-59,共3页
针对国内宠物用品市场产品功能单一的问题,设计了一款可以识别猫咪奔跑、跳跃、翻转3种运动状态的设备。借助开源电子平台Arduino,使用陀螺仪和加速度传感器对猫咪的运动状态数据进行采集,并使用深度学习框架TensorFlow进行训练,通过微... 针对国内宠物用品市场产品功能单一的问题,设计了一款可以识别猫咪奔跑、跳跃、翻转3种运动状态的设备。借助开源电子平台Arduino,使用陀螺仪和加速度传感器对猫咪的运动状态数据进行采集,并使用深度学习框架TensorFlow进行训练,通过微型机器学习(Tiny Machine Learning,TinyML)技术压缩模型参数,使模型部署到开发板上。通过试错法找到训练效果最佳的模型结构,最终实现对猫咪运动状态识别的准确率达到90%以上。 展开更多
关键词 微型机器学习 运动状态识别 模型搭建 模型训练
下载PDF
全民教育:实现人民精神富有的国家行动
9
作者 于春玲 周赫群 《河南师范大学学报(哲学社会科学版)》 北大核心 2024年第1期143-149,共7页
建设全民终身学习的教育体系,形成全民终身学习的学习型社会、学习型大国,是实现全体人民精神富有的重要途径。党的十八大以来,习近平总书记站在新时代党和国家事业发展全局的高度,大力推动全民教育建设迈出新步伐、取得新成就。在指导... 建设全民终身学习的教育体系,形成全民终身学习的学习型社会、学习型大国,是实现全体人民精神富有的重要途径。党的十八大以来,习近平总书记站在新时代党和国家事业发展全局的高度,大力推动全民教育建设迈出新步伐、取得新成就。在指导思想上坚持以党的创新理论凝心铸魂,在制度保障上坚持马克思主义在意识形态领域的指导地位,在载体构建上着力培育和践行社会主义核心价值观,在文化资源上积极推动构建中国自主知识体系,在基本底色上统筹推进大中小学思想政治教育一体化,全面开启了实现人民精神富有的国家行动。 展开更多
关键词 全民教育 精神富有 国家行动
下载PDF
现代汉语叹词的互动功能初探
10
作者 张瑞祥 方梅 《辞书研究》 2024年第3期36-47,I0002,共13页
从互动交际视角观察,叹词对言谈互动语境的依赖程度存在差异。文章基于《现代汉语词典》第7版叹词的释义归纳,对比考察自然口语语料中叹词的用法分布,将叹词的功能归纳为四个方面,即:认识状态表达、言者态度表达、情感表达和独立实施互... 从互动交际视角观察,叹词对言谈互动语境的依赖程度存在差异。文章基于《现代汉语词典》第7版叹词的释义归纳,对比考察自然口语语料中叹词的用法分布,将叹词的功能归纳为四个方面,即:认识状态表达、言者态度表达、情感表达和独立实施互动行为。《现代汉语词典》第7版对叹词的单句例释体现了叹词用法的互动性,基于上述表达功能分析,辞书在叹词的释义模式上仍可再做优化。 展开更多
关键词 叹词 认识状态表达 态度表达 情感表达 互动行为实施
下载PDF
具有一般非线性项的基尔霍夫方程的规范基态解
11
作者 张丁良 罗虎啸 《浙江师范大学学报(自然科学版)》 CAS 2024年第3期266-274,共9页
研究了全空间上带有一般非线性项的基尔霍夫方程规范基态解的存在性问题,利用集中紧性原理证明了极值函数的存在性.另外,根据最小作用解的山路特征,证明了规范基态解与最小作用解是一致的.
关键词 质量约束 规范基态解 最小作用解 基尔霍夫方程
下载PDF
KAP-HBM联合干预模式应用于结肠镜检查患者中的效果
12
作者 张佳蓉 李小玲 +3 位作者 阳周 洪彩燕 陈艳萍 庄云英 《中外医学研究》 2024年第5期99-103,共5页
目的:探讨知信行-健康信念(KAP-HBM)联合干预模式应用于结肠镜检查患者中的效果。方法:回顾性选取2021年4月—2023年4月中国人民解放军联勤保障部队第九一〇医院收治的100例结肠镜检查患者的资料。根据干预方式的不同将其分为对照组和... 目的:探讨知信行-健康信念(KAP-HBM)联合干预模式应用于结肠镜检查患者中的效果。方法:回顾性选取2021年4月—2023年4月中国人民解放军联勤保障部队第九一〇医院收治的100例结肠镜检查患者的资料。根据干预方式的不同将其分为对照组和观察组,各50例。对照组采用常规干预模式,观察组采用KAP-HBM联合干预模式。比较两组肠道准备质量和肠道准备依从性,干预前后心理状态及不良反应。结果:对照组肠道准备充分占比为76.00%(38/50),低于观察组的92.00%(46/50),差异有统计学意义(χ^(2)=4.761,P=0.029)。观察组Boston肠道准备量表(BBPS)评分、饮食准备、服药准备评分及总分均高于对照组,差异有统计学意义(P<0.05)。干预后,两组焦虑自评量表(SAS)评分、抑郁自评量表(SDS)评分均低于干预前,观察组SAS评分、SDS评分均低于对照组,差异有统计学意义(P<0.05)。观察组不良反应发生率(4.00%)低于对照组(18.00%),差异有统计学意义(P<0.05)。结论:KAP-HBM联合干预模式能够提高结肠镜检查患者的肠道准备质量和依从性,改善患者的心理状态,减少不良反应的发生。 展开更多
关键词 知信行-健康信念 结肠镜 肠道准备 心理状态
下载PDF
基于CSI与Attention-BiLSTM的动作识别算法
13
作者 沈诚遥 殳国华 郁高亚 《电气自动化》 2024年第5期108-110,共3页
与传统动作识别技术相比,基于信道状态信息的动作识别具有成本低、安全便利等特点,应用前景广阔。利用乐鑫ESP32采集信道子载波幅值信息,结合预处理算法,并基于结合注意力机制的双向长短期记忆网络的动作识别算法,实现对走路、拖地、捡... 与传统动作识别技术相比,基于信道状态信息的动作识别具有成本低、安全便利等特点,应用前景广阔。利用乐鑫ESP32采集信道子载波幅值信息,结合预处理算法,并基于结合注意力机制的双向长短期记忆网络的动作识别算法,实现对走路、拖地、捡起、坐下、蹲下和站起六种动作的特征提取与分类识别。测试结果表明:算法在测试集上的平均识别准确率高达95.8%,相较于常规的长短期记忆算法,识别准确率更高、收敛速度更快;与传统基于统计特征与机器学习的分类算法相比,算法直接利用神经网络自动提取时序特征,特征提取更精确,准确率提升超过10%。试验结果验证了该算法在基于信道状态信息的动作识别上的有效性,说明该算法具有较高的实用价值。 展开更多
关键词 注意力机制 双向长短期记忆网络 动作识别 信道状态信息 分类算法
下载PDF
固体继电器的抗欠压浪涌设计
14
作者 李坤 张贺 蹇兰 《集成电路应用》 2024年第5期242-243,共2页
阐述一种具有较强抗欠压浪涌能力的固体继电器电路的设计。分析普通固体继电器电路输出端接通关断特性存在的缺陷,提出解决方案,仿真分析其有效性,得出输出端接通关断特性图,并对该电路的工作失效率进行分析计算。
关键词 抗欠压浪涌 固体继电器 电磁继电器 动作特性
下载PDF
地下水作用致隧道底鼓和双块式无砟轨道变形规律研究
15
作者 张彩亮 刘秀波 +2 位作者 柯在田 张玉芳 马帅 《铁道建筑》 北大核心 2024年第6期1-8,共8页
水压作用会导致隧道底鼓变形,变形传递至轨道会引起轨道几何状态不良。本文从轨道几何形位变化角度出发,对水压力作用导致隧道底鼓时引发的轨道几何状态劣化问题展开深入研究,提出了水压力的近似计算方法;基于荷载-结构法建立了隧道内... 水压作用会导致隧道底鼓变形,变形传递至轨道会引起轨道几何状态不良。本文从轨道几何形位变化角度出发,对水压力作用导致隧道底鼓时引发的轨道几何状态劣化问题展开深入研究,提出了水压力的近似计算方法;基于荷载-结构法建立了隧道内双块式无砟轨道数值计算模型,分析了不同找平层水压作用下轨道的几何不平顺特征和变化规律。结果表明:隧道底鼓-无砟轨道几何不平顺现象是道床板与找平层接触状态变化、沿线路纵向与隧道横断面内的横向变形叠加作用的结果;水压作用除引起轨道高低几何状态劣化外,还可导致轨道轨向、水平变化及扭曲变形;受承压水头和水压分布长度影响,水压引起的内外轨的高低、轨向以及轨道水平变化曲线具有各自形态特征,而并非单一抛物线或正弦线。通过数值模拟,验证了隧底找平层底鼓变形的接触状态非线性力学行为,揭示了底鼓变形下轨道线路三角坑的形成机理。 展开更多
关键词 高速铁路 隧道 数值模拟 底鼓变形 双块式无砟轨道 水压作用 轨道几何状态
下载PDF
基于国企改革三年行动背景下的国企经济效益提升策略研究
16
作者 毛临玲 《商业观察》 2024年第3期29-32,共4页
国企经济效益能否得到必要的提高优化,在根本上决定了国企自身具备的综合竞争实力,并且关系到国企在行业领域的优势地位。现阶段各个行业的国企正在全面致力于企业运营管理的经济利润优化提高,只有通过合理控制与降低国企的业务实施以... 国企经济效益能否得到必要的提高优化,在根本上决定了国企自身具备的综合竞争实力,并且关系到国企在行业领域的优势地位。现阶段各个行业的国企正在全面致力于企业运营管理的经济利润优化提高,只有通过合理控制与降低国企的业务实施以及内控管理成本,才能达到国企经济效益明显提高的目标。国企改革三年的行动宗旨在于推进国企实现各个层面领域的实践改革工作,促进国企的全新发展体系格局尽快形成,激发国企人员的创新热情。文章探讨了国企经济效益在国企改革三年行动下的提升优化要点,以健全国企现有的经营管理规范体系以及内控管理。 展开更多
关键词 国企改革三年行动 国企经济效益 提升策略要点
下载PDF
交易成本理论应用于国企市场化承包的案例研究
17
作者 朱圣开 朱德彰 《特区经济》 2024年第5期97-100,共4页
为落实国企改革三年行动,提升国企活力效率,中国电信股份有限公司东莞分公司依据“交易成本”理论,结合电信业务实际情况,采用市场化承包的经营管理模式,按照业务类别差异化实施绝对市场化承包(社会化外包)、有限市场化承包和内部市场... 为落实国企改革三年行动,提升国企活力效率,中国电信股份有限公司东莞分公司依据“交易成本”理论,结合电信业务实际情况,采用市场化承包的经营管理模式,按照业务类别差异化实施绝对市场化承包(社会化外包)、有限市场化承包和内部市场化承包(内部责任制承包)。为探索国企市场化承包在实践中的应用,本文立足中国电信股份有限公司东莞分公司的运营实际,坚持以市场为导向,创新性探索有限市场化承包。案例研究证明,交易成本理论与实践的有效结合,一方面,规避了绝对市场化承包的风险,满足了电信业务运营的本质要求,另一方面,为国有企业三项制度改革提供了可行的方法和路径:以市场配置资源为原则,为市场化承包团队定制个性化的激励约束机制,激发团队干事创业激情,提升组织活力,推动企业高质量发展。 展开更多
关键词 国有企业 国企改革 市场化承包 交易成本理论 案例研究
下载PDF
Critical State Sedimentation Line of Soft Marine Clays 被引量:1
18
作者 洪振舜 刘汉龙 CHANG Nien-yin 《China Ocean Engineering》 SCIE EI 2003年第4期631-640,共10页
The compression behavior responsible for unity sensitivity is very valuable in quantitative assessment of the effects of soil structure on the compression behavior of soft marine sediments. However, the quantitative a... The compression behavior responsible for unity sensitivity is very valuable in quantitative assessment of the effects of soil structure on the compression behavior of soft marine sediments. However, the quantitative assessment of such effects is not possible because of unavailability of the formula for the compression curve of marine sediments responsible for unit sensitivity. In this study, the relationship between the remolded state and the conventional critical state line is presented in the deviator stress versus mean effective stress plot. The analysis indicates that the remolded state is on the conventional critical state line obtained at a relatively small strain. Thus, a unique critical state sedimentation line for marine sediments of unit sensitivity is proposed. The comparison between the critical state sedimentation line proposed in this study and the existing normalized consolidation curves obtained from conventional oedometer tests on remolded soils or reconstituted soils explains well the 展开更多
关键词 conventional critical state line critical state sedimentation line initial water content liquid limit marine sediments ocean wave action remolded state
下载PDF
Carbon Solubility and Mass Action Concentrations of Fe-Cr-C Melts
19
作者 Jtan Zhang(Metallurgy School, University of Science and Technology Beijing, Beijing 100083, China) 《International Journal of Minerals,Metallurgy and Materials》 SCIE EI CAS CSCD 2000年第2期86-91,共6页
An empirical equation of carbon solubility in Fe-Cr-C melts is regressed based on the experimental data from references. Acalculating model of mass action concentrations for these melts is formulated on the basis of t... An empirical equation of carbon solubility in Fe-Cr-C melts is regressed based on the experimental data from references. Acalculating model of mass action concentrations for these melts is formulated on the basis of the coexistence theory of metaIlic melts in-volving compound formation, the phase diagram of Cr-C system as well as thermodynamic data of Fe-Cr-C melts. According to the mod-el, the standard Gibbs free energies of formation of CrC and Cr3C2 are obtained. Satisfactory agreement between the calculated and me-asured values shows that the model can reflect the structural characteristics of Fe-Cr-C melts. 展开更多
关键词 activity coexistence theory mass action concentration saturated state
下载PDF
潜在空间中深度强化学习方法研究综述
20
作者 赵婷婷 孙威 +2 位作者 陈亚瑞 王嫄 杨巨成 《计算机科学与探索》 CSCD 北大核心 2023年第9期2047-2074,共28页
深度强化学习(DRL)是实现通用人工智能的一种有效学习范式,已在一系列实际应用中取得了显著成果。然而,DRL存在泛化性能差、样本效率低等问题。基于深度神经网络的表示学习通过学习环境的底层结构,能够有效缓解上述问题。因此,基于潜在... 深度强化学习(DRL)是实现通用人工智能的一种有效学习范式,已在一系列实际应用中取得了显著成果。然而,DRL存在泛化性能差、样本效率低等问题。基于深度神经网络的表示学习通过学习环境的底层结构,能够有效缓解上述问题。因此,基于潜在空间的深度强化学习成为该领域的主流方法。系统地综述了基于潜在空间的表示学习在深度强化学习中的研究进展,分析并总结了现有基于潜在空间的深度强化学习的方法,将其分为潜在空间中的状态表示、动作表示以及动力学模型进行详细阐述。其中,潜在空间中的状态表示又被分为基于重构方式的状态表示方法、基于互模拟等价的状态表示方法及其他状态表示方法。最后,列举了现有基于潜在空间的强化学习在游戏领域、智能控制领域、推荐领域及其他领域的成功应用,并浅谈了该领域的未来发展趋势。 展开更多
关键词 强化学习 深度学习 潜在空间 状态表示 动作表示
下载PDF
上一页 1 2 19 下一页 到第
使用帮助 返回顶部