期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
基于图嵌入编码形态信息的非均匀多任务强化学习方法
1
作者 贺晓 王文学 《计算机应用研究》 CSCD 北大核心 2024年第4期1022-1028,共7页
传统强化学习方法存在效率低下、泛化性能差、策略模型不可迁移的问题。针对此问题,提出了一种非均匀多任务强化学习方法,通过学习多个强化任务提升效率和泛化性能,将智能体形态构建为图,利用图神经网络能处理任意连接和大小的图来解决... 传统强化学习方法存在效率低下、泛化性能差、策略模型不可迁移的问题。针对此问题,提出了一种非均匀多任务强化学习方法,通过学习多个强化任务提升效率和泛化性能,将智能体形态构建为图,利用图神经网络能处理任意连接和大小的图来解决状态和动作空间维度不同的非均匀任务,突破模型不可迁移的局限,充分发挥图神经网络天然地利用图结构归纳偏差的优点,实现了模型高效训练和泛化性能提升,并可快速迁移到新任务。多任务学习实验结果表明,与以往方法相比,该方法在多任务学习和迁移学习实验中均表现出更好的性能,在迁移学习实验中展现出更准确的知识迁移。通过引入图结构偏差,使该方法具备更高的效率和更好的迁移泛化性能。 展开更多
关键词 任务强化学习 图神经网络 变分图自编码器 形态信息编码 迁移学习
下载PDF
基于语言类任务的概念化强化学习框架
2
作者 彭少辉 胡杏 支天 《高技术通讯》 CAS 北大核心 2024年第6期555-566,共12页
语言类强化学习任务可以促进强化学习策略的泛化性,其关键问题是自动化学习观测和语言描述的通用表示。现有方法往往隐式学习联合表示,不可避免地引入训练集中的虚假相关信息,进而损伤策略的泛化性和训练效率。针对这一问题,本文提出了... 语言类强化学习任务可以促进强化学习策略的泛化性,其关键问题是自动化学习观测和语言描述的通用表示。现有方法往往隐式学习联合表示,不可避免地引入训练集中的虚假相关信息,进而损伤策略的泛化性和训练效率。针对这一问题,本文提出了概念化强化学习框架(CRL),其利用概念化这种从实体提取相似性生成抽象表示的认知方式,通过基于注意力机制的概念编码器和限制性损失函数显式地学习概括且抽象的概念化表示作为强化学习策略的输入。本文在常用的语言条件任务和文本游戏任务上验证了CRL的有效性,结果显示概念化表示大幅提升了策略的训练效率(最多70%)和泛化性能(最多30%),并有效提升了策略的可解释性。 展开更多
关键词 深度强化学习(DRL) 语言类强化学习任务 文本游戏 表示学习 互信息优化
下载PDF
融合电网运行场景聚类的多任务深度强化学习优化调度 被引量:10
3
作者 邓柏荣 陈俊斌 +4 位作者 丁巧宜 潘振宁 余涛 王克英 侯佳萱 《电网技术》 EI CSCD 北大核心 2023年第3期978-987,共10页
“双碳”目标和新型电力系统建设背景下,新能源的高渗透率接入导致电力系统随机性显著增大、运行方式的分布复杂多样,传统单任务深度强化学习难以自适应源荷两侧的高随机性,调度决策难以满足新型电力系统对风光消纳、功率平衡需求。为此... “双碳”目标和新型电力系统建设背景下,新能源的高渗透率接入导致电力系统随机性显著增大、运行方式的分布复杂多样,传统单任务深度强化学习难以自适应源荷两侧的高随机性,调度决策难以满足新型电力系统对风光消纳、功率平衡需求。为此,该文提出融合电网运行场景聚类的多任务深度强化学习优化调度方法。该方法离线训练时利用空间聚类和决策树辨识海量调度运行数据的典型运行场景与重要特征,并构建甄别场景类别的多层感知机分类器;再依据场景类别建立和划分融合聚类多任务深度强化学习模型,从数据源到状态动作设计差异化训练各子任务学习器与模型;在线决策时利用分类器辨识有限运行数据的场景类别,调用模型快速求解实时调度任务,实现高随机场景下的多任务快速迁移学习,保证电力系统优化调度决策的最优性。该文通过算例验证了该方法的解的可行性与经济性。实验结果表明,融合电网运行场景聚类的多任务深度强化学习优化调度算法较单任务算法能够明显提升调度决策经济效益。 展开更多
关键词 数据驱动模式 场景聚类 任务深度强化学习 迁移学习 优化调度
下载PDF
任务为导向的留学生伴随性词汇学习研究 被引量:10
4
作者 孙晓明 《汉语学习》 CSSCI 北大核心 2012年第4期91-96,共6页
本文采用实验研究的方法,考察三种任务强化手段对留学生伴随性词汇学习的影响。实验表明,词汇相关度、宣布词汇测试以及词汇训练作业等三种任务强化手段是影响学生伴随性词汇学习的关键变量。该结果提示我们,阅读中的伴随性词汇学习可... 本文采用实验研究的方法,考察三种任务强化手段对留学生伴随性词汇学习的影响。实验表明,词汇相关度、宣布词汇测试以及词汇训练作业等三种任务强化手段是影响学生伴随性词汇学习的关键变量。该结果提示我们,阅读中的伴随性词汇学习可以通过一些手段加以强化,这些手段会促使学生实现词汇的精加工,进而习得词汇。 展开更多
关键词 伴随性词汇习得 任务强化手段 阅读
下载PDF
强化动态视觉任务的户外运动网球训练对六年级小学生视力的影响研究
5
作者 王齐 柏游游 +1 位作者 冯亚宁 张康 《运动-休闲(大众体育)》 2022年第14期75-77,共3页
研究从当前青少年学生近视问题严重的实际出发,选取某小学六年级 10 名学生分为实验组与对照组各 20 人,进行为期 1 年(2 学期)的实验干预。研究通过实验并基于数据分析结果可以得出结论,强化动态视觉任务的户外运动网球训练对六年级小... 研究从当前青少年学生近视问题严重的实际出发,选取某小学六年级 10 名学生分为实验组与对照组各 20 人,进行为期 1 年(2 学期)的实验干预。研究通过实验并基于数据分析结果可以得出结论,强化动态视觉任务的户外运动网球训练对六年级小学生的静态视力和动态视力都具有很好的改善作用。 展开更多
关键词 强化动态视觉任务 户外运动网球训练 六年级小学生 视力影响
下载PDF
互动协同视角下语音协同对英语过去式习得的影响
6
作者 周晓 《海外英语》 2024年第9期7-10,共4页
本文基于互动协同理论,验证了协同的传导效应,并考察了两种任务条件(任务强化和无任务强化)下,多模态输入中语音协同对中国外语学习者过去式习得的影响。研究采用了“前测-后测-延时后测”的实验设计,将学生分为实验组(强化组、无强化组... 本文基于互动协同理论,验证了协同的传导效应,并考察了两种任务条件(任务强化和无任务强化)下,多模态输入中语音协同对中国外语学习者过去式习得的影响。研究采用了“前测-后测-延时后测”的实验设计,将学生分为实验组(强化组、无强化组)和控制组。实验组使用了“英语趣配音”软件完成五次配音练习,而控制组仅完成朗读同样内容纸质材料的任务。结果表明:1)与多模态输入互动可以产生语音协同;2)与对照组相比,实验组英语过去式后测成绩显著提升,且能保持到延时后测,同时强化任务条件的促学效果更强。本研究为协同的传导效应提供了实证证据,同时对使用多模态手段进行外语教学提供了启示。 展开更多
关键词 互动协同 多模态 语音协同 任务强化 英语过去式
下载PDF
任务类型对大学英语词汇习得作用的差异比较分析 被引量:1
7
作者 王倩倩 余忠燕 张凤 《淮南师范学院学报》 2021年第3期103-108,共6页
文章通过实证研究不同类型强化任务对大学英语词汇习得的不同作用。研究发现:三种任务对词汇习得都有着显著的促进作用,但效果各不相同。其中,写作任务效果最佳,匹配任务次之,填充任务最次。匹配和填充任务对接受型词汇知识的作用较好,... 文章通过实证研究不同类型强化任务对大学英语词汇习得的不同作用。研究发现:三种任务对词汇习得都有着显著的促进作用,但效果各不相同。其中,写作任务效果最佳,匹配任务次之,填充任务最次。匹配和填充任务对接受型词汇知识的作用较好,写作任务对产出型词汇知识作用明显。尽管学习者对匹配任务和填充任务喜爱度较高,却认为写作任务的帮助最大。建议将“匹配任务”融入常态化日常教学;“写作任务”可分阶段集中展开,进行强化型训练;“填充任务”可作为教学补充型任务,根据实际情况选用。 展开更多
关键词 强化任务 大学英语 词汇习得
下载PDF
任务类型对场独立及场依赖学习者词汇习得的影响
8
作者 崔宇 孙鑫 《江苏外语教学研究》 2017年第4期5-10,共6页
本文主要研究输入和输出类型的阅读强化词汇练习任务对场独立型及场依赖型认知风格的二语学习者词汇 习得效果的影响作用.122名英语专业本科生依据镶嵌图形测试结果被分成场独立和场依赖两个认知类型,两个认知 风格的受试又被分成输入... 本文主要研究输入和输出类型的阅读强化词汇练习任务对场独立型及场依赖型认知风格的二语学习者词汇 习得效果的影响作用.122名英语专业本科生依据镶嵌图形测试结果被分成场独立和场依赖两个认知类型,两个认知 风格的受试又被分成输入和输出类型练习组,之后,四组受试接受即时和延时词汇测试.结果显示+ 1)输入型练习对场 独立型学习者词汇习得的效果明显优于输出型练习,而两种任务对场依赖型学习者的习得效果则无显著差异;2)在同 类型任务的对比中,输入任务对场独立型学习者词汇习得效果远比场依赖型学习者要好,而完成输出任务两个风格的 受试习得效果无显著差异.研究结果对教师更有针对性地实施外语教学,提高教学质量具有重要意义. 展开更多
关键词 场独立/场依赖 认知风格 阅读强化任务 词汇附带习得
下载PDF
Deep reinforcement learning-based optimization of lightweight task offloading for multi-user mobile edge computing 被引量:1
9
作者 ZHANG Wenxian DU Yongwen 《Journal of Measurement Science and Instrumentation》 CAS CSCD 2021年第4期489-500,共12页
To improve the quality of computation experience for mobile devices,mobile edge computing(MEC)is a promising paradigm by providing computing capabilities in close proximity within a sliced radio access network,which s... To improve the quality of computation experience for mobile devices,mobile edge computing(MEC)is a promising paradigm by providing computing capabilities in close proximity within a sliced radio access network,which supports both traditional communication and MEC services.However,this kind of intensive computing problem is a high dimensional NP hard problem,and some machine learning methods do not have a good effect on solving this problem.In this paper,the Markov decision process model is established to find the excellent task offloading scheme,which maximizes the long-term utility performance,so as to make the best offloading decision according to the queue state,energy queue state and channel quality between mobile users and BS.In order to explore the curse of high dimension in state space,a candidate network is proposed based on edge computing optimize offloading(ECOO)algorithm with the application of deep deterministic policy gradient algorithm.Through simulation experiments,it is proved that the ECOO algorithm is superior to some deep reinforcement learning algorithms in terms of energy consumption and time delay.So the ECOO is good at dealing with high dimensional problems. 展开更多
关键词 multi-user mobile edge computing task offloading deep reinforcement learning
下载PDF
六安市裕安区城管局用“四个强化”推进创城工作
10
作者 王务兵 《城建监察》 2016年第9期5-5,共1页
安徽消息 六安市裕安区城管局继6月22日全区文明委(扩大)会议暨创城工作再推进大会后,用“四个强化”统一全局干部职工思想,高效有序推进创城工作。
关键词 六安市裕安区城管局 创城工作 统一思想 强化目标任务
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部