期刊文献+
共找到25篇文章
< 1 2 >
每页显示 20 50 100
带最大熵修正的行动者评论家算法 被引量:5
1
作者 姜玉斌 刘全 胡智慧 《计算机学报》 EI CSCD 北大核心 2020年第10期1897-1908,共12页
在行动者评论家算法中,策略梯度通常使用最大熵正则项来提高行动策略的随机性以保证探索.策略的随机使Agent能够遍历所有动作,但是会造成值函数的低估并影响算法的收敛速度与稳定性.针对策略梯度中最大熵正则项带来的低估问题,提出最大... 在行动者评论家算法中,策略梯度通常使用最大熵正则项来提高行动策略的随机性以保证探索.策略的随机使Agent能够遍历所有动作,但是会造成值函数的低估并影响算法的收敛速度与稳定性.针对策略梯度中最大熵正则项带来的低估问题,提出最大熵修正(Maximum-Entropy Correction,MEC)算法.该算法有两个特点:(1)利用状态值函数与策略函数构造一种状态动作值函数的估计,构造的状态动作值函数符合真实值函数的分布;(2)将贝尔曼最优方程与构造的状态动作值函数结合作为MEC算法的目标函数.通过使用新的目标函数,MEC算法可以解决使用最大熵正则项带来的性能下降与不稳定.为了验证算法的有效性,将该算法与近似策略优化算法以及优势行动者评论家算法在Atari 2600游戏平台进行比较实验.实验结果表明,MEC在改进性能的同时提高了算法的稳定性. 展开更多
关键词 强化学习 深度学习 行动者评论家算法 最大熵 策略梯度
下载PDF
基于重要性采样的优势估计器
2
作者 刘全 姜玉斌 胡智慧 《通信学报》 EI CSCD 北大核心 2019年第5期108-116,共9页
在连续动作任务中,深度强化学习通常采用高斯分布作为策略函数。针对高斯分布策略函数由于截断动作导致算法收敛速度变慢的问题,提出了一种重要性采样优势估计器(ISAE)。该估计器在通用优势估计器(GAE)的基础上,引入了重要性采样机制,... 在连续动作任务中,深度强化学习通常采用高斯分布作为策略函数。针对高斯分布策略函数由于截断动作导致算法收敛速度变慢的问题,提出了一种重要性采样优势估计器(ISAE)。该估计器在通用优势估计器(GAE)的基础上,引入了重要性采样机制,通过计算边界动作的目标策略与行动策略比率修正截断动作带来的值函数偏差,提高了算法的收敛速度。此外,ISAE引入了L参数,通过限制重要性采样率的范围,提高了样本的可靠度,保证了网络参数的稳定。为了验证ISAE的有效性,将ISAE与近端策略优化结合并与其他算法在Mu Jo Co平台上进行比较。实验结果表明,ISAE具有更快的收敛速度。 展开更多
关键词 强化学习 重要性采样 深度强化学习 优势函数
下载PDF
关于“做抛体运动的物体到斜面距离”的思考 被引量:1
3
作者 姜玉斌 王俊杰 《物理教学探讨(中学教学教研版)》 2012年第8期39-41,共3页
针对做抛体运动的物体到斜面的距离这一常见问题,文章进行多角度深入的探讨,以期对一线教学有一定的借鉴价值。
关键词 抛体运动 一题多解 物理方法 数学方法 错误分析 拓展延伸
下载PDF
均匀带电圆环中心轴线上的场强与电势 被引量:1
4
作者 姜玉斌 《物理教学探讨(中学教学教研版)》 2011年第4期36-38,共3页
均匀带电圆环中心轴线上的场强与电势分别有什么规律?两个共轴放置的均匀带电圆环中心轴线上的场强与电势又分别有什么规律?几何画板具有已知函数绘制图象的功能,下面笔者将利用这一功能,对上述问题进行探讨。
关键词 电势 场强 轴线 几何画板 规律 功能
下载PDF
农村康复治疗模式对脑卒中残障患者功能康复的影响 被引量:6
5
作者 包淑杰 于利华 +2 位作者 黄文 姜玉斌 修振志 《中国康复医学杂志》 CAS CSCD 北大核心 2012年第11期1055-1057,共3页
目的:研究农村康复治疗模式对脑卒中残障患者功能康复的近期及远期影响。方法:2010年7月—2011年7月在海阳市中医医院接受治疗的脑卒中患者中,按照纳入标准、排除标准、及自愿参加的原则,共选择219例农村脑卒中残障患者根据其意愿分为... 目的:研究农村康复治疗模式对脑卒中残障患者功能康复的近期及远期影响。方法:2010年7月—2011年7月在海阳市中医医院接受治疗的脑卒中患者中,按照纳入标准、排除标准、及自愿参加的原则,共选择219例农村脑卒中残障患者根据其意愿分为治疗组(110例)和对照组(109例)两组。其中治疗组应用农村康复治疗模式(康复中心-乡镇卫生院-村卫生室-家庭模式)接受系统的康复治疗及随访;对照组患者未接受系统的康复治疗但接受随访。采用Barthel评分法分别评定出院入组时及入组后1个月、3个月、6个月脑卒中残障患者的功能康复情况。结果:两组患者出院入组时Barthel评分无显著差异,治疗组(28.53±1.23)甚至略低于对照组(33.10±1.21),而在入组后1个月、3个月、6个月时治疗组与对照组比较,差异均有统计学意义(P<0.05),说明治疗组患者的功能康复较对照组患者得到很大改善。结论:农村康复治疗模式对脑卒中残障患者的功能康复有效,治疗规范、经济方便、且有远期效果,适于在农村地区推广。 展开更多
关键词 脑卒中 农村康复治疗模式 康复训练
下载PDF
培养学生审题能力的有效教学策略 被引量:1
6
作者 姜玉斌 《物理教学探讨(中学教学教研版)》 2008年第1期27-28,共2页
审题就是应用掌握的概念、规律,从题目的陈述中正确辨析出题目所给的具体条件或具体要求的过程,是解题的前提,也决定着解题的成败。
关键词 审题能力 有效教学策略 学生 培养 解题
下载PDF
建立农村脑卒中残障患者康复治疗模式初探 被引量:4
7
作者 包淑杰 黄文 +2 位作者 于利华 姜玉斌 修振志 《中国全科医学》 CAS CSCD 北大核心 2012年第27期3196-3197,共2页
由于人口老龄化、脑卒中患者增多及农村医疗卫生条件的改善,广大农民患者对康复治疗需求增加,普通的住院治疗已无法满足社会需要。因此模仿社区康复模式建立相应的农村脑卒中康复治疗模式显得尤为重要。在建立农村脑卒中康复治疗模式探... 由于人口老龄化、脑卒中患者增多及农村医疗卫生条件的改善,广大农民患者对康复治疗需求增加,普通的住院治疗已无法满足社会需要。因此模仿社区康复模式建立相应的农村脑卒中康复治疗模式显得尤为重要。在建立农村脑卒中康复治疗模式探索的道路上,我们通过在肢体残疾康复网络基础上建立农村脑卒中康复治疗四级网络模式,以其经济、有效、方便的特点收到良好的效果。 展开更多
关键词 卒中 农村卫生 康复中心 康复
下载PDF
基于经验指导的深度确定性多行动者-评论家算法 被引量:6
8
作者 陈红名 刘全 +3 位作者 闫岩 何斌 姜玉斌 张琳琳 《计算机研究与发展》 EI CSCD 北大核心 2019年第8期1708-1720,共13页
连续控制问题一直是强化学习研究的一个重要方向.近些年深度学习的发展以及确定性策略梯度(deterministic policy gradients, DPG)算法的提出,为解决连续控制问题提供了很多好的思路.这类方法大多在动作空间中加入外部噪声源进行探索,... 连续控制问题一直是强化学习研究的一个重要方向.近些年深度学习的发展以及确定性策略梯度(deterministic policy gradients, DPG)算法的提出,为解决连续控制问题提供了很多好的思路.这类方法大多在动作空间中加入外部噪声源进行探索,但是它们在一些连续控制任务中的表现并不是很好.为更好地解决探索问题,提出了一种基于经验指导的深度确定性多行动者评论家算法(experience-guided deep deterministic actor-critic with multi-actor, EGDDAC-MA),该算法不需要外部探索噪声,而是从自身优秀经验中学习得到一个指导网络,对动作选择和值函数的更新进行指导.此外,为了缓解网络学习的波动性,算法使用多行动者评论家模型,模型中的多个行动者网络之间互不干扰,各自执行情节的不同阶段.实验表明:相比于DDPG,TRPO和PPO算法,EGDDAC-MA算法在GYM仿真平台中的大多数连续任务中有更好的表现. 展开更多
关键词 强化学习 深度强化学习 确定性行动者评论家 经验指导 专家指导 多行动者
下载PDF
等时圆规律的推导、应用与延伸 被引量:1
9
作者 姜玉斌 《中学物理》 2012年第8期67-68,共2页
规律如图1所示,AB、AC、AD是竖直面内三根固定的光滑细杆,A、B、C、D位于同一圆周上,A点为圆周的最高点,D点为最低点.每根杆上都套着一个光滑的小滑环(图中未画出),三个滑环分别从A处由静止开始释放,到达圆周上所用的时间是相... 规律如图1所示,AB、AC、AD是竖直面内三根固定的光滑细杆,A、B、C、D位于同一圆周上,A点为圆周的最高点,D点为最低点.每根杆上都套着一个光滑的小滑环(图中未画出),三个滑环分别从A处由静止开始释放,到达圆周上所用的时间是相等的,与杆的长度和倾角大小都无关. 展开更多
关键词 规律 应用 竖直面 圆周 最高点 最低点
下载PDF
关注学生解题经验,提高试题讲评效益——从一道试题讲评说起
10
作者 姜玉斌 《物理教学探讨(中学教学教研版)》 2009年第2期71-72,共2页
1缘起 近来测试卷中有这样一道题目:四个不同质点由同一点沿同一直线同时从静止开始向同一方向运动,如图甲所示的位移(x)-时间(t)图象和图乙速度(v)-时间(t)图象中,给出四条曲线1、2、3、4代表这四个不同质点的运动情况。... 1缘起 近来测试卷中有这样一道题目:四个不同质点由同一点沿同一直线同时从静止开始向同一方向运动,如图甲所示的位移(x)-时间(t)图象和图乙速度(v)-时间(t)图象中,给出四条曲线1、2、3、4代表这四个不同质点的运动情况。关于图象的物理意义,下列描述正确的是: 展开更多
关键词 试题讲评 经验 解题 学生 评说 效益 同一直线 运动情况
下载PDF
给教材的一道例题改错
11
作者 姜玉斌 《物理教学探讨(中学教学教研版)》 2007年第3期34-34,共1页
人教版选修3—2第四章第5节例题:现代科学研究中常用到高速电子,电子感应加速器就是利用感应电场使电子加速的设备,它的基本原理如图1所示,上、下为电磁铁的两个磁极,磁极之间有一个环形真空室,电子在真空室中做圆周运动。电磁铁... 人教版选修3—2第四章第5节例题:现代科学研究中常用到高速电子,电子感应加速器就是利用感应电场使电子加速的设备,它的基本原理如图1所示,上、下为电磁铁的两个磁极,磁极之间有一个环形真空室,电子在真空室中做圆周运动。电磁铁线圈电流的大小、方向可以变化,产生的感应电场使电子加速。感应电场的方向,可以根据楞次定律用右手螺旋定则来判断。图1的上图为侧视图,下图为真空室的俯视图。如果从上向下看,电子沿逆时针方向运动,那么当电磁铁线圈电流与图示方向一致时,电流的大小应该怎样变化才能使电子加速?如果电流的方向与图示方向相反,为使电子加速,电流又应该怎样变化? 展开更多
关键词 例题 感应电场 改错 教材 右手螺旋定则 圆周运动 加速器 电磁铁
下载PDF
运用微元法求解功
12
作者 姜玉斌 《物理教学探讨(中学教学教研版)》 2011年第9期41-43,共3页
本文以中学物理教学中的常见问题为例,对运用微元法求解变力做功的思路进行了详细的阐述。
关键词 微元法 变力做功 万有引力做功 弹力做功 摩擦力做功 交变电流做功 安培力做功
下载PDF
给恒定电流教材编写的几点建议
13
作者 姜玉斌 《物理教学探讨(中学教学教研版)》 2013年第2期39-40,共2页
以丹聂耳电池为例说明电路中电势变化的规律,在此基础上分析书中插图存在的不妥之处,并对内电压、闭合电路欧姆定律的教材编写给出合理的建议。
关键词 恒定电流 丹聂耳电池 电势 教材编写 建议
下载PDF
一道高考试题的解析、拓展与评价
14
作者 姜玉斌 《物理教学探讨(中学教学教研版)》 2014年第6期41-42,44,共3页
本文以一道与弹簧弹性势能和动能相关的高考题为依托,从解析、拓展与评价三个角度展开,用案例的形式进行高考试题的研究.旨在挖掘出试题丰富的学科内涵,帮助教师在讲解类似问题时做到游刃有余.
关键词 高考试题 解析 拓展 评价
下载PDF
利用教学中的错误 引导学生课后探究
15
作者 姜玉斌 《物理教学探讨(中学教学教研版)》 2013年第8期39-40,44,共3页
以教学中的错误为契机,启发学生思考,引导学生钻研,把错误变成有效的教育资源。采用教学日记的方式对典型案例进行分析,以鲜活的事实与理性的思考,凸显错误所独具的教育价值。
关键词 错误 探究 教学日记 教学思考
下载PDF
三种加速器教学中应弄清的问题
16
作者 姜玉斌 《物理教学探讨(中学教学教研版)》 2009年第10期37-39,共3页
本文主要阐述了直线加速器、回旋加速器、电子感应加速器这三种加速器在教学中应弄清的问题,并总结出了解决这些问题的具体方法。
关键词 加速器 教学 问题讨论
下载PDF
在电学设计中培养学生的评价能力——从一道电学设计题说起
17
作者 姜玉斌 《物理通报》 2009年第12期26-28,共3页
1缘起 近来测试卷中有这样一道题目:现有一满偏电流为50μA、内阻约为800~850Ω的59C2型小量程电流计G(表头);另外可供选择的器材有电压表V(量程3V,内阻约为20kΩ),电流表A1(量程200μA,内阻约为500Ω),
关键词 设计 电学 能力 评价 学生 培养 小量程 电流计
下载PDF
道德散步
18
作者 姜玉斌 《课堂内外(教师版)(初等教育)》 2011年第10期19-20,共2页
散步是形式,师生间的交流是内容,实现学生的道德进步是目的。这里师生间的交流不同于简单的教师与学生的谈心,它是一种有目的、有计划、有准备的与学生进行深入思想交流的过程。
关键词 道德散步 教育 思想交流
下载PDF
核子秤 被引量:1
19
作者 姜鸿利 姜玉斌 《纸和造纸》 北大核心 2004年第4期51-53,共3页
简述核子秤原理、系统构成。
关键词 核子秤 工作原理 系统构成 非接触式测量方式 造纸 Γ射线 废纸计量
下载PDF
等效电源的原理与运用
20
作者 周同仕 姜玉斌 《物理教学探讨(中学教学教研版)》 2010年第3期35-37,共3页
任何一个线性有源二端电路,都可以用一个电源来替代,这个电源就称为等效电源。如何进行电源的等效,等效电源有哪些常见的应用,下面谈谈笔者对此的思考。
关键词 等效电源 原理 线性
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部