期刊文献+
共找到8篇文章
< 1 >
每页显示 20 50 100
MARKOVIAN DECISION PROGRAMMING WITH RECURSIVE VECTOR-REWARD
1
作者 刘建庸 刘克 《Acta Mathematicae Applicatae Sinica》 SCIE CSCD 1990年第2期158-165,共8页
In this paper, we discuss Markovian decision programming with recursive vector-reward andgive an algorithm to find optimal policies. We prove that: (1) There is a Markovian optimal policy for the nonstationary case; (... In this paper, we discuss Markovian decision programming with recursive vector-reward andgive an algorithm to find optimal policies. We prove that: (1) There is a Markovian optimal policy for the nonstationary case; (2) Thereis a stationary optimal policy for the stationary case. 展开更多
关键词 TH MARKOVIAN DECISION PROGRAMMING WITH RECURSIVE vector-reward
原文传递
人文社会科学研究奖励投入产出绩效研究——基于高校奖励孤岛的反思
2
作者 俞立平 胡甲滨 陈庭贵 《常州大学学报(社会科学版)》 2023年第3期48-57,共10页
人文社会科学研究奖励具有价值导向和激励功能,对人文社会科学发展具有重要意义,但学界缺乏从投入产出角度对人文社会科学研究奖励绩效进行统计检验的研究成果。在理论分析的基础上,选取中国高校人文社会科学网上省际高校面板数据,综合... 人文社会科学研究奖励具有价值导向和激励功能,对人文社会科学发展具有重要意义,但学界缺乏从投入产出角度对人文社会科学研究奖励绩效进行统计检验的研究成果。在理论分析的基础上,选取中国高校人文社会科学网上省际高校面板数据,综合采用联立方程模型、BP人工神经网络、贝叶斯向量自回归模型对人文社会科学投入产出关系进行实证研究。研究表明:人文社会科学研究奖励为数据孤岛,与其他主要变量不相关,造成这一结果的原因可能是发表偏倚。数据孤岛特性要求人文社会科学研究奖励的权重必须小于任何一项直接科研成果的权重,且不同级别的人文社会科学研究奖励的权重也不宜相差过大。 展开更多
关键词 人文社会科学研究 奖励 联立方程模型 BP人工神经网络 贝叶斯向量自回归模型
下载PDF
基于马氏决策向量过程模型的有限阶段期望总报酬准则及其最优方程 被引量:2
3
作者 陈杰 刘再明 邢灵博 《数学理论与应用》 2011年第4期7-13,共7页
在马氏决策向量过程模型的理论基础上,结合决策向量和相合度等新定义,进一步提出有限阶段期望总报酬准则和最优方程,并证明最优方程的解的存在性.
关键词 马氏决策向量过程模型 报酬准则 最优方程 存在性
下载PDF
马氏决策向量过程模型的性质及其优越性定理
4
作者 陈杰 邢灵博 《数学理论与应用》 2013年第1期94-99,共6页
本文研究马尔可夫决策向量过程的性质,并证明其优越性定理.
关键词 马氏决策向量过程模型 报酬准则 最优方程 优越性定理
下载PDF
具无界递归向量值报酬函数的非时齐马尔科夫决策规划
5
作者 章芸 郭世贞 《昆明工学院学报》 1995年第2期42-48,共7页
研究一类具有无界递归向量值报酬函数的非时齐马尔科夫决策规划,给出了模型的向量最优方程,首次给出了模型的向量ε─最优策略的定义及其存在的充分条件,讨论了该模型的有效策略和最优策略。
关键词 向量值报酬函数 递归报酬函数 马氏决策规划
下载PDF
无界报酬向量值折扣马氏决策规划 被引量:2
6
作者 张升 张继红 《云南大学学报(自然科学版)》 CAS CSCD 1993年第3期200-207,共8页
本文建立了一类无界向量值报酬折扣马氏决策规划,在一组无关向量生成的凸锥确定的序关系下,讨论了模型最优策略的存在性;给出强最优策略存在的必要充分条件;指出最优策略的自组合、凸组合策咯仍是最优策略;还证明了平稳策略在一般策略... 本文建立了一类无界向量值报酬折扣马氏决策规划,在一组无关向量生成的凸锥确定的序关系下,讨论了模型最优策略的存在性;给出强最优策略存在的必要充分条件;指出最优策略的自组合、凸组合策咯仍是最优策略;还证明了平稳策略在一般策略类中的优势。 展开更多
关键词 无界报酬向量 马氏决策规划
原文传递
无界报酬向量值折扣马氏决策规划──最优平稳策略及算法
7
作者 张升 张继红 《云南大学学报(自然科学版)》 CAS CSCD 1994年第4期299-305,共7页
本文主要讨论了无界报酬向量模型的平稳策略问题,给出了改进平稳策略的方法,建立起向量模型的最优方程,获得平稳策略为强最优策略的充要条件.指出最优平稳策略的期望报酬函数必为极大不动点,最后提出一种寻求最优平稳策略的策略迭... 本文主要讨论了无界报酬向量模型的平稳策略问题,给出了改进平稳策略的方法,建立起向量模型的最优方程,获得平稳策略为强最优策略的充要条件.指出最优平稳策略的期望报酬函数必为极大不动点,最后提出一种寻求最优平稳策略的策略迭代算法. 展开更多
关键词 折扣马氏决策规划 最优平稳策略 无界报酬向量
原文传递
前额叶皮层和纹状体群体神经元编码视觉刺激和奖励信息
8
作者 陈素华 潘晓川 Masamichi Sakagami 《生理学报》 CAS CSCD 北大核心 2020年第6期765-776,共12页
以往的文献报道了前额叶皮层和纹状体中的一些神经元编码视觉刺激(visual stimulus)和奖励(reward)信息,但从单个神经元角度来看,编码信息的方式很复杂,不同的神经元在不同时刻各自编码刺激或奖励信息。本文旨在研究这两个区域的群体神... 以往的文献报道了前额叶皮层和纹状体中的一些神经元编码视觉刺激(visual stimulus)和奖励(reward)信息,但从单个神经元角度来看,编码信息的方式很复杂,不同的神经元在不同时刻各自编码刺激或奖励信息。本文旨在研究这两个区域的群体神经元能否在整个试验期间(in a whole trial)稳定地表征与任务相关的信息。在一个刺激-奖励预测实验中,记录了日本猕猴(Macaca fuscata)前额叶皮层和纹状体中单个神经元的活动,采用多变量回归分析和线性支持向量机分类的方法研究了群体神经元编码的信息。结果显示,尽管与任务相关的神经元的比例在整个试验中变化较大,但前额叶皮层群体神经元稳定、可靠地编码了奖励和刺激信息,纹状体群体神经元在整个试验期间也编码了奖励信息,但没有编码刺激信息。这两个区域的神经元都编码了刺激和奖励的组合信息,并且前额叶皮层的神经元编码了一组刺激(一个集合)与奖励的关系,而纹状体神经元编码了一个特定刺激与奖励的关系。以上结果提示,前额叶皮层和纹状体群体神经元都能稳定地表达任务相关的参数,但各自编码的信息是不一样的,对应于它们在价值决策中不同的作用。 展开更多
关键词 前额叶皮层 纹状体 奖励预测 群体神经元 支持向量机
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部