期刊文献+
共找到3,539篇文章
< 1 2 177 >
每页显示 20 50 100
马尔可夫决策过程两种抽象模式 被引量:2
1
作者 王蓁蓁 邢汉承 +1 位作者 张志政 倪庆剑 《计算机科学》 CSCD 北大核心 2008年第10期6-14,48,共10页
抽象层次上马尔可夫决策过程的引入,使得人们可简洁地、陈述地表达复杂的马尔可夫决策过程,解决常规马尔可夫决策过程(MDPs)在实际中所遇到的大型状态空间的表达问题。介绍了结构型和概括型两种不同类型抽象马尔可夫决策过程基本概念以... 抽象层次上马尔可夫决策过程的引入,使得人们可简洁地、陈述地表达复杂的马尔可夫决策过程,解决常规马尔可夫决策过程(MDPs)在实际中所遇到的大型状态空间的表达问题。介绍了结构型和概括型两种不同类型抽象马尔可夫决策过程基本概念以及在各种典型抽象MDPs中的最优策略的精确或近似算法,其中包括与常规MDPs根本不同的一个算法:把Bellman方程推广到抽象状态空间的方法,并且对它们的研究历史进行总结和对它们的发展做一些展望,使得人们对它们有一个透彻的、全面而又重点的理解。 展开更多
关键词 情景演算 因子化马尔可夫决策过程 逻辑马尔可夫决策过程 关系马尔可夫决策过程 Bellman方程
下载PDF
基于马尔可夫决策过程的边缘云业务迁移算法
2
作者 马安华 潘甦 《北京航空航天大学学报》 EI CAS CSCD 北大核心 2024年第6期1931-1939,共9页
在移动互联网中,当用户位置发生改变时,业务迁移可用来提升服务质量(QoS)。基于此,提出一种基于马尔可夫决策过程的边缘云业务迁移算法。与对比算法相比,所提算法考虑了不同业务类型对QoS的差异化需求,并全面考虑了业务迁移过程中的收... 在移动互联网中,当用户位置发生改变时,业务迁移可用来提升服务质量(QoS)。基于此,提出一种基于马尔可夫决策过程的边缘云业务迁移算法。与对比算法相比,所提算法考虑了不同业务类型对QoS的差异化需求,并全面考虑了业务迁移过程中的收益及开销。所提算法将业务分为实时和非实时2类,将终端的业务运行状态和与服务器的距离作为状态空间,并基于与业务体验紧密相关的可用速率和时延2个QoS指标构建收益函数,同时将业务迁移过程中的系统资源消耗作为迁移开销,通过最大化全局收益来获取最优迁移策略。通过与对比算法的模拟比较,所提算法在多种场景下都有更高的全局收益。 展开更多
关键词 业务迁移 马尔可夫决策过程 服务质量 迁移开销 业务类型
下载PDF
美军军事决策过程 被引量:4
3
作者 邢云燕 《国防科技》 2018年第1期76-80,共5页
军事决策过程是军事行动过程中做出决策所应遵循的客观规律的理论总结,不仅是对指挥员主体能力的客观检验,也是对参谋等辅助决策人员军事素养的全面考核。美军经过一系列实战检验和训练实践,不断规范军事决策过程,形成了完善的决策程序... 军事决策过程是军事行动过程中做出决策所应遵循的客观规律的理论总结,不仅是对指挥员主体能力的客观检验,也是对参谋等辅助决策人员军事素养的全面考核。美军经过一系列实战检验和训练实践,不断规范军事决策过程,形成了完善的决策程序,使之更加满足军事决策实战要求。文章阐述美军指挥员和参谋人员在军事决策中的职能以及军事决策的程序。针对作战时间紧迫的现实情况,对美军精简版军事决策过程和加速版军事决策过程的技术途径分别进行了解析。 展开更多
关键词 军事决策过程 精简版军事决策过程 加速版军事决策过程 美军
下载PDF
从精准化到精细化:线上信息干预对绿色农产品消费决策过程的动态影响
4
作者 赵婧 王建明 《财经论丛》 CSSCI 北大核心 2024年第6期89-100,共12页
伴随农产品消费数智化渗透率的大幅提升,线上信息干预成为促进绿色农产品消费的重要手段。如何在聚焦消费者“买”或“不买”的人货精准化匹配的基础上,进一步基于消费者决策过程动态调整干预内容,对消费者进行“向善”“向绿”的精细... 伴随农产品消费数智化渗透率的大幅提升,线上信息干预成为促进绿色农产品消费的重要手段。如何在聚焦消费者“买”或“不买”的人货精准化匹配的基础上,进一步基于消费者决策过程动态调整干预内容,对消费者进行“向善”“向绿”的精细化引导,是数智时代从需求端拉动农业绿色转型的前沿性议题。本文从绿色农产品属性信息切入,采用HMM与随机控制实验的混合研究方法,首先验证营养信息、环境信息及价格信息干预对消费者最终购买行为的影响效果,其次分析三种信息干预对消费者决策的动态推进过程,深入洞察消费者如何、何时改变了消费决策。研究发现:从消费者最终购买行为结果看,信息干预存在促进—抑制双因素、消费群体两极化的干预效果;从消费者决策过程看,信息干预对消费者决策过程存在激励—保健双因素作用效果,消费者的绿色农产品消费决策过程包含注意、兴趣、考虑和购买四种隐状态,三种信息干预对消费者隐性决策过程的推进效果存在明显差异。 展开更多
关键词 消费者决策过程 绿色农产品 信息干预 HMM 随机控制实验
下载PDF
基于马尔可夫决策过程的附加服务定价优化
5
作者 杨明霞 朱星辉 《哈尔滨商业大学学报(自然科学版)》 CAS 2024年第1期118-122,共5页
随着民航运输业竞争日益加剧以及航空旅客个性化需求逐步提高,为取得差异化竞争优势和提高旅客满意度,开展附加服务业务是目前国内外航空公司关注的焦点,如何对附加服务定价以增加收益是目前航空公司运营的一个重要问题.为此基于马尔可... 随着民航运输业竞争日益加剧以及航空旅客个性化需求逐步提高,为取得差异化竞争优势和提高旅客满意度,开展附加服务业务是目前国内外航空公司关注的焦点,如何对附加服务定价以增加收益是目前航空公司运营的一个重要问题.为此基于马尔可夫决策过程提出了一种附加服务定价模型,并使用策略迭代算法对该模型进行求解以获得最优价格.对两类旅客细分市场进行仿真实验.结果表明,相比于现行使用较多的附加服务短视化定价模型,通过该模型求解得到最优价格将每位旅客的平均预期收益从93.7元提高到102.1元,提升幅度约8.96%. 展开更多
关键词 航空运输 收益管理 附加服务 服务定价 马尔可夫决策过程 策略迭代
下载PDF
企业固定资产投资决策过程中的审计挑战与对策
6
作者 孔丹萍 《中国经贸》 2024年第1期207-209,共3页
审计在企业固定资产投资决策中具有至关重要的作用。通过审计,可以确保投资决策的准确性和合法性,防止欺诈行为,提供投资决策的可靠信息,支持企业的融资活动,促进企业的可持续发展。企业应高度重视审计,确保其独立性和质量,提高投资决... 审计在企业固定资产投资决策中具有至关重要的作用。通过审计,可以确保投资决策的准确性和合法性,防止欺诈行为,提供投资决策的可靠信息,支持企业的融资活动,促进企业的可持续发展。企业应高度重视审计,确保其独立性和质量,提高投资决策的准确性和成功率。目前,在企业固定资产投资决策中审计工作还存在一些难点与挑战,例如数据信息不完整、主观性与不公平性问题突出、创新与变革艰难等,给企业固定资产投资决策带来一定的困扰,逐渐影响了企业的发展。为此,企业需要加大重视,提升审计工作在固定资产投资决策过程中系统性、合规性、有效性。 展开更多
关键词 投资决策 融资活动 合规性 企业的发展 审计工作 固定资产 挑战与对策 决策过程
下载PDF
基于分层马尔可夫决策过程的AUV全局路径规划研究 被引量:3
7
作者 洪晔 王宏健 边信黔 《系统仿真学报》 EI CAS CSCD 北大核心 2008年第9期2361-2363,2367,共4页
自主路径规划是自治式水下机器人(AUV)自主能力的重要体现,是保障AUV在大范围复杂海洋环境中自主完成使命作业的关键技术之一。提出了基于马尔可夫决策过程的路径规划方法;并建立了基本的马尔可夫决策模型和结合状态聚类的分层马尔可夫... 自主路径规划是自治式水下机器人(AUV)自主能力的重要体现,是保障AUV在大范围复杂海洋环境中自主完成使命作业的关键技术之一。提出了基于马尔可夫决策过程的路径规划方法;并建立了基本的马尔可夫决策模型和结合状态聚类的分层马尔可夫决策模型,同时给出了两种规划的仿真实验及结果分析。实验证明,此类方法能够很好地求解大范围复杂环境内AUV的二维路径规划问题。 展开更多
关键词 自治式水下机器人 马尔可夫决策过程 分层马尔可夫决策过程 路径规划 仿真
下载PDF
党组织的思政工作在决策过程中的作用与策略研究
8
作者 郑莉 《中文科技期刊数据库(文摘版)社会科学》 2024年第5期0225-0228,共4页
本文以中国共产党组织的思想政治工作作为研究对象,探讨了其在党和国家决策过程中的作用及策略。通过对党组织中的思政工作进行深入剖析,发现其具有至关重要的地位和作用,对于保证决策的科学性和公正性起着关键的推动作用。具体考察了... 本文以中国共产党组织的思想政治工作作为研究对象,探讨了其在党和国家决策过程中的作用及策略。通过对党组织中的思政工作进行深入剖析,发现其具有至关重要的地位和作用,对于保证决策的科学性和公正性起着关键的推动作用。具体考察了党组织的思政工作在决策过程的具体实践运用。研究表明,党组织的思政工作能有效地为决策者创造出一个良好的决策环境,为他们提供实事求是的信息、理论和实践经验,进而提高决策的科学性和准确性。同时,研究还探讨了在实施思政工作进程中的关键策略。研究结果对进一步加强党组织的思政工作,推动想做效能发挥的提升具有积极的理论和实践意义。 展开更多
关键词 党组织 思政工作 决策过程 科学决策 实践路径
下载PDF
马尔可夫决策过程在呼吸机参数获取中的应用
9
作者 刘瑜珈 王磊 董琳 《数码设计(电子版)》 2024年第1期0076-0078,共3页
本文从提高呼吸机治疗的安全和有效性出发,以马尔可夫决策过程为基础,在呼吸机参数的获取方面进行探索。以变分自编码器和策略优化模型为基础,以动作策略获取模块为依托,以强化学习算法为基础进行参数的优化获取。实验结果表明,在呼吸... 本文从提高呼吸机治疗的安全和有效性出发,以马尔可夫决策过程为基础,在呼吸机参数的获取方面进行探索。以变分自编码器和策略优化模型为基础,以动作策略获取模块为依托,以强化学习算法为基础进行参数的优化获取。实验结果表明,在呼吸机参数的获取上具有更高的安全性和治疗效果,在医疗决策支持系统的开发上具有理论依据和技术参考作用。因此本研究为呼吸机参数的智能获取提供了新方法。同时对于提高呼吸机治疗的临床应用具有重要的意义。 展开更多
关键词 马尔可夫决策过程 呼吸机参数 强化学习 智能医疗系统
下载PDF
决策者的认知特征对决策过程及企业战略选择的影响 被引量:55
10
作者 张文慧 张志学 刘雪峰 《心理学报》 CSSCI CSCD 北大核心 2005年第3期373-381,共9页
在不确定环境下,企业的最高决策者的个人特性和行为对于企业的战略决策起着关键的作用。本研究探讨决策者的认知特征对于战略决策的过程以及最终形成的战略决策的影响。研究采用情境实验法,根据某企业的实际情形编写了一个商业案例,案... 在不确定环境下,企业的最高决策者的个人特性和行为对于企业的战略决策起着关键的作用。本研究探讨决策者的认知特征对于战略决策的过程以及最终形成的战略决策的影响。研究采用情境实验法,根据某企业的实际情形编写了一个商业案例,案例提供了决策者所需要的信息,并制造出高不确定的情境。148名来自大学管理学院的学生被要求对于该案例进行分析并填写有关量表。对数据进行结构方程模型的分析后得到如下结果:决策者的认知复杂性和认知需要与他们对企业内外环境的周密分析具有显著的正向关系,而且通过后者影响到对于环境中蕴含的机会的判断,并最终影响是否进入某项业务的决策。 展开更多
关键词 认知需要 认知复杂性 决策过程 战略选择 情境实验
下载PDF
风险决策过程验证:补偿/非补偿模型之争的新认识与新证据 被引量:14
11
作者 张阳阳 饶俪琳 +2 位作者 梁竹苑 周媛 李纾 《心理科学进展》 CSSCI CSCD 北大核心 2014年第2期205-219,共15页
风险决策是人类赖以生存和发展的重大决策。如何进行风险决策是人类不断认识和改造世界过程中遇到的未解之谜。主流风险理论认为,风险决策是一个补偿性的、期望值最大化的过程;而非主流的风险理论则认为,风险决策是非补偿性的,并不遵循... 风险决策是人类赖以生存和发展的重大决策。如何进行风险决策是人类不断认识和改造世界过程中遇到的未解之谜。主流风险理论认为,风险决策是一个补偿性的、期望值最大化的过程;而非主流的风险理论则认为,风险决策是非补偿性的,并不遵循期望法则所假设的加权求和等过程。这一谜团为何一直没有得以破解,或许是因为我们未找到揭示其心理过程的令人信服的证据。近10年来,我们针对风险决策过程,借助行为实验、眼动记录法、事件相关电位、功能磁共振成像等技术,系统探索风险决策的心理和神经机制,为回答"风险决策是否遵循补偿性规则"这一问题提供了汇聚性证据。本文依据期望法则所假设的概率函数推导、加权过程、加权求和过程、总分最大化等步骤,对这些研究进行梳理与回顾,以期加深人们对风险决策机制的理解,并为建立、健全与风险决策相关的政策、法律法规提供理论依据。 展开更多
关键词 风险决策 决策过程 补偿性规则 非补偿性规则 眼动 ERP FMRI
下载PDF
重复信任博弈的决策过程与结果评价 被引量:10
12
作者 王益文 张振 +3 位作者 原胜 郭丰波 何少颖 敬一鸣 《心理学报》 CSSCI CSCD 北大核心 2015年第8期1028-1038,共11页
"信任他人或者不信任他人?"是社会互动中经常面临一种行为决择,直接影响着个体的社会生活。作为一种重要的社会信号机制,信任是建立良好社会关系的基石,它能够降低社会交易成本,易化合作行为。为了探究个体在信任互动情境下大脑活动... "信任他人或者不信任他人?"是社会互动中经常面临一种行为决择,直接影响着个体的社会生活。作为一种重要的社会信号机制,信任是建立良好社会关系的基石,它能够降低社会交易成本,易化合作行为。为了探究个体在信任互动情境下大脑活动变化的时间动态特征,采用事件相关电位技术记录了20名健康被试(充当信任者)完成重复性信任博弈任务(repeated Trust Game,r TG)时的脑电成分。行为结果发现个体选择信任的比例显著高于几率水平。电生理学结果表明,决策阶段中不信任选择比信任选择诱发了更正的P2成分(150~250 ms),差异波溯源分析定位于额中回(middle frontal gyrus,BA 46)和额下回(inferior frontal gyrus,BA 46)。反馈阶段中损失反馈比获益反馈诱发了更负的FRN成分(200~300 ms),而获益反馈比损失反馈诱发了更短的P300潜伏期。本研究为理解人类信任博弈过程的动态加工时程提供了初步的神经电生理学证据。 展开更多
关键词 信任博弈 决策过程 结果评价 P2 FRN P300
下载PDF
关于R&D联合开发决策过程中的博弈分析 被引量:19
13
作者 张毅 张子刚 黄胜杰 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2003年第7期106-108,共3页
根据博弈理论和决策理论 ,分别在有限次重复博弈和无限次重复博弈条件下定量分析了R&D联合开发活动中各行为主体的决策过程 ,其结果与许多文献提出的定性结论相一致 .由于在实践中 ,R&D联合开发活动重复博弈的可能性及其次数都... 根据博弈理论和决策理论 ,分别在有限次重复博弈和无限次重复博弈条件下定量分析了R&D联合开发活动中各行为主体的决策过程 ,其结果与许多文献提出的定性结论相一致 .由于在实践中 ,R&D联合开发活动重复博弈的可能性及其次数都是未知的 ,为此还研究了不确定条件下成功实现R&D联合开发的必要条件 ,结果显示只有当R&D联合开发活动重复博弈的概率超过某一特定值时 。 展开更多
关键词 R&D合作 博弈 决策过程 不确定条件
下载PDF
群体决策过程组织研究述评 被引量:62
14
作者 李武 席酉民 成思危 《管理科学学报》 CSSCI 2002年第2期55-66,共12页
群体决策研究作为决策理论研究的热点和前沿在国内外方兴未艾 ,尚未形成一个完整的理论体系 .作者结合近年来在群体决策 ,特别是在决策过程研究方面所做的一些工作 ,以决策过程研究为侧重点对群体决策理论研究进展进行了评述 ,并通过社... 群体决策研究作为决策理论研究的热点和前沿在国内外方兴未艾 ,尚未形成一个完整的理论体系 .作者结合近年来在群体决策 ,特别是在决策过程研究方面所做的一些工作 ,以决策过程研究为侧重点对群体决策理论研究进展进行了评述 ,并通过社会选择理论和集体决策理论的比较 ,对群体决策的研究框架作了一些尝试性的探讨 . 展开更多
关键词 群体决策 集体决策 社会选择 决策过程
下载PDF
基于马尔科夫决策过程的应急资源调度方案的动态优化 被引量:22
15
作者 王炜 刘茂 王丽 《南开大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第3期18-23,共6页
利用马尔科夫决策方法,对突发公共事件下的应急资源调度方案的动态优化过程进行研究,以期找到特定场景下最优应急资源调度方案,保证应急救援行动的时效性.通过实例分析表明,基于马尔科夫决策过程的应急资源调度方案动态优化方法可实现... 利用马尔科夫决策方法,对突发公共事件下的应急资源调度方案的动态优化过程进行研究,以期找到特定场景下最优应急资源调度方案,保证应急救援行动的时效性.通过实例分析表明,基于马尔科夫决策过程的应急资源调度方案动态优化方法可实现应急资源调度方案的动态优化,未来通过采用本方法,可以为突发公共事件下的应急资源动态调度提供依据. 展开更多
关键词 马尔科夫决策过程 应急资源 调度 动态优化
下载PDF
基于风险偏好差异性假设的动态决策过程研究 被引量:8
16
作者 刘健 陈剑 +2 位作者 廖文和 马义中 刘思峰 《管理科学学报》 CSSCI 北大核心 2016年第4期1-15,共15页
针对风险偏好差异性决策者共存时的决策过程进行研究,提出边求解边对决策者分类决策再进行信息融合的动态决策策略.从客观数据角度基于属性值相似关系提取有效属性并对有效属性进行赋权;根据决策者对决策活动的选择判断逐步嵌入风险偏好... 针对风险偏好差异性决策者共存时的决策过程进行研究,提出边求解边对决策者分类决策再进行信息融合的动态决策策略.从客观数据角度基于属性值相似关系提取有效属性并对有效属性进行赋权;根据决策者对决策活动的选择判断逐步嵌入风险偏好(风险偏好型、风险中立型、风险规避型);基于属性值之间的可能度与相似度,构建相应类型的风险偏好预期理论模型;在决策信息集结与决策对象排序过程中,根据决策者的风险偏好特征选择相适应的算法模型;针对风险偏好差异性决策者共存的情形,基于决策结果公平效用最大化的角度提出新的信息融合模型构建算法;通过实际案例进行分析并验证这一新方法的科学合理性. 展开更多
关键词 差异性 风险偏好 动态策略 公平效用 决策过程
下载PDF
基于马氏决策过程模型的动态系统学习控制:研究前沿与展望 被引量:21
17
作者 徐昕 沈栋 +1 位作者 高岩青 王凯 《自动化学报》 EI CSCD 北大核心 2012年第5期673-687,共15页
基于马氏决策过程(Markov decision process,MDP)的动态系统学习控制是近年来一个涉及机器学习、控制理论和运筹学等多个学科的交叉研究方向,其主要目标是实现系统在模型复杂或者不确定等条件下基于数据驱动的多阶段优化控制.本文对基于... 基于马氏决策过程(Markov decision process,MDP)的动态系统学习控制是近年来一个涉及机器学习、控制理论和运筹学等多个学科的交叉研究方向,其主要目标是实现系统在模型复杂或者不确定等条件下基于数据驱动的多阶段优化控制.本文对基于MDP的动态系统学习控制理论、算法与应用的发展前沿进行综述,重点讨论增强学习(Reinforcement learning,RL)与近似动态规划(Approximate dynamic programming,ADP)理论与方法的研究进展,其中包括时域差值学习理论、求解连续状态与行为空间MDP的值函数逼近方法、直接策略搜索与近似策略迭代、自适应评价设计算法等,最后对相关研究领域的应用及发展趋势进行分析和探讨。 展开更多
关键词 学习控制 MARKOV决策过程 增强学习 近似动态规划 机器学习 自适应控制
下载PDF
马尔可夫决策过程在目标分配中的应用 被引量:12
18
作者 韩松臣 秦俊奇 +1 位作者 韩品尧 邵成勋 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 1996年第2期32-36,共5页
武器系统目标分配是作战指挥中的一个重要问题。本文将马尔可夫决策过程理论应用于目标分配决策中。这种方法充分考虑了攻防对抗这个动态系统本身的特征,使决策的长期效益趋于最优.
关键词 武器系统 目标分配 马氏决策过程 军事 防空作战
下载PDF
马尔可夫决策过程下的智能电网实时电价模型 被引量:10
19
作者 李江波 王波 +1 位作者 高岩 张惠珍 《系统仿真学报》 CAS CSCD 北大核心 2016年第11期2756-2763,共8页
实时电价策略是节约用电、提高用户用电效用值的有效手段。提出基于马尔可夫决策过程的一个实时电价优化模型。该模型应用有限阶段方法,以供应侧和需求侧的期望效用最大化为目标,依据递减风险理论,采用对数形式对现有效用函数进行改进,... 实时电价策略是节约用电、提高用户用电效用值的有效手段。提出基于马尔可夫决策过程的一个实时电价优化模型。该模型应用有限阶段方法,以供应侧和需求侧的期望效用最大化为目标,依据递减风险理论,采用对数形式对现有效用函数进行改进,从而更加准确地刻画用户用电效用。通过粒子群算法对模型求解,并与固定电价情况进行结果比较。数值模拟结果表明该模型在控制用电量和提高用电效用方面具有良好的效果,同时所得到的实时电价处于固定电价最大和最小值之间,上下波动性小。 展开更多
关键词 智能电网 实时电价 马尔可夫决策过程 递减风险
下载PDF
新兴产业政策决策过程中的不确定性管理研究——基于物联网产业的宏观政策决策过程的案例 被引量:9
20
作者 田志龙 史俊 +2 位作者 田博文 陈小洪 马骏 《管理学报》 CSSCI 北大核心 2015年第2期187-197,共11页
采用纵贯研究、内容分析、深度访谈相结合的定性研究方法,以推动我国物联网产业发展的3个宏观政策决策过程为研究对象,旨在讨论政企互动是如何帮助政府进行不确定性管理的。研究结论表明:新兴产业的宏观政策决策是由数个存在递进关系的... 采用纵贯研究、内容分析、深度访谈相结合的定性研究方法,以推动我国物联网产业发展的3个宏观政策决策过程为研究对象,旨在讨论政企互动是如何帮助政府进行不确定性管理的。研究结论表明:新兴产业的宏观政策决策是由数个存在递进关系的渐进式阶段组成,而每个渐进式事项的解决依赖于众多在政企互动中形成的微观政策工具的实施。政企互动帮助政策决策者通过4种机制(信息获取、行动协调、企业行动承诺和政府政策承诺)实现了对因信息缺乏以及对产业行动者资源依赖所造成的不确定性的管理。 展开更多
关键词 政策决策过程 新兴产业 不确定性管理 政企互动 物联网产业
下载PDF
上一页 1 2 177 下一页 到第
使用帮助 返回顶部