期刊文献+
共找到22篇文章
< 1 2 >
每页显示 20 50 100
基于有限样本的最优费用关联值递归Q学习算法 被引量:4
1
作者 殷苌茗 陈焕文 谢丽娟 《计算机工程与应用》 CSCD 北大核心 2002年第11期65-67,共3页
一个激励学习Agent通过学习一个从状态到动作映射的最优策略来求解决策问题。求解最优决策一般有两种途径,一种是求最大奖赏方法,另一种是求最优费用方法。该文利用求解最优费用函数的方法给出了一种新的Q学习算法。Q学习算法是求解信... 一个激励学习Agent通过学习一个从状态到动作映射的最优策略来求解决策问题。求解最优决策一般有两种途径,一种是求最大奖赏方法,另一种是求最优费用方法。该文利用求解最优费用函数的方法给出了一种新的Q学习算法。Q学习算法是求解信息不完全Markov决策问题的一种有效激励学习方法。文章从求解最优费用函数的方法出发,给出了Q学习的关联值递归算法,这种方法的建立,可以使得动态规划(DP)算法中的许多结论直接应用到Q学习的研究中来。 展开更多
关键词 有限样本 最优费用 关联值递归 Q学习算法 人工智能
下载PDF
LNG接收站典型竖向优化设计分析
2
作者 张亚涛 刘中庆 刘月钊 《石油石化物资采购》 2024年第15期16-18,共3页
LNG接收站建设投资巨大,工艺流程复杂,为积极响应国家号召,降低项目的建设成本,提升项目效益,宜根据项目本身的特性,从合适的角度出发,节约投资。本文主要从某LNG接收站土石方重新利用的角度,计算、分析、核实接收站最合适的标高,既能... LNG接收站建设投资巨大,工艺流程复杂,为积极响应国家号召,降低项目的建设成本,提升项目效益,宜根据项目本身的特性,从合适的角度出发,节约投资。本文主要从某LNG接收站土石方重新利用的角度,计算、分析、核实接收站最合适的标高,既能满足工艺、海水取排水的需求,又能达到最佳经济效益。 展开更多
关键词 碎石利用 土石方自平衡 费用现值最优
下载PDF
基于每阶段平均费用最优的激励学习算法 被引量:3
3
作者 殷苌茗 陈焕文 谢丽娟 《计算机应用》 CSCD 北大核心 2002年第4期25-27,共3页
文中利用求解最优费用函数的方法给出了一种新的激励学习算法 ,即基于每阶段平均费用最优的激励学习算法。这种学习算法是求解信息不完全Markov决策问题的一种有效激励学习方法 ,它从求解分阶段最优平均费用函数的方法出发 ,分析了最优... 文中利用求解最优费用函数的方法给出了一种新的激励学习算法 ,即基于每阶段平均费用最优的激励学习算法。这种学习算法是求解信息不完全Markov决策问题的一种有效激励学习方法 ,它从求解分阶段最优平均费用函数的方法出发 ,分析了最优解的存在性、分阶段最优平均费用函数与初始状态的关系以及与之相关的Bellman方程。这种方法的建立 ,可以使得动态规划 (DP) 展开更多
关键词 Q学习 最优平均费用函数 Bellman方程 智能体 激励学习算法 人工智能
下载PDF
一种动态的时延约束费用优化多播路由算法 被引量:2
4
作者 杨春德 邓超 《重庆邮电大学学报(自然科学版)》 北大核心 2011年第1期96-100,共5页
对动态环境下满足时延约束且费用最优的多播路由算法进行了研究。改进了一种触发重组算法,该算法根据一个区域内的节点加入或退出次数来确定对多播树的损害程度,若达到所给定平衡因子的值则触发重组。仿真表明,该算法具有较好的性能,能... 对动态环境下满足时延约束且费用最优的多播路由算法进行了研究。改进了一种触发重组算法,该算法根据一个区域内的节点加入或退出次数来确定对多播树的损害程度,若达到所给定平衡因子的值则触发重组。仿真表明,该算法具有较好的性能,能满足某些特殊的场合的要求。 展开更多
关键词 动态 时延约束 费用最优 触发重组算法
下载PDF
一种基于费用最优的可靠度分配及优化方法 被引量:2
5
作者 高俊东 《鱼雷技术》 2015年第6期405-409,共5页
针对某型水下电视监视设备改型设计提出的要求,利用专家分配法对该设备进行了可靠度分配,提出了费用最小的最优化分配方法,对设备各分系统的可靠度进行再排序和再分配,并结合费用函数的约束,得到了费用最优化条件下的分系统可靠度,通过... 针对某型水下电视监视设备改型设计提出的要求,利用专家分配法对该设备进行了可靠度分配,提出了费用最小的最优化分配方法,对设备各分系统的可靠度进行再排序和再分配,并结合费用函数的约束,得到了费用最优化条件下的分系统可靠度,通过仿真分析验证了费用最优。此方法简单易行,便于实际运用,对水下产品改型设计中的可靠度分配工作具有借鉴作用。 展开更多
关键词 水下产品改型设计 可靠度分配 费用最优
下载PDF
网络新产品最优广告费用的制定
6
作者 赵璐 聂规划 《统计与决策》 CSSCI 北大核心 2008年第2期137-139,共3页
网络营销虽然成本低、范围广,但是其潜在消费者的购买行为存在风险。如果网络营销与有针对性地寄送广告和试用品这种传统形式相结合,产品的可信度会大大提升,特别是针对刚上市的新产品。但是,无计划的配送会提高成本,营销效果却不明显... 网络营销虽然成本低、范围广,但是其潜在消费者的购买行为存在风险。如果网络营销与有针对性地寄送广告和试用品这种传统形式相结合,产品的可信度会大大提升,特别是针对刚上市的新产品。但是,无计划的配送会提高成本,营销效果却不明显。文章就此问题建模,分析产品的进出差价怎样决定最优的广告费用和潜在购买量,并根据产品差异进行修正,为商家的生产和营销决策提供依据。 展开更多
关键词 网络营销 潜在消费者 最优广告费用 产品差异
下载PDF
物流设施设备维护修理费用最优化研究
7
作者 张凯 席一凡 《物流技术》 2010年第3期198-200,共3页
通过对设备更新问题的进一步研究,针对物流设施设备维护修理费用较高的问题,提出了一种最优化费用模型并运用于实例,获得了设备在使用期内维护修理的最优策略。
关键词 设备更新 设备维护修理 费用最优
下载PDF
浅谈Dijkstra算法在城市交通最优路径中的应用 被引量:2
8
作者 潘燕燕 陈自力 《电脑知识与技术》 2006年第10期101-101,169,共2页
应用Dijkstra算法解决城市中出行交通道路选择的问题,对最优时间和最优费用分别进行讨论.并且综合时间和费用提供多条路径供人们选择。用C++实现算法。
关键词 DIJKSTRA算法 交通路径 最优时间 最优费用
下载PDF
抗滑桩截面经济优化设计探讨 被引量:10
9
作者 胡新丽 李长冬 王亮清 《地质科技情报》 CAS CSCD 北大核心 2007年第3期71-74,共4页
以三峡库区兴山县二里半滑坡为例,分析了抗滑桩截面尺寸与抗滑桩各内力之间的关系,论述了截面尺寸与混凝土及锁口护壁费用、钢筋费用及单抗滑桩工程总费用之间的相互关系,提出了最优截面尺寸的概念。在此基础上考虑抗滑桩的结构要求,提... 以三峡库区兴山县二里半滑坡为例,分析了抗滑桩截面尺寸与抗滑桩各内力之间的关系,论述了截面尺寸与混凝土及锁口护壁费用、钢筋费用及单抗滑桩工程总费用之间的相互关系,提出了最优截面尺寸的概念。在此基础上考虑抗滑桩的结构要求,提出了确定合理的截面尺寸的方法:若最优截面宽度满足构造要求,则选取该截面作为设计截面;否则选取构造宽度下使工程造价最小的高度作为设计截面高度。 展开更多
关键词 抗滑桩内力 单抗滑桩工程总费用 最优截面尺寸 经济化设计
下载PDF
部件串联的Geo/G/1可修排队系统的费用分析
10
作者 石天林 岳德权 《燕山大学学报》 CAS 2008年第2期169-172,共4页
研究多部件串联的离散时间Geometric/G/1可修排队系统的费用优化策略。假定顾客的到达时间和服务时间均服从几何分布。建立了以服务率为控制变量的系统的费用参数模型并推出了最优平均服务时间的明显表达式。通过数值计算实例分析了系... 研究多部件串联的离散时间Geometric/G/1可修排队系统的费用优化策略。假定顾客的到达时间和服务时间均服从几何分布。建立了以服务率为控制变量的系统的费用参数模型并推出了最优平均服务时间的明显表达式。通过数值计算实例分析了系统的参数对系统的最优平均服务时间和最优费用的影响。 展开更多
关键词 可修排队 部件串联 几何分布 服务时间 最优费用
下载PDF
部件串联的Geometric/G/1可修排队系统费用模型
11
作者 石天林 《邢台学院学报》 2008年第4期98-99,103,共3页
研究一个部件串联的离散时间Geometric/G/1可修排队系统的费用优化策略。考虑服务台的服务率是可控制的,顾客的到达时间和服务时间均服从几何分布,给出系统的费用参数模型,并结合数值计算实例分析了系统的各参数对系统的最优平均服务时... 研究一个部件串联的离散时间Geometric/G/1可修排队系统的费用优化策略。考虑服务台的服务率是可控制的,顾客的到达时间和服务时间均服从几何分布,给出系统的费用参数模型,并结合数值计算实例分析了系统的各参数对系统的最优平均服务时间和最优费用的影响。 展开更多
关键词 几何分布 平均等待队长 服务时间 最优费用
下载PDF
基于服务水平的铁路货运价格优化研究
12
作者 刘畅 左忠义 +1 位作者 尹盼盼 王菁 《中国安全科学学报》 CAS CSCD 北大核心 2018年第S2期133-137,共5页
铁路运输是影响国计民生的主要行业之一,为在保证顾客服务水平的前提下,确定铁路货运最优价格,首先,根据生活实际,做出合理简化的假设,对费用和可靠性给以定量描述;然后,以总费用为目标函数,以容量为决策变量,以预先设定的可靠性作为约... 铁路运输是影响国计民生的主要行业之一,为在保证顾客服务水平的前提下,确定铁路货运最优价格,首先,根据生活实际,做出合理简化的假设,对费用和可靠性给以定量描述;然后,以总费用为目标函数,以容量为决策变量,以预先设定的可靠性作为约束条件,建立优化模型,并求得最优解;最后,标定参数进行算例分析,并探讨参数对最优容量和最优价格的影响。结果表明:该模型可以清晰地反映随着各参数变动最优解的变化趋势,能较好地体现垄断性行业的行业特性,并得出简洁的、基本合理的结果。 展开更多
关键词 垄断性 化模型 最优价格 最优容量 最优边际费用
下载PDF
鞋子零售商的最优订货策略数学建模研究
13
作者 同洁东 《科技创业月刊》 2016年第6期59-60,共2页
为了实现鞋子零售商在货物存储和订购上费用的最小化问题,文章结合鞋子零售商的具体订货和销售情况,运用数学思维建立了单个订货周期中每双鞋子关于鞋子进货量的总费用模型,并采用不等式法,求得了鞋子零售商最佳的订货周期和订货量,从... 为了实现鞋子零售商在货物存储和订购上费用的最小化问题,文章结合鞋子零售商的具体订货和销售情况,运用数学思维建立了单个订货周期中每双鞋子关于鞋子进货量的总费用模型,并采用不等式法,求得了鞋子零售商最佳的订货周期和订货量,从而为其提供了最优的订货策略。 展开更多
关键词 鞋子零售商:费用最小化:最优订货策略
下载PDF
样本有限关联值递归Q学习算法及其收敛性证明 被引量:4
14
作者 殷苌茗 陈焕文 谢丽娟 《计算机研究与发展》 EI CSCD 北大核心 2002年第9期1064-1070,共7页
一个激励学习 Agent通过学习一个从状态到动作映射的最优策略来解决策问题 .求解最优决策一般有两种途径 :一种是求最大奖赏方法 ,另一种是求最优费用方法 .利用求解最优费用函数的方法给出了一种新的 Q学习算法 .Q学习算法是求解信息... 一个激励学习 Agent通过学习一个从状态到动作映射的最优策略来解决策问题 .求解最优决策一般有两种途径 :一种是求最大奖赏方法 ,另一种是求最优费用方法 .利用求解最优费用函数的方法给出了一种新的 Q学习算法 .Q学习算法是求解信息不完全 Markov决策问题的一种有效激励学习方法 .Watkins提出了 Q学习的基本算法 ,尽管他证明了在满足一定条件下 Q值学习的迭代公式的收敛性 ,但是在他给出的算法中 ,没有考虑到在迭代过程中初始状态与初始动作的选取对后继学习的影响 .因此提出的关联值递归 Q学习算法改进了原来的 Q学习算法 ,并且这种算法有比较好的收敛性质 .从求解最优费用函数的方法出发 ,给出了 Q学习的关联值递归算法 ,这种方法的建立可以使得动态规划 (DP)算法中的许多结论直接应用到 Q学习的研究中来 . 展开更多
关键词 关联值递归 Q学习算法 收敛性证明 激励学习 最优费用函数 MARKOV决策过程 人工智能
下载PDF
指数型分布族中矩估计的序贯置信区间 被引量:1
15
作者 钱能生 陈思宝 《五邑大学学报(自然科学版)》 CAS 2005年第2期1-6,共6页
在矩估计的基础上,对于给定精度(2d)及置信系数(α),建立了对参数(θ)函数g(θ)的一个序贯置信区间估计的步骤和方法.并讨论了在一定条件下,当d→0时,估计的渐近相合性、渐近有效性及有界的最优费用差(EN(d)?n(d))等渐近性质.
关键词 序贯置信区间 渐近相合性 渐近有效性 最优费用 矩估计
下载PDF
带有线性趋势的单物品库存补充模型比较 被引量:3
16
作者 赵菊 周永务 《合肥工业大学学报(自然科学版)》 CAS CSCD 2004年第12期1579-1584,共6页
文章指出 Teng对常见 4种带确定性线性需求的单物品库存补充模型比较的错误之处 ,并针对其计算的复杂性给出了一种较简单直观的迭代法 ,使得在给定订货次数 m +1和 m下只需比较它们的总费用函数中的 2个量——库存短缺费差和订货费的大... 文章指出 Teng对常见 4种带确定性线性需求的单物品库存补充模型比较的错误之处 ,并针对其计算的复杂性给出了一种较简单直观的迭代法 ,使得在给定订货次数 m +1和 m下只需比较它们的总费用函数中的 2个量——库存短缺费差和订货费的大小即可知下一步的搜索方向 ,并推导出一个较好的搜索库存补充次数 m的初始值 m0 ,使计算量大大减小。且这种方法可直接用于非线性增长需求模型 ,建立同样的 4种模型 ,比较得出和线性增长需求情况下一样的结论 ,即第 4种模型费用最小。 展开更多
关键词 线性增长需求 非线性增长需求 迭代法 库存模型 最优费用
下载PDF
基于混合粒子群算法的项目群工期压缩模型研究 被引量:2
17
作者 丰景春 赵文静 +1 位作者 丰慧 王龙宝 《科技管理研究》 CSSCI 北大核心 2020年第10期228-237,共10页
为完善项目群工期-费用优化模型和提高模型求解的精确性及有效性,研究并构建基于混合粒子群算法的集时间、资源和费用的工期压缩模型。首先,根据承包商一致性将工程项目群分成若干个子网络,通过对基于子网络的项目群工期压缩机理分析,... 为完善项目群工期-费用优化模型和提高模型求解的精确性及有效性,研究并构建基于混合粒子群算法的集时间、资源和费用的工期压缩模型。首先,根据承包商一致性将工程项目群分成若干个子网络,通过对基于子网络的项目群工期压缩机理分析,剖析资源约束下工期压缩对业主支付费用的影响。其次,以业主支付费用最低为目标,构建单一资源约束下工程项目群工期压缩模型,并进行模型求解的算法设计。最后,结合南水北调江苏段东线一期工程,对其工期进行压缩,通过模型的应用和求解,得到业主支付费用最低的项目群资源调配方案和工期调整方案。研究结果显示:将资源要素考虑在内的工期-费用优化模型更加全面、详细分析工期压缩给项目群、承包商和业主带来的影响,以及人工智能算法在该目标规划模型求解中的有效应用,为项目群工期压缩问题解决提供思路和方法参考。 展开更多
关键词 项目群 工期压缩 资源约束 费用最优 混合粒子群算法
下载PDF
3G套餐资费评价与建议 被引量:4
18
作者 范睿 《邮电设计技术》 2010年第10期71-75,共5页
对中国移动、中国电信和中国联通的3G套餐资费从套餐优惠率和3家运营商的综合比较2方面进行了计算分析,对各运营商的套餐设计和用户的套餐选择给出了若干建议。
关键词 3G套餐 惠率 最优费用
下载PDF
两部件两修理工冷贮备系统维修更换策略 被引量:1
19
作者 王艳禹 岳德权 +2 位作者 于静 殷晓青 郭社平 《辽宁工程技术大学学报(自然科学版)》 CAS 北大核心 2014年第4期539-543,共5页
为研究两个不同部件和两个修理工组成的可修冷贮备系统的维修更换策略,在故障部件都不能修复如新的条件下,利用几何过程和更新报酬定理,以系统中部件1的故障次数N为更换策略,得到系统长期运行单位时间平均费用的表达式.研究结果:通过数... 为研究两个不同部件和两个修理工组成的可修冷贮备系统的维修更换策略,在故障部件都不能修复如新的条件下,利用几何过程和更新报酬定理,以系统中部件1的故障次数N为更换策略,得到系统长期运行单位时间平均费用的表达式.研究结果:通过数值算例求出其最优更换策略;在最优更换策略下比较两个修理工模型与一个修理工模型长期运行单位时间最优平均费用,得到一些数值结果. 展开更多
关键词 冷贮备系统 几何过程 更新报酬定理 更换策略 最优平均费用 修理工 修复如新 数值结果
下载PDF
基于改进遗传算法的国内旅行交通规划研究 被引量:1
20
作者 于雁 李小光 《计算机与数字工程》 2022年第2期284-288,共5页
人们长时间、多地点的外出旅游,需要进行合理的旅行交通规划来获得最优路径和节约成本。以在国内31个省会城市旅行为研究对象,通过查阅运输系统价格表获得各城市之间交通运输所需费用,并利用遗传算法以旅行所需总费用最少为优化目标,进... 人们长时间、多地点的外出旅游,需要进行合理的旅行交通规划来获得最优路径和节约成本。以在国内31个省会城市旅行为研究对象,通过查阅运输系统价格表获得各城市之间交通运输所需费用,并利用遗传算法以旅行所需总费用最少为优化目标,进行巡回路径的优化。传统遗传算法容易出现早熟现象,故对个体编码后赋予年龄操作,进行多次仿真计算和实验求解,最终得到了有无年龄操作后的优化路线及所需费用。仿真结果表明,与无年龄操作遗传算法进行对比,加入年龄操作后的改进遗传算法,能够求得更合理的全国旅行路线和总费用,方便人们外出旅行。 展开更多
关键词 旅游交通规划 遗传算法 年龄操作 最优费用
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部