期刊文献+
共找到68篇文章
< 1 2 4 >
每页显示 20 50 100
(∈,∈∨q_((λ,μ)))-模糊正规子群的若干性质 被引量:4
1
作者 郝翠芸 廖祖华 《数学杂志》 CSCD 北大核心 2013年第5期857-864,共8页
本文研究了(∈,∈∨q(λ,μ))-模糊正规子群的一些新的性质.利用反扩张原理获得了它的满同态像与同态原像的相关结果,丰富了文献[1]中有关(∈,∈∨q(λ,μ))-模糊正规子群的研究结果.
关键词 (∈ ∈∨q(λ μ))-模糊正规子群 (∈ ∈∨q(λ μ))-模糊子群 反扩张原理 满同态像 同态原像
下载PDF
一种基于线性函数逼近的离策略Q(λ)算法 被引量:25
2
作者 傅启明 刘全 +3 位作者 王辉 肖飞 于俊 李娇 《计算机学报》 EI CSCD 北大核心 2014年第3期677-686,共10页
将函数逼近用于强化学习是目前机器学习领域的一个新的研究热点.针对传统的基于查询表及函数逼近的Q(λ)学习算法在大规模状态空间中收敛速度慢或者无法收敛的问题,提出一种基于线性函数逼近的离策略Q(λ)算法.该算法通过引入重要性关... 将函数逼近用于强化学习是目前机器学习领域的一个新的研究热点.针对传统的基于查询表及函数逼近的Q(λ)学习算法在大规模状态空间中收敛速度慢或者无法收敛的问题,提出一种基于线性函数逼近的离策略Q(λ)算法.该算法通过引入重要性关联因子,在迭代次数逐步增长的过程中,使得在策略与离策略相统一,确保算法的收敛性.同时在保证在策略与离策略的样本数据一致性的前提下,对算法的收敛性给予理论证明.将文中提出的算法用于Baird反例、Mountain-Car及Random Walk仿真平台,实验结果表明,该算法与传统的基于函数逼近的离策略算法相比,具有较好的收敛性;与传统的基于查询表的算法相比,具有更快的收敛速度,且对于状态空间的增长具有较强的鲁棒性. 展开更多
关键词 强化学习 函数逼近 离策略 q(A)算法 机器学习中图法
下载PDF
基于多步回溯Q学习的自动发电控制指令动态优化分配算法 被引量:13
3
作者 余涛 王宇名 +2 位作者 甄卫国 叶文加 刘前进 《控制理论与应用》 EI CAS CSCD 北大核心 2011年第1期58-64,共7页
单步Q学习在火电占优、机组时延较大的自动发电控制(AGC)功率指令动态优化分配中的应用表现出收敛速度慢等不足而影响最优策略的获取.具有多步预见能力的多步回溯Q学习(Q(λ))显式利用资格迹进行高效回溯操作,能够有效解决火电机组大时... 单步Q学习在火电占优、机组时延较大的自动发电控制(AGC)功率指令动态优化分配中的应用表现出收敛速度慢等不足而影响最优策略的获取.具有多步预见能力的多步回溯Q学习(Q(λ))显式利用资格迹进行高效回溯操作,能够有效解决火电机组大时滞环节带来的延时回报问题,算法平均收敛时间较Q学习缩短50%以上.算法奖励函数引入调节费用一项,形成多目标动态最优控制.两区域模型及南方电网模型仿真研究分析显示,Q(λ)算法在随机、大负荷扰动的复杂系统环境中有效提高系统控制性能标准(CPS)控制品质和适应性,并且在保证CPS合格率的前提下,使AGC调节费用下降超过5%. 展开更多
关键词 q(λ)学习 自动发电控制 控制性能标准 随机最优 调节费用
下载PDF
基于分布式多步回溯Q(λ)学习的复杂电网最优潮流算法 被引量:11
4
作者 余涛 刘靖 胡细兵 《电工技术学报》 EI CSCD 北大核心 2012年第4期185-192,共8页
针对传统最优潮流算法对复杂多目标函数的不适应性以及常规算法难以满足大规模电网计算实时性的要求,本文中提出一种新颖的基于复杂电网分区的最优潮流分布式Q(λ)学习算法,该算法无须对最优潮流数学模型进行辅助处理,不依赖于对象模型... 针对传统最优潮流算法对复杂多目标函数的不适应性以及常规算法难以满足大规模电网计算实时性的要求,本文中提出一种新颖的基于复杂电网分区的最优潮流分布式Q(λ)学习算法,该算法无须对最优潮流数学模型进行辅助处理,不依赖于对象模型,其内部各Agent使用标准的多步Q(λ)算法独立承担各分区子系统的学习任务,通过统一协作从而形成整体意义上的最优,并在IEEE 118节点等标准算例中进行了验证,取得了良好的效果,为解决复杂电网多目标最优潮流问题提供了一种新的可行、有效的方法。 展开更多
关键词 最优潮流 q(λ)学习 多目标优化 分布式强化学习
下载PDF
基于多步回溯Q(λ)学习的互联电网随机最优CPS控制 被引量:13
5
作者 余涛 周斌 陈家荣 《电工技术学报》 EI CSCD 北大核心 2011年第6期179-186,共8页
针对非马尔可夫环境下火电占优的互联电网AGC控制策略,引入随机最优控制中Q(λ)学习的"后向估计"原理,可有效解决火电机组大时滞环节带来的延时回报问题。本文以CPS1/CPS2滚动平均值为状态输入,将CPS评价指标与松弛目标根据... 针对非马尔可夫环境下火电占优的互联电网AGC控制策略,引入随机最优控制中Q(λ)学习的"后向估计"原理,可有效解决火电机组大时滞环节带来的延时回报问题。本文以CPS1/CPS2滚动平均值为状态输入,将CPS评价指标与松弛目标根据线性加权原则转化为MDP奖励函数,从长期的角度提出一种在线反馈学习结构的随机最优CPS控制。统计性仿真试验表明,所提CPS控制具有较强的适应性和动态性能,在保证CPS合格率基础上能有效减少调度端的平均发令次数和反调次数。同时,该策略提供了一种可通过修正松弛因子在线调整AGC系统的"松弛度",可降低发电成本及机组磨损,从而实现CPS松弛控制。 展开更多
关键词 自动发电控制 控制性能标准 多步q(λ)学习 非马尔可夫环境 随机最优控制
下载PDF
半群的(∈,∈ ∨q(λ,μ))-模糊k-理想(英文) 被引量:14
6
作者 廖祖华 易丽华 胡淼菡 《数学杂志》 CSCD 北大核心 2012年第2期191-205,共15页
本文研究了半群中的广义模糊k-理想和(∈,∈∨q(λ,μ))-模糊k-理想.利用模糊集的截集及模糊集的性质,获得了(∈,∈∨q(λ,μ))-模糊k-理想的等价刻画,广义模糊特征化及广义模糊k-理想直积的基本性质.最后还给出了半群S是左k-诺特的充... 本文研究了半群中的广义模糊k-理想和(∈,∈∨q(λ,μ))-模糊k-理想.利用模糊集的截集及模糊集的性质,获得了(∈,∈∨q(λ,μ))-模糊k-理想的等价刻画,广义模糊特征化及广义模糊k-理想直积的基本性质.最后还给出了半群S是左k-诺特的充要条件是对于S的任意广义模糊左k-理想A,Im(A)是[λ,μ]上的良序子集.这些结果有重要的理论价值. 展开更多
关键词 广义模糊k-理想 (∈ ∈∨q μ))-模糊k-理想 广义模糊特征化 模糊直和 k-诺特
下载PDF
(∈,∈∨q_((λ,μ)))-模糊子半群和(∈,∈∨q_((λ,μ)))-模糊完全正则子半群 被引量:33
7
作者 廖祖华 陈敏 《江南大学学报(自然科学版)》 CAS 2009年第2期242-244,共3页
文中给出了(∈,∈∨q(λ,μ))-模糊子半群,(∈,∈∨q(λ,μ))-模糊完全正则子半群和广义模糊完全正则子半群的概念及它们之间的等价刻画。当λ=0,μ=0.5时,(∈,∈∨q(0,0.5))-模糊子半群和(∈,∈∨q(0,0.5))-模糊完全正则子半群即为(∈... 文中给出了(∈,∈∨q(λ,μ))-模糊子半群,(∈,∈∨q(λ,μ))-模糊完全正则子半群和广义模糊完全正则子半群的概念及它们之间的等价刻画。当λ=0,μ=0.5时,(∈,∈∨q(0,0.5))-模糊子半群和(∈,∈∨q(0,0.5))-模糊完全正则子半群即为(∈,∈∨q)-模糊子半群和(∈,∈∨q)-模糊完全正则子半群;当λ=0,μ=1时,(∈,∈∨q(0,1))-模糊子半群和(∈,∈∨q(0,1))-模糊完全正则子半群即为Rosenfe ld意义下的模糊子半群和模糊完全正则子半群,这将通常的模糊代数与(∈,∈∨q)-模糊代数进行了统一和推广。 展开更多
关键词 半群 (∈ ∈∨q μ))-模糊子半群 (∈ ∈∨q μ))-模糊完全正则子半群 广义模糊子半群 广义模糊完全正则子半群
下载PDF
基于多步回溯Q(λ)学习算法的多目标最优潮流计算 被引量:6
8
作者 余涛 胡细兵 刘靖 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2010年第10期139-145,共7页
为了克服传统的最优化算法面对复杂、非线性描述的多目标最优潮流时无法满足电力系统实时调度运行的这一缺点,提出了一种基于半马尔可夫决策过程的多步Q(λ)学习算法,该算法不依赖于对象模型,将最优潮流问题中的约束、动作和目标转换成... 为了克服传统的最优化算法面对复杂、非线性描述的多目标最优潮流时无法满足电力系统实时调度运行的这一缺点,提出了一种基于半马尔可夫决策过程的多步Q(λ)学习算法,该算法不依赖于对象模型,将最优潮流问题中的约束、动作和目标转换成算法中的状态、动作与奖励,通过不断的试错、回溯、迭代来动态寻找最优的动作.将该算法在多个IEEE标准算例中与其他算法进行比较,取得了良好的效果,验证了多步Q(λ)学习算法在处理多目标最优潮流问题时的可行性和有效性. 展开更多
关键词 电力系统 最优潮流 q(λ)学习算法 多目标优化 强化学习
下载PDF
格蕴涵代数的(∈,∈∨q_(λ,μ))-模糊滤子 被引量:7
9
作者 傅小波 战学秋 廖祖华 《计算机科学与探索》 CSCD 2014年第3期376-384,共9页
给出了点态化(∈,∈νq_(λ,μ))-模糊滤子和广义模糊滤子的概念,讨论了两者之间的等价关系;得到了(∈,∈νq_(λ,μ))-模糊滤子的若干等价刻画,并研究了其相关性质;讨论了(∈,∈νq_(λ,μ))-模糊滤子的同态像与同态原像的基本性质;最... 给出了点态化(∈,∈νq_(λ,μ))-模糊滤子和广义模糊滤子的概念,讨论了两者之间的等价关系;得到了(∈,∈νq_(λ,μ))-模糊滤子的若干等价刻画,并研究了其相关性质;讨论了(∈,∈νq_(λ,μ))-模糊滤子的同态像与同态原像的基本性质;最后研究了(∈,∈vq_(λ,μ))-模糊滤子的直积。 展开更多
关键词 格蕴涵代数 (∈ ∈∨q μ))-模糊滤子 广义模糊滤子 直积
下载PDF
一种多步Q强化学习方法 被引量:3
10
作者 陈圣磊 吴慧中 +1 位作者 韩祥兰 肖亮 《计算机科学》 CSCD 北大核心 2006年第3期147-150,共4页
Q 学习是一种重要的强化学习算法。本文针对 Q 学习和 Q(λ)算法的不足.提出了一种具有多步预见能力的Q学习方法:MQ 方法。首先给出了 MDP 模型.在分析 Q 学习和Q(λ)算法的基础上给出了 MQ 算法的推导过程,并分析了算法的更新策略和 k... Q 学习是一种重要的强化学习算法。本文针对 Q 学习和 Q(λ)算法的不足.提出了一种具有多步预见能力的Q学习方法:MQ 方法。首先给出了 MDP 模型.在分析 Q 学习和Q(λ)算法的基础上给出了 MQ 算法的推导过程,并分析了算法的更新策略和 k 值的确定原则。通过悬崖步行仿真试验验证了该算法的有效性。理论分析和数值试验均表明.该算法具有较强的预见能力.同时能降低计算复杂度,是一种有效平衡更新速度和复杂度的强化学习方法。 展开更多
关键词 强化学习 Mq算法 q学习 q(λ)算法
下载PDF
N(2,2,0)代数的(∈,∈∨q_((λ,μ))-模糊正关联理想 被引量:6
11
作者 张建忠 傅小波 廖祖华 《计算机科学与探索》 CSCD 2014年第5期622-629,共8页
对N(220)代数的正关联理想进行了详细的研究。提出了N(2,2,0)代数正关联理想的概念,讨论了正关联理想与理想、关联理想的关系;给出了N(2,2,0)代数广义(λ,μ)-模糊正关联理想和点态化模糊正关联理想的概念,讨论了两者之间的等价关系;给... 对N(220)代数的正关联理想进行了详细的研究。提出了N(2,2,0)代数正关联理想的概念,讨论了正关联理想与理想、关联理想的关系;给出了N(2,2,0)代数广义(λ,μ)-模糊正关联理想和点态化模糊正关联理想的概念,讨论了两者之间的等价关系;给出了(∈,∈∨q(λ,μ))-模糊正关联理想的一些等价刻画,并研究了其相关性质。 展开更多
关键词 N (2 2 0)代数 正关联理想 广义(λ μ)-模糊正关联理想 (? ?Vq μ))-模糊正关联理想
下载PDF
格蕴涵代数的(∈,∈∨q(λ,μ))-模糊素滤子 被引量:6
12
作者 傅小波 廖祖华 《计算机科学与探索》 CSCD 北大核心 2015年第2期227-233,共7页
将((∈,∈∨q_((λ,μ))))-模糊代数应用于格蕴涵代数,提出了点态化((∈,∈∨q_((λ,μ))))-模糊素滤子和(λμ)-模糊素滤子的概念,并从以下几个方面对((∈,∈∨q_((λ,μ))))-模糊素滤子进行了详细的研究:讨论了((∈,∈∨q_((λ,μ))))... 将((∈,∈∨q_((λ,μ))))-模糊代数应用于格蕴涵代数,提出了点态化((∈,∈∨q_((λ,μ))))-模糊素滤子和(λμ)-模糊素滤子的概念,并从以下几个方面对((∈,∈∨q_((λ,μ))))-模糊素滤子进行了详细的研究:讨论了((∈,∈∨q_((λ,μ))))-模糊素滤子和(λμ)-模糊素滤子的等价关系;研究了((∈,∈∨q_((λ,μ))))-模糊素滤子的相关性质;得到了特定条件下((∈,∈∨q_((λ,μ))))-模糊素滤子的若干等价刻画,建立了((∈,∈∨q_((λ,μ))))-模糊素滤子的扩张定理;探讨了((∈,∈∨q_((λ,μ))))-模糊素滤子的同态像与同态原像。 展开更多
关键词 格蕴涵代数 (∈ ∈∨q μ))-模糊素滤子 μ)-模糊素滤子 扩张定理
下载PDF
N(2,2,0)代数的(∈,∈∨q_(λ,μ))-模糊结合理想 被引量:3
13
作者 张建忠 傅小波 廖祖华 《计算机工程与应用》 CSCD 2014年第12期54-58,共5页
引入N(2,2,0)代数结合理想的概念。利用(∈,∈∨q(λ,μ))-模糊代数,给出了N(2,2,0)代数广义(λ,μ)-模糊结合理想和点态化模糊结合理想的概念,讨论了两者之间的等价关系;给出了(∈,∈∨q(λ,μ))-模糊结合理想的一些等价刻画,研究了其... 引入N(2,2,0)代数结合理想的概念。利用(∈,∈∨q(λ,μ))-模糊代数,给出了N(2,2,0)代数广义(λ,μ)-模糊结合理想和点态化模糊结合理想的概念,讨论了两者之间的等价关系;给出了(∈,∈∨q(λ,μ))-模糊结合理想的一些等价刻画,研究了其相关性质;讨论了(∈,∈∨q(λ,μ))-模糊结合理想的同态像与同态原像的关系;还研究了(∈,∈∨q(λ,μ))-模糊结合理想的直积。 展开更多
关键词 N (2 2 0)代数 广义(λ μ)-模糊结合理想 (∈ ∈∨q μ))-模糊结合理想 同态 直积
下载PDF
基于多步回溯Q(λ)的PSS最优控制方法的研究 被引量:4
14
作者 余涛 甄卫国 《电力系统保护与控制》 EI CSCD 北大核心 2011年第3期18-23,28,共7页
电力系统稳定器(PSS)是用来产生能抑制低频电力系统振荡的励磁系统辅助控制信号,具备自学习和参数在线整定能力是未来智能电网PSS控制器的一个发展趋势。提出一种基于多步回溯Q(λ)学习的新颖电力系统稳定器设计方法。利用多步回溯Q(λ... 电力系统稳定器(PSS)是用来产生能抑制低频电力系统振荡的励磁系统辅助控制信号,具备自学习和参数在线整定能力是未来智能电网PSS控制器的一个发展趋势。提出一种基于多步回溯Q(λ)学习的新颖电力系统稳定器设计方法。利用多步回溯Q(λ)控制器代替整个传统PSS作为励磁附加控制,并与传统PSS和Q学习控制器进行比较。仿真研究显示,引入基于多步回溯Q(λ)学习的PSS控制后显著增强了整个系统的鲁棒性,有效提高了系统抑制低频电力系统振荡的能力,较好地解决了Q学习控制器收敛速度慢的问题。 展开更多
关键词 电力系统稳定器(PSS) 马尔可夫策略(MDP) 强化学习 q学习 多步回溯q(λ)学习
下载PDF
半群的(∈,∈∨q_(λ,μ))-模糊n伪理想与Drazin半群的刻画 被引量:11
15
作者 易丽华 廖祖华 《模糊系统与数学》 CSCD 北大核心 2009年第5期48-55,共8页
给出半群的模糊n伪理想,广义模糊n伪理想,(∈,∈∨q(λ,μ))-模糊n伪理想的定义,同时讨论了(∈,∈∨q(λ,μ))-模糊n伪左理想(右理想,理想)和广义模糊n伪左理想(右理想,理想)的等价刻画。还利用半群的广义模糊子系统来刻画Drazin半群的... 给出半群的模糊n伪理想,广义模糊n伪理想,(∈,∈∨q(λ,μ))-模糊n伪理想的定义,同时讨论了(∈,∈∨q(λ,μ))-模糊n伪左理想(右理想,理想)和广义模糊n伪左理想(右理想,理想)的等价刻画。还利用半群的广义模糊子系统来刻画Drazin半群的结构。 展开更多
关键词 模糊n伪理想 模糊n伪内理想 (∈ ∈∨q μ))-模糊n伪左理想(右理想 理想) 广义模糊n伪左理想(右理想 理想)
下载PDF
一般投影线性群PGL(2,q)和4-(q+1,5,λ)设计 被引量:2
16
作者 刘伟俊 姚蹈 陈静 《数学理论与应用》 2010年第1期123-128,共6页
本文主要考虑了一般投影线性群PGL(2,q)区传递作用下的4-(q+1,5,λ)设计的存在性问题。经讨论知λ的可能值是4。
关键词 4-(q+1 5 λ)设计 区传递 PGL(2 q)
下载PDF
q临界值、ψ值和λ值的含义及其计算 被引量:4
17
作者 周诗国 胡良平 《中国卫生统计》 CSCD 北大核心 2012年第1期27-30,共4页
目的进一步阐明q临界值(用于Newman-Keuls检验)、ψ值和λ值(出现于某些场合下估计样本含量或检验效能的公式中)的含义,并找到计算它们的方法。方法从研究q统计量及其概率密度函数出发,阐明q临界值的含义及其计算方法;基于ψ值与方差分... 目的进一步阐明q临界值(用于Newman-Keuls检验)、ψ值和λ值(出现于某些场合下估计样本含量或检验效能的公式中)的含义,并找到计算它们的方法。方法从研究q统计量及其概率密度函数出发,阐明q临界值的含义及其计算方法;基于ψ值与方差分析及非中心F分布之间的联系,分析ψ值与非中心F分布的非中心参数之间的关系;基于λ值与χ2检验及非中心χ2分布之间的联系,分析λ值与非中心χ2分布的非中心参数之间的关系。结果明确了q临界值、ψ值和λ值的含义,找到了借助特定的SAS函数计算出它们的数值的方法。结论ψ=槡δ/v1,即ψ值是特定条件下非中心F分布的非中心参数值δ除以试验因素的自由度v1=k-1后开算术平方根的结果;λ值则是特定条件下非中心χ2分布的非中心参数值δ。q临界值、ψ值和λ值均可用特定的SAS函数计算出来。 展开更多
关键词 多重比较 Newman-Keuls检验 q临界值 Ψ值 λ值 非中心F分布 非中心χ2分布 非中心参数
下载PDF
基于最小二乘的Q(λ)强化学习算法
18
作者 陈圣磊 李卫红 姚娟 《计算机工程与应用》 CSCD 北大核心 2008年第34期47-50,共4页
通过分析经典的Q(λ)学习算法所存在的经验利用率低、收敛速度慢的问题,根据当前和多步的经验知识样本建立了状态-动作对值函数的最小二乘逼近模型,推导了该逼近函数在一组基底上的权向量所满足的一组线性方程,从而提出了快速而实用的... 通过分析经典的Q(λ)学习算法所存在的经验利用率低、收敛速度慢的问题,根据当前和多步的经验知识样本建立了状态-动作对值函数的最小二乘逼近模型,推导了该逼近函数在一组基底上的权向量所满足的一组线性方程,从而提出了快速而实用的最小二乘Q(λ)算法及改进的递推算法。倒立摆实验表明,该算法可以提高经验利用率,有效加快收敛速度。 展开更多
关键词 强化学习 q(λ)学习 函数逼近 最小二乘 倒立摆
下载PDF
具有变量核的积分算子在B^(q,λ)(R^n)空间的有界性
19
作者 陈晓莉 《江西师范大学学报(自然科学版)》 CAS 北大核心 2008年第3期322-325,共4页
主要讨论两类带变量核的积分算子的性质,证明了带变量核的分数次积分算子TΩ,μ是从Bp,λ1(Rn)到Bq,λ2(Rn)上的有界算子,其交换子TbΩ,μ是从Bp,λ1(Rn)到Bq,λ2(Rn)上的有界算子.对于变量核的奇异积分及其交换子,也有类似的结论.
关键词 变量核 分数次积分 B^q λ^(R^n)空间 奇异积分算子
下载PDF
管材拉拔变形的Q-λ-P图及其应用
20
作者 王继周 徐永昌 王力军 《上海金属(有色分册)》 1993年第3期7-11,共5页
在拉拔管材时,管材的变形参数,如延伸系数λ、截面变形指数Q,变形差值P以及减壁和缩径变形存在着确定的关系,可以用Q-λ-P图表示,将管材变形后的性能指标填入图中,可以清楚地看到性能变化的趋势,并且很方便地确定有利的变形参数,以期实... 在拉拔管材时,管材的变形参数,如延伸系数λ、截面变形指数Q,变形差值P以及减壁和缩径变形存在着确定的关系,可以用Q-λ-P图表示,将管材变形后的性能指标填入图中,可以清楚地看到性能变化的趋势,并且很方便地确定有利的变形参数,以期实现控制某项性能指标的目的。 展开更多
关键词 管材 变形 拉拔 q-λ-P图
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部