期刊文献+
共找到81篇文章
< 1 2 5 >
每页显示 20 50 100
Cell Phone’s Functions on Language Learning
1
作者 伍文忠 王娜 《海外英语》 2012年第18期277-278,共2页
With the time passing by and development of this society,almost everyone has a cell phone,we may see that cell phone as a new fifth medium after computer,having its own characters and advantages,many learners research... With the time passing by and development of this society,almost everyone has a cell phone,we may see that cell phone as a new fifth medium after computer,having its own characters and advantages,many learners research the communica tive function of cell phone and some from the technological level.This thesis aims at trying to reveal cultural functions of culture,aiming at improve cell phone' s learning and culture functions in a more proper way. 展开更多
关键词 cell PHONE COMMUNICATIVE function LANGUAGE learnin
下载PDF
社区何以促进终身学习?——基于联合国教科文组织社区学习中心项目运行实践的分析
2
作者 李娟 顾凤佳 《职业技术教育》 北大核心 2024年第5期58-63,共6页
如何挖掘社区潜能、促进全民终身学习是我国加快建设学习型大国和学习型社会面临的研究课题。联合国教科文组织的社区学习中心项目作为支持各国实施终身学习战略而推出的重要举措,不仅实现了从扩大教育机会为主到促进社会治理、再到促... 如何挖掘社区潜能、促进全民终身学习是我国加快建设学习型大国和学习型社会面临的研究课题。联合国教科文组织的社区学习中心项目作为支持各国实施终身学习战略而推出的重要举措,不仅实现了从扩大教育机会为主到促进社会治理、再到促进可持续发展社会的功能拓展,而且形成了系统的运行指导方案,促进各国在运行主体、服务对象、供给内容、合作伙伴、支持保障等方面积累了成功经验,还提出了社区学习中心可持续运行的行动原则。我国需要进一步引导社区学习中心逐步实现功能拓展,优化政府主导、社区主体、多元参与的运行机制,以现代信息技术为支撑赋能社区学习服务创新,加强社区学习中心的特色发展和持续保障。 展开更多
关键词 社区学习中心 终身学习 功能 路径 启示
下载PDF
云边环境下微服务通信网络入侵行为识别方法
3
作者 任华新 《通信电源技术》 2024年第9期139-141,共3页
通信网络入侵行为具有多样性,难以保障入侵行为的识别效果,因此提出一种云边环境下微服务通信网络入侵行为识别方法。引入非线性变换函数,对微服务通信网络入侵行为的特征进行半监督学习,通过将原始入侵行为映射到高维空间,获取正常运... 通信网络入侵行为具有多样性,难以保障入侵行为的识别效果,因此提出一种云边环境下微服务通信网络入侵行为识别方法。引入非线性变换函数,对微服务通信网络入侵行为的特征进行半监督学习,通过将原始入侵行为映射到高维空间,获取正常运行状态下特征向量的参数。在构建以改进降噪自编码网络为基础的网络入侵行为识别模型的过程中,引入注意力机制,根据网络状态数据的重构误差与所设定的网络入侵行为特征阈值之间的差异,判断具体的入侵行为。根据测试结果,该方法能够准确识别出不同类型的入侵攻击。 展开更多
关键词 微服务通信网络 入侵行为识别 非线性变换函数 半监督学习 注意力机制
下载PDF
基于价值函数分解和通信学习机制的异构多智能体强化学习方法
4
作者 杜威 丁世飞 +2 位作者 郭丽丽 张健 丁玲 《计算机学报》 EI CAS CSCD 北大核心 2024年第6期1304-1322,共19页
许多现实世界的系统可以被建模为多智能体系统,多智能体强化学习为开发这些系统提供了一种有效的方法,其中基于集中训练与分散执行范式的价值函数分解方法得到了广泛的研究.然而现有的价值分解方法一般缺乏通信机制,在处理需要通信学习... 许多现实世界的系统可以被建模为多智能体系统,多智能体强化学习为开发这些系统提供了一种有效的方法,其中基于集中训练与分散执行范式的价值函数分解方法得到了广泛的研究.然而现有的价值分解方法一般缺乏通信机制,在处理需要通信学习的多智能体任务时表现不佳.同时,目前大多数通信机制都是针对同构多智能体环境设计的,没有考虑异构多智能体场景.在异构场景中,由于智能体动作空间或观测空间的异构性,智能体之间的信息共享并不直接.如果不能对智能体的异构性进行有效地建模处理,通信机制将变得无效,甚至会影响多智能体的协作性能.为了应对这些挑战,本文提出一个融合价值函数分解和通信学习机制的异构多智能体强化学习框架.具体地:(1)与采用同构图卷积网络的方法不同,该框架利用异构图卷积网络融合智能体的异构特征信息得到有效的嵌入;(2)利用通信学习模块获得的嵌入信息和局部观测历史计算每个智能体的动作价值,以选择和协调智能体的动作;(3)通过设计的互信息损失函数和价值函数分解模块的损失函数联合训练,能够有效地训练整个方法.本文首先在两个异构多智能体平台上进行实验,实验结果表明该方法能学到比基线方法更有效的策略,在两个平台上相比基线方法分别提高了 13%的平均奖励值和24%的平均胜率.此外,在交通信号控制场景中验证了该方法在现实系统中的可行性. 展开更多
关键词 价值函数分解 异构多智能体强化学习 通信机制 图神经网络 互信息 交通信号控制
下载PDF
多跳中继网络隐蔽通信设计与实验分析
5
作者 胡锦松 吴林梅 +2 位作者 国明乾 陈由甲 赵铁松 《实验室研究与探索》 CAS 北大核心 2024年第2期13-17,共5页
针对随机分布多跳中继网络存在的通信安全问题,提出了一种基于强化学习的智能路径选择方案。该方案考虑单密钥和独立密钥传输2种情况,分别对监测者的检测性能进行了探究,并基于隐蔽约束确定了各中继的最佳功率分配。最后,基于强化学习... 针对随机分布多跳中继网络存在的通信安全问题,提出了一种基于强化学习的智能路径选择方案。该方案考虑单密钥和独立密钥传输2种情况,分别对监测者的检测性能进行了探究,并基于隐蔽约束确定了各中继的最佳功率分配。最后,基于强化学习技术实现了多跳网络传输路径的智能选择,以保证传输的隐蔽性,并最大化系统的隐蔽吞吐量。结果表明,单密钥方案所选路径倾向于绕开监测者所监测的区域,而独立密钥方案所选路径可以穿过监测者的监测区域,并且独立密钥所能达到的系统增益显著优于单密钥。 展开更多
关键词 隐蔽通信 强化学习 多跳中继 路径选择
下载PDF
基于业务性能偏差感知的电力通信网路由优化策略
6
作者 陈亚鹏 杨阳 +2 位作者 舒乙凌 谢文正 周振宇 《电工技术学报》 EI CSCD 北大核心 2024年第11期3411-3421,共11页
针对新兴电力业务对时延、可靠性的严苛要求,提出一种基于业务性能偏差感知的电力通信网路由优化策略。在建立“能量-信息”耦合网络模型基础上,量化分析电力业务转发时延与可靠性约束,设置与能量层、信息层重要度相关的业务效用最大化... 针对新兴电力业务对时延、可靠性的严苛要求,提出一种基于业务性能偏差感知的电力通信网路由优化策略。在建立“能量-信息”耦合网络模型基础上,量化分析电力业务转发时延与可靠性约束,设置与能量层、信息层重要度相关的业务效用最大化问题,利用虚拟队列积压感知多跳长时路由优化中的业务性能偏差,基于引入记忆空间的改进SARSA(λ)算法,实现信息不确定场景下的电力通信网路由优化。仿真结果表明,所提算法可有效提升业务效用,在转发时延、丢包率方面性能更优,且可通过权重系数调节适应不同场景的差异化业务需求。 展开更多
关键词 电力通信网 “能量-信息”耦合网络 路由优化 业务性能偏差感知 强化学习
下载PDF
云计算环境下数据通信的智能路由算法研究
7
作者 张光艳 《通信电源技术》 2024年第5期176-178,共3页
文章以深度强化学习模型为核心,研究了云计算环境下的数据通信智能路由算法。通过状态空间建模、动作空间定义、奖励机制及深度强化学习算法的综合应用,实现了对系统性能多方面的综合优化。在对比实验中,将该智能路由算法与传统路由协... 文章以深度强化学习模型为核心,研究了云计算环境下的数据通信智能路由算法。通过状态空间建模、动作空间定义、奖励机制及深度强化学习算法的综合应用,实现了对系统性能多方面的综合优化。在对比实验中,将该智能路由算法与传统路由协议进行了全面对比,验证了其在收敛时间、数据传输效率、路由表更新频率以及负载均衡性能等关键指标上的优越性。这些研究结果不仅为云计算环境下智能路由的应用提供了创新性的思路,也为构建更智能、高效的云计算系统奠定了基础。 展开更多
关键词 智能路由算法 云计算 数据通信 强化学习
下载PDF
新型教学模式下的学习社区设计——以北京市第一实验学校设计为例
8
作者 蒋蓁蓁 李碧舟 《住宅产业》 2024年第5期33-35,共3页
随着科技的快速发展和教育的不断进步,新型教学模式逐渐兴起,为学生提供了更加丰富、多样化的学习体验。其中,学习社区概念的引入使得学生可以在一个更加互动、共享的学习环境中学习,进一步提高学习效果。本文旨在探讨新型教学模式下学... 随着科技的快速发展和教育的不断进步,新型教学模式逐渐兴起,为学生提供了更加丰富、多样化的学习体验。其中,学习社区概念的引入使得学生可以在一个更加互动、共享的学习环境中学习,进一步提高学习效果。本文旨在探讨新型教学模式下学习社区的设计理念与实践,以北京市第一实验学校为例,分析学习社区的设计要素及其在教育空间中的应用。通过对教学理念、学习社区构成及学习工作室与多功能区的深入剖析,揭示了学习社区设计对于提升教育质量与空间活力的重要作用。 展开更多
关键词 新型教学模式 学习社区设计 学习工作室设计 多功能区
下载PDF
基于深度学习的通信软件DDoS攻击检测方法
9
作者 赵菊芳 《长江信息通信》 2024年第6期102-104,共3页
由于不同尺度上的通信软件数据不具有可比性,导致在对DDoS攻击进行检测时,可靠性偏低,为此,提出基于深度学习的通信软件DDoS攻击检测方法研究。将所有的通信软件数据转换为0到1之间的值后,通过计算出所有可能的灰度级组合在单位距离和... 由于不同尺度上的通信软件数据不具有可比性,导致在对DDoS攻击进行检测时,可靠性偏低,为此,提出基于深度学习的通信软件DDoS攻击检测方法研究。将所有的通信软件数据转换为0到1之间的值后,通过计算出所有可能的灰度级组合在单位距离和特定方向上的出现频率构建了通信软件数据灰度共生矩阵,将通信软件数据灰度共生矩阵的均值和方差特征作为基准,利用SHA-256哈希函数将数据转换为二进制编码形式。将重构后的数据输入到包含交叉熵损失函数的CNN网络中,根据更新偏置与通信软件数据灰度共生矩阵特征参数之间的关系,确定DDoS攻击数据。在测试结果中,PPV始终稳定在0.88以上,TPR稳定在0.92以上,具有较高的可靠性。 展开更多
关键词 深度学习 通信软件 DDOS攻击检测 交叉熵损失函数 CNN网络
下载PDF
学习共同体视角下大学生英语自主学习能力可持续发展的实践路径
10
作者 陈晓燕 《齐齐哈尔师范高等专科学校学报》 2023年第3期146-149,共4页
真正的自主学习应该基于学生对学习的一种内在需要和主动意识,具有可持续发展性。在学习共同体教学理念指导下,本研究旨在构建以促进学生英语自主学习能力的可持续发展为目标的学习共同体,从而助力“双一流”建设。具体实践路径主要包括... 真正的自主学习应该基于学生对学习的一种内在需要和主动意识,具有可持续发展性。在学习共同体教学理念指导下,本研究旨在构建以促进学生英语自主学习能力的可持续发展为目标的学习共同体,从而助力“双一流”建设。具体实践路径主要包括:构建混合式学习共同体模式;对学生进行自主学习策略训练;创设多种学习情境以增强学习者与学习环境的交互;开展反思性教学,建立学生自评和学习过程自我监控手段;注重学生的情感需求。 展开更多
关键词 学习共同体 自主学习 可持续发展 实践路径
下载PDF
土壤污染生态阈值研究进展
11
作者 代杜铃 姜瑢 +2 位作者 荣丽 王美娥 陈卫平 《生态毒理学报》 CAS CSCD 北大核心 2023年第6期98-111,共14页
目前我国现行的土壤环境质量标准主要以人体健康风险和食物链风险为主,对生态安全关注较少,缺乏生态风险的相关内容。准确推导土壤污染生态阈值,是制定土壤环境质量基准及标准的重要基础。本文围绕当前国内外常用土壤污染生态阈值推导过... 目前我国现行的土壤环境质量标准主要以人体健康风险和食物链风险为主,对生态安全关注较少,缺乏生态风险的相关内容。准确推导土壤污染生态阈值,是制定土壤环境质量基准及标准的重要基础。本文围绕当前国内外常用土壤污染生态阈值推导过程,以及基于植物和土壤无脊椎动物个体以及微生物群落等不同生态受体推导生态阈值的优缺点进行了综述。针对目前推导土壤污染生态阈值的主要程序,即:基于实验室内生态毒性数据进行统计外推的方法存在物种代表性不足、生态相关性差以及缺乏场地-特异性等缺点,指出基于野外调查数据,利用机器学习算法构建精确度高、准确性强的污染物暴露剂量-效应模型的可行性,提出整合文献和毒理数据库中个体水平及野外生物群落水平生态毒性效应数据的场地-特异性土壤污染生态阈值推导框架;同时建议今后重点开展以下4个方面的工作:(1)野外土壤生物群落评估终点指标体系建立;(2)场地-特异性暴露-效应关系模型构建;(3)实验室生态毒理数据的筛查、评价及野外校正;(4)土壤生物毒理数据库平台搭建。以期为科学合理地制定基于生态风险土壤环境质量基准及标准提供重要的理论基础和技术支撑。 展开更多
关键词 土壤微生物生态功能 群落水平生态效应 生态风险 机器学习 场地-特异性
下载PDF
MIMO系统探通一体化信号矩阵设计方法 被引量:3
12
作者 杨婧 余显祥 +2 位作者 沙明辉 崔国龙 孔令讲 《雷达学报(中英文)》 EI CSCD 北大核心 2023年第2期262-274,共13页
由于多输入多输出(MIMO)系统具有波形、空间分集和多路复用等优势,MIMO探通一体化(DFRC)系统通过共享软硬件资源以同时实现目标探测和保密通信功能受到了极大关注。该文针对基于预编码矩阵调制的MIMO探通一体化系统,提出了基于交替方向... 由于多输入多输出(MIMO)系统具有波形、空间分集和多路复用等优势,MIMO探通一体化(DFRC)系统通过共享软硬件资源以同时实现目标探测和保密通信功能受到了极大关注。该文针对基于预编码矩阵调制的MIMO探通一体化系统,提出了基于交替方向乘子(ADMM)的一体化信号矩阵设计方法。通过用户和窃听用户参考密码本约束下最大化方向图峰值主瓣旁瓣电平比(PMSR),保证了探测方向图性能的同时防止通信信息被窃听。针对预编码矩阵通信解调问题,提出了基于交替方向惩罚(ADPM)的排序学习优化解调方法,提升了一体化波形信息解调效率。数值仿真验证了所提设计方法实现探通一体化的有效性,与已有算法相比可实现多用户通信和更高的PMSR。 展开更多
关键词 探通一体化 信号矩阵设计 交替方向乘子法 排序学习解调 交替方向惩罚法
下载PDF
新时代我国社区教育社会功能的建设路径
13
作者 胡啸兵 胡宏力 赵军镜 《宁波开放大学学报》 2023年第1期1-6,共6页
社区教育是与社会发展结合最为密切的教育形态,社区教育在功能上不仅具有教化育人的基本功能,更具有通过教化育人促进社会全面发展的社会功能。基于社区教育社会功能形成机制和新时代我国社区教育功能的社会需求结构分析可以认为,社区... 社区教育是与社会发展结合最为密切的教育形态,社区教育在功能上不仅具有教化育人的基本功能,更具有通过教化育人促进社会全面发展的社会功能。基于社区教育社会功能形成机制和新时代我国社区教育功能的社会需求结构分析可以认为,社区教育社会功能在内涵上包括政策宣传、能力提升和实践推进三大功能类型和党性党史教育、社会法治教育、社区治理服务、就业创业教育、文化建设服务、绿色环保教育等六大功能板块。新时代社区教育社会功能建设路径设计,应对标社区教育社会功能内涵结构,坚持系统建设理念,着重把握好树立大局意识、服务国家战略,建立联动机制、促进社会协同,加强政策引导、增加评价权重,推行开放模式、凝聚社会合力,充实课程资源、夯实教学支撑,革新技术手段、扩大普惠效应等几个方面。 展开更多
关键词 新时代 社区教育 社会功能 建设路径
下载PDF
基于SVM的电力通信网络路由均衡方法研究
14
作者 杨淑艳 《信息技术》 2023年第4期101-106,共6页
路由均衡过程存在负载开销,导致路由分配风险概率增加,提出基于SVM的电力通信网络路由均衡方法。构建路由均衡模型,通过能量函数分配网络业务路由,基于粒子群优化算法改进最小支持向量机的路由算法,求解均衡模型;通过最小支持向量机估... 路由均衡过程存在负载开销,导致路由分配风险概率增加,提出基于SVM的电力通信网络路由均衡方法。构建路由均衡模型,通过能量函数分配网络业务路由,基于粒子群优化算法改进最小支持向量机的路由算法,求解均衡模型;通过最小支持向量机估算网络节点剩余能量,选用负载开销最小的路径路由数据,实现电力通信网络全局路由均衡分配。实验结果表明:该方法可均衡电力通信网络中存在的风险,且噪声大小对电力通信网络覆盖率、节点平均剩余能量以及业务中断影响不明显,在均衡电力通信网络业务方面具有可靠性与有效性。 展开更多
关键词 电力通信网络 路由均衡 业务安全风险 非一致性业务 能量函数
下载PDF
虚拟学习社区多重内涵之解析与研究 被引量:48
15
作者 甘永成 王炜 《现代远程教育研究》 2005年第5期10-15,共6页
本文全面探讨了虚拟学习社区的内涵。从虚拟学习社区是虚拟社区和新的学习模式的结合着手,分别阐述了虚拟学习社区的环境建构、虚拟学习社区的要素和特征及其主要功能与工具,最后阐明了虚拟学习社区的基本分类和三个协同共生的层面:知... 本文全面探讨了虚拟学习社区的内涵。从虚拟学习社区是虚拟社区和新的学习模式的结合着手,分别阐述了虚拟学习社区的环境建构、虚拟学习社区的要素和特征及其主要功能与工具,最后阐明了虚拟学习社区的基本分类和三个协同共生的层面:知识建构、智慧学习和情感交流。 展开更多
关键词 虚拟学习社区 在线学习 基础 要素和特征 功能与工具 层面
下载PDF
Web2.0环境下的高校虚拟学习社区设计 被引量:11
16
作者 宁玉文 沈霞娟 +1 位作者 高东怀 张迎 《计算机技术与发展》 2012年第5期209-211,215,共4页
虚拟学习社区作为一种数字化的学习环境,在高校中广泛应用于正式学习和非正式学习,利用Web2.0技术进行改造,可以解决传统虚拟学习社区中寻找学习伙伴与归属感难、分享学习资源难等问题。综合分析了Web2.0具有实现个性化、明确归属感、... 虚拟学习社区作为一种数字化的学习环境,在高校中广泛应用于正式学习和非正式学习,利用Web2.0技术进行改造,可以解决传统虚拟学习社区中寻找学习伙伴与归属感难、分享学习资源难等问题。综合分析了Web2.0具有实现个性化、明确归属感、变革信息源等技术特性,结合了学习者的需要和虚拟学习社区的基本结构。设计了虚拟学习社区的五大功能模块,提出了高校虚拟学习社区的结构模型。基于Web2.0技术构建的虚拟学习社区模型基本可以通过开发实现,并能在高校有效应用。 展开更多
关键词 WEB2.0 高校 虚拟学习社区 功能模块
下载PDF
基于Q-学习算法的交通控制与诱导协同模式的在线选择 被引量:3
17
作者 杨庆芳 杨朝 《吉林大学学报(工学版)》 EI CAS CSCD 北大核心 2010年第5期1215-1219,共5页
采用Q-学习算法实现了交通控制与诱导协同模式的在线选择。首先,采用Q-学习算法训练多智能体,根据多智能体内部的推理得到不同交通状态下的最优协同模式,最终实现交通控制与交通诱导协同模式的在线选择与转换。仿真结果表明,本文提出的... 采用Q-学习算法实现了交通控制与诱导协同模式的在线选择。首先,采用Q-学习算法训练多智能体,根据多智能体内部的推理得到不同交通状态下的最优协同模式,最终实现交通控制与交通诱导协同模式的在线选择与转换。仿真结果表明,本文提出的基于Q-学习算法的协同模式选择方法在一般交通拥挤状态下具有较好的协同控制效果,对比离线式模式选择方法更能适应交通状态的不断变化,从而达到有效避免严重交通拥堵、改善路网性能的目的。 展开更多
关键词 交通运输工程 交通控制与诱导协同 模式选择 Q-学习算法 回报函数
下载PDF
时延约束的链路选择平衡优化组播路由算法 被引量:4
18
作者 刘维群 李元臣 《计算机应用》 CSCD 北大核心 2011年第4期925-927,共3页
针对时延约束的最小代价组播树生成方法,提出一种快速有效的时延约束组播路由算法。该算法改进了KPP算法,设计了代价和时延动态优化的链路选择函数。在选择路径时,该算法综合考虑了时延和代价两个参数,保证了组播树的性能,降低了时间复... 针对时延约束的最小代价组播树生成方法,提出一种快速有效的时延约束组播路由算法。该算法改进了KPP算法,设计了代价和时延动态优化的链路选择函数。在选择路径时,该算法综合考虑了时延和代价两个参数,保证了组播树的性能,降低了时间复杂度低。仿真结果表明,该算法能正确地构造出时延约束组播树,同时还具有较低的代价和计算复杂度。 展开更多
关键词 组播通信 链路选择函数 路由 服务质量 STEINER树
下载PDF
面向5G通信网络的NFV内存资源管理方法 被引量:7
19
作者 苏畅 张定权 +1 位作者 谢显中 谭娅 《计算机科学》 CSCD 北大核心 2020年第9期246-251,共6页
随着5G研究的深入和商用的推进,出现了各式各样的挑战,其中,5G通信系统的资源管理对于5G网络的研究来说是一个关键性的挑战。网络功能虚拟化技术为5G的实现提供了关键支撑,同时也为5G的资源管理问题引入了新的研究方向,但是网络功能虚... 随着5G研究的深入和商用的推进,出现了各式各样的挑战,其中,5G通信系统的资源管理对于5G网络的研究来说是一个关键性的挑战。网络功能虚拟化技术为5G的实现提供了关键支撑,同时也为5G的资源管理问题引入了新的研究方向,但是网络功能虚拟化场景中的资源管理是一个比较复杂问题。特别地,虚拟网络功能的不同放置位置会为其性能带来不同的影响。文中首先对网络功能虚拟化的资源分配方法及放置对性能的影响进行了分析和研究,在此基础上,主要根据知识定义网络所提出的范例,探讨了将机器学习技术应用于虚拟网络功能内存资源管理的研究,构建神经网络学习模型,预测内存资源消耗。其次,重点对输入流量的特征进行提取,流量主要由一组特征表示,这些特征代表了从数据链路层到传输层的小批次信息,其中的内存消耗是从虚拟机管理程序的性能监测工具上得出的批量的平均内存消耗。最后,利用神经网络模型预测内存资源消耗,从而达到对内存资源进行管理的目的。 展开更多
关键词 5G通信网络 资源管理 网络功能虚拟化 机器学习 内存消耗
下载PDF
基于增强学习解决随机需求车辆路径问题 被引量:1
20
作者 娄山佐 吴耀华 +1 位作者 肖际伟 廖莉 《系统仿真学报》 EI CAS CSCD 北大核心 2008年第14期3675-3678,共4页
针对确定随机需求车辆路径问题的最优策略,存在状态空间"维数灾"问题,基于增强学习函数近似原理,首先,设计了一个径向基函数(RBF),其次,在一给定的控制策略下,将最小平方瞬时差分(LSTD)法确定函数的权系数与交叉熵(CE)法确定... 针对确定随机需求车辆路径问题的最优策略,存在状态空间"维数灾"问题,基于增强学习函数近似原理,首先,设计了一个径向基函数(RBF),其次,在一给定的控制策略下,将最小平方瞬时差分(LSTD)法确定函数的权系数与交叉熵(CE)法确定隐层节点基函数的参数相结合,通过在线调整,使Bellman残差平方和性能指标达到最小,最后,根据得到的径向基函数,确定最优策略。通过仿真试验,验证了所设计方法的有效性。 展开更多
关键词 车辆路径问题 增强学习 随机需求 径向基函数 交叉熵
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部