期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
2
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于期望Sarsa的进港航班排序模型研究
被引量:
5
1
作者
何爱平
张建伟
韩云祥
《现代计算机》
2021年第7期55-59,68,共6页
日益增长的航班流量给机场的维护带来了巨大压力的同时,也极大地影响乘客的体验。为了缓解机场的拥堵状况,结合人工智能算法,提出采用强化学习模型对终端区进港航班的序列进行优化。航班排序采用强化学习中的期望Sarsa算法,针对航班的...
日益增长的航班流量给机场的维护带来了巨大压力的同时,也极大地影响乘客的体验。为了缓解机场的拥堵状况,结合人工智能算法,提出采用强化学习模型对终端区进港航班的序列进行优化。航班排序采用强化学习中的期望Sarsa算法,针对航班的延误考虑设计延误时间、延误成本、尾流类型等因素的奖励函数,以航班的预计达到时刻为状态,延误的分钟数为动作,对成都双流国际机场连续进港的20架航班进行仿真实验,结果表明优于现有的基于优先级的先到先服务算法和常见的启发式算法。
展开更多
关键词
航班排序
期望sarsa
强化学习
序列优化
下载PDF
职称材料
基于DE-SARSA(TS)的跳频系统智能抗干扰决策算法
2
作者
袁泽
赵知劲
《杭州电子科技大学学报(自然科学版)》
2024年第1期6-13,共8页
为了提高跳频通信系统在复杂电磁环境下的抗干扰性能,提出一种基于结合汤普森采样(Thompson Sampling)、Dyna模型和期望SARSA学习(Expected Sarsa)的智能抗干扰决策算法。在期望SARSA学习中,引入Dyna模型,将模型学习与强化学习结合,提...
为了提高跳频通信系统在复杂电磁环境下的抗干扰性能,提出一种基于结合汤普森采样(Thompson Sampling)、Dyna模型和期望SARSA学习(Expected Sarsa)的智能抗干扰决策算法。在期望SARSA学习中,引入Dyna模型,将模型学习与强化学习结合,提升了算法收敛速度和稳态性能;采用汤普森采样和Tanh函数改进动作选择机制,提高了算法对环境的探索和利用;以时隙对应的干扰环境为状态,以跳频速率、信号瞬时带宽、频率序列等为动作构造状态动作空间,设计了相应的跳频系统模型和奖励函数。在高斯白噪声、窄带干扰、宽带干扰和扫频干扰并存的复杂干扰环境中的仿真结果表明,此算法兼顾了对环境的探索与利用,比对比算法有更快的收敛速度和更强的抗干扰能力。
展开更多
关键词
复杂电磁环境
跳频系统
期望sarsa
学习
汤普森采样
Dyna模型
下载PDF
职称材料
题名
基于期望Sarsa的进港航班排序模型研究
被引量:
5
1
作者
何爱平
张建伟
韩云祥
机构
四川大学视觉合成图形图像技术国防重点学科实验室
四川大学计算机学院
出处
《现代计算机》
2021年第7期55-59,68,共6页
基金
四川省科技计划项目(重点研发项目):复杂环境下空管语音识别与语义理解引擎关键技术及应用(No.2020YFG0327)。
文摘
日益增长的航班流量给机场的维护带来了巨大压力的同时,也极大地影响乘客的体验。为了缓解机场的拥堵状况,结合人工智能算法,提出采用强化学习模型对终端区进港航班的序列进行优化。航班排序采用强化学习中的期望Sarsa算法,针对航班的延误考虑设计延误时间、延误成本、尾流类型等因素的奖励函数,以航班的预计达到时刻为状态,延误的分钟数为动作,对成都双流国际机场连续进港的20架航班进行仿真实验,结果表明优于现有的基于优先级的先到先服务算法和常见的启发式算法。
关键词
航班排序
期望sarsa
强化学习
序列优化
Keywords
Flights Scheduling
Expected-
sarsa
Reinforcement Learning
Sequence Optimization
分类号
V355 [航空宇航科学与技术—人机与环境工程]
下载PDF
职称材料
题名
基于DE-SARSA(TS)的跳频系统智能抗干扰决策算法
2
作者
袁泽
赵知劲
机构
杭州电子科技大学通信工程学院
中国电子科技集团第
出处
《杭州电子科技大学学报(自然科学版)》
2024年第1期6-13,共8页
基金
国家自然科学基金资助项目(U19B2016)。
文摘
为了提高跳频通信系统在复杂电磁环境下的抗干扰性能,提出一种基于结合汤普森采样(Thompson Sampling)、Dyna模型和期望SARSA学习(Expected Sarsa)的智能抗干扰决策算法。在期望SARSA学习中,引入Dyna模型,将模型学习与强化学习结合,提升了算法收敛速度和稳态性能;采用汤普森采样和Tanh函数改进动作选择机制,提高了算法对环境的探索和利用;以时隙对应的干扰环境为状态,以跳频速率、信号瞬时带宽、频率序列等为动作构造状态动作空间,设计了相应的跳频系统模型和奖励函数。在高斯白噪声、窄带干扰、宽带干扰和扫频干扰并存的复杂干扰环境中的仿真结果表明,此算法兼顾了对环境的探索与利用,比对比算法有更快的收敛速度和更强的抗干扰能力。
关键词
复杂电磁环境
跳频系统
期望sarsa
学习
汤普森采样
Dyna模型
Keywords
complex electromagnetic environment
frequency hopping system
expect
sarsa
learning
Thompson sampling
Dyna model
分类号
TN914.41 [电子电信—通信与信息系统]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于期望Sarsa的进港航班排序模型研究
何爱平
张建伟
韩云祥
《现代计算机》
2021
5
下载PDF
职称材料
2
基于DE-SARSA(TS)的跳频系统智能抗干扰决策算法
袁泽
赵知劲
《杭州电子科技大学学报(自然科学版)》
2024
0
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部