期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于A2C算法的低轨星座动态波束资源调度研究 被引量:1
1
作者 刘伟 郑润泽 +3 位作者 张磊 高梓贺 陶滢 崔楷欣 《中国空间科学技术》 CSCD 北大核心 2023年第3期123-133,共11页
巨型低轨星座为载人飞船、空间站、遥感卫星等用户航天器提供低时延、大容量的通信通道存在波束资源分配优化的难题。针对采用离散时间的深度强化学习A2C(advanced actor-critic)的智能优化框架进行了研究,结合遗传算法中个体和基因概... 巨型低轨星座为载人飞船、空间站、遥感卫星等用户航天器提供低时延、大容量的通信通道存在波束资源分配优化的难题。针对采用离散时间的深度强化学习A2C(advanced actor-critic)的智能优化框架进行了研究,结合遗传算法中个体和基因概念、形成了可有效满足多用户、动态、并发接入需求的波束资源调度算法。基于仿真分析,提出的算法可在多种典型场景下具有适用性,支持在20 s内完成超过3000个任务的有效规划,任务成功率不低于91%。通过算法优化实现复杂度的降低,相对传统遗传算法可节约时间45%以上。同时对传统A2C算法框架中的收敛问题进行了优化,解决了传统全连接A2C算法无法收敛的难题,同时相比DQN(deep q-network)算法框架收敛速度提升38%以上。 展开更多
关键词 低轨星座 波束调度 任务规划 深度强化学习 a2c算法
下载PDF
基于A2C算法的股票交易模型
2
作者 肖豪 柯宗武 《人工智能与机器人研究》 2025年第1期237-245,共9页
2024年9月中国A股市场大涨,再次点燃了全民的“炒股热”。然而,牵动股民心弦的股价涨跌——却跟许多因素息息相关。对于散户来说,除了筛选信息进行股票的买进卖出以外,通过算法模型预测也能够起到事半功倍的效果。上世纪六十年代初便有... 2024年9月中国A股市场大涨,再次点燃了全民的“炒股热”。然而,牵动股民心弦的股价涨跌——却跟许多因素息息相关。对于散户来说,除了筛选信息进行股票的买进卖出以外,通过算法模型预测也能够起到事半功倍的效果。上世纪六十年代初便有了通过计算机技术进行量化交易的雏形,随着技术的迭代,通过统计学和模型构建成为量化交易的主流选择。而本论文构建了一个使用A2C (优势行动–评论家)强化学习算法的股票交易模型。利用“gym-anytrading”库创建一个股票交易环境,并使用Stable-Baselines库训练一个策略网络来学习如何在该环境中进行交易以最大化收益。该模型的数据来源于Yahoo-Finance的阿里巴巴股票信息(2022年12月至2024年9月),通过pandas-datareader库的接口获取。In September 2024, a significant surge in China’s A-share market reignited the public’s “stock trading frenzy”. However, the fluctuating stock prices that excited stock investors were closely related to many factors. For individual investors, in addition to screening information for buying and selling stocks, using an algorithm model to predict can also have a twice-as-effective effect. In the early 1960s, the embryo of quantitative trading using computer technology had appeared, and with the advancement of technology, quantitative trading based on statistics and model building became the mainstream choice. This paper constructs a stock trading model using the A2C (Advantage Actor-Critic) reinforcement learning algorithm. By using the “gym-anytrading” library to create a stock trading environment and training a policy network using the Stable-Baselines library to learn how to trade in this environment to maximize profits. The data source for the model comes from the stock information of Alibaba (2022 December to 2024 September) obtained through the interface of the pandas-datareader library. 展开更多
关键词 量化交易 强化学习 a2c算法 Gym-Anytrading Stable-Baselines
下载PDF
基于强化学习的物流配送路径优化 被引量:8
3
作者 蒋俊 申贵成 +1 位作者 王诗佳 张迁 《统计与决策》 CSSCI 北大核心 2021年第18期185-188,共4页
由于在电子商务模式下,物流运输成本占比大,因此配送路径优化研究具有重要的实际意义与理论意义。文章利用强化学习的基本思想,选取A2C算法,用于解决物流配送路径优化问题;采用1000组算例进行数值实验,并与谷歌OR-Tools、蚁群算法、遗... 由于在电子商务模式下,物流运输成本占比大,因此配送路径优化研究具有重要的实际意义与理论意义。文章利用强化学习的基本思想,选取A2C算法,用于解决物流配送路径优化问题;采用1000组算例进行数值实验,并与谷歌OR-Tools、蚁群算法、遗传算法进行对比。计算结果表明,在长度维度上,A2C算法比进化算法略有优势;在时间维度上,A2C算法具有较高的求解效率;在结构维度上,A2C算法具有输入可变、避免重新调参的优势。因此该算法能有效地求解物流配送模型,减少物流配送成本,从而提高物流配送的效率。 展开更多
关键词 配送路径 路径优化 强化学习 a2c算法
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部