基于近端强化学习的股价预测方法被引量：4

Method of stock prices forecast based on proximal reinforcement learning

导出

摘要股价预测一直是金融时间序列研究的热点和难点,采用一种合理有效的股价预测方法对于投资者获取高额收益回报及规避交易风险具有重要的指导意义.通过结合近端策略优化(proximal policy optimization, PPO)和强化学习(reinforcement learning, RL),将股价预测视为一个时间序列预测问题,提出一种近端强化学习的股价预测方法 (PPORL).此外,在预测方法的基础上引入股票的相对强弱性能和股票均线指标,提出一种能够自动捕捉潜在交易点的量化交易策略,期望在获取高额收益的同时降低交易过程中存在的风险.通过实验对比了长短期记忆网络(long short-term memory, LSTM)和循环神经网络(recurrent neural network, RNN)模型在上证指数(SZZS)、深证成指(SZCZ)和沪深300指数(HS300)上的预测性能和交易决策表现,并利用多种误差评估方法对预测结果进行定量分析,从而验证了PPORL在预测性能和交易决策等方面的有效性和鲁棒性. Stock prices forecast is a hot and challenging topic in financial time series research. It is of great significance for the investors in theirs stock trading, to maximize revenue and to avoid risks by adopting a reasonable and effective forecasting method. A stock prices forecast method based on proximal reinforcement learning which combines proximal policy optimization(PPO) and reinforcement learning(RL), namely PPORL, is proposed, and the forecasting process is regarded as a time series prediction problem. Furthermore, the relative strength index(RSI) and move average of five days(MA5) are also introduced working as a trading strategy, which can automatically capture potential trading points,and avoid trading risks. By comparing the prediction performance and trading decision performance with long short-term memory(LSTM) and recurrent neural network(RNN) models on the SSE composite index(SZZS), the SZSE component index(SZCZ) and the CSI300 index(HS300), and a variety of error evaluation methods are used for quantitative analysis of the prediction results, which shows the effectiveness and robustness of the PPORL in forecasting performance and trading decision.

作者岑跃峰张晨光岑岗赵澄 CEN Yue-feng;ZHANG Chen-guang;CEN Gang;ZHAO Cheng(School of Information and Electronic Engineering,Zhejiang University of Seience and Technology,Hangzhou 310023,China;School of Economics,Zhejiang University of Technology,Hangzhou 310023,China)

机构地区浙江科技学院信息与电子工程学院浙江工业大学经济学院

出处《控制与决策》 EI CSCD 北大核心 2021年第4期967-973,共7页 Control and Decision

基金国家自然科学基金项目(61902349) 教育部规划基金项目(17YJA880004) 浙江省科技计划项目(2017C31038) 浙江省教育厅一般科研项目(Y201839557)。

关键词股价预测机器学习近端优化强化学习时间序列量化交易 stock prediction machine learning proximal optimization reinforcement learning time series quantitative trading

分类号 TP183 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献3

1谢琪,程耕国,徐旭.基于神经网络集成学习股票预测模型的研究[J].计算机工程与应用,2019,55(8):238-243. 被引量：22
2王双成,高瑞,杜瑞杰.小时间序列的动态朴素贝叶斯分类器学习与优化[J].控制与决策,2017,32(1):163-166. 被引量：12
3张宏立,李瑞国,范文慧,王雅.基于量子粒子群的全参数连分式混沌时间序列预测[J].控制与决策,2016,31(1):52-58. 被引量：11

二级参考文献20

1张森,肖先赐.混沌时间序列全局预测新方法——连分式法[J].物理学报,2005,54(11):5062-5068. 被引量：25
2Tongal H, Berndtsson R. Phase-space reconstruction and self-exciting threshold modeling approach to forecast lake water levels[J]. Stoch Environ Res Risk Assess, 2014, 28(4): 955-971.
3Masoumi H R F, Basri M, Kassim A, et al. Comparison of estimation capabilities of the artificial neural network with the wavelet neural network in lipase-catalyzed synthesis of triethanolamine-based esterquats cationic surfactant[J]. J of Surfact Deterg, 2014, 17(2): 287-294.
4Pandey A, Thapa K B, Prasad R, et al. General regression neural network and radial basis neural network for the estimation of crop variables of lady finger[J]. J of the Indian Society of Remote Sensing, 2012, 40(4): 709-715.
5Bansal A, Chen T T, Zhong S. Privacy preserving back-propagation neural network learning over arbitrarily partitioned data[J]. Neural Computing & Application, 2011, 20(1): 143-150.
6Bashirov A E, Belaghi M J S. On application of euler’s differential method to a continued fraction depending on parameter[J]. Indian J of Pure and Applied Mathematics, 2014, 45(3): 285-295.
7Manickavelu D, Vaidyanathan R U. Particle swarm optimization(PSO)-based node and link lifetime prediction algorithm for route recovery in MANET[J]. EURASIP J on Wireless Communications and Networking, 2014, 2014(107): 1-10.
8Sung W T, Chiang Y C. Improved particle swarm optimization algorithm for android medical care IOT using modified parameters[J]. J of Medical Systems, 2012, 36(6): 3755-3763.
9Farzi S, Dastjerdi A B. Leaf constrained minimal spanning trees solved by modified quantum-behaved particle swarm optimization[J]. Artificial Intelligence Review, 2010, 34(1): 1-17.
10Tian N, Lai C H. Parallel quantum-behaved particle swarm optimization[J]. Int J of Machine Learning and Cybernetics, 2014, 5(2): 309-318.

共引文献42

1王嗣敏,刘招君,董清水,朱建伟,郭巍.陆相盆地层序地层形成机制分析——以松辽盆地为例[J].长春科技大学学报,2000,30(2):139-144. 被引量：41
2张亚军,罗鑫.基于量子行为粒子优化的电路板红外成像增强[J].电子技术应用,2016,42(8):138-140. 被引量：2
3黄山,苏一丹,覃华,蒙祖强.低偏差蒙特卡罗序列的量子遗传算法[J].小型微型计算机系统,2017,38(2):398-404. 被引量：3
4陈功贵,黄山外,孙智,张治中,熊国江.基于改进量子粒子群算法的电力系统经济调度仿真研究[J].实验技术与管理,2017,34(3):104-107. 被引量：7
5陈春燕,杨枢,张钰.分类技术在疾病辅助诊断中的应用[J].福建电脑,2017,33(4):60-61. 被引量：1
6王双成,郑飞,高瑞.小时间序列动态完全Bayesian集成分类器研究[J].中国科学：信息科学,2017,47(11):1445-1463. 被引量：4
7董惠良,姜学峰,刘伟,段春立,毛科技.基于WSNs的分布式温度异常监测报警系统[J].传感器与微系统,2018,37(2):106-108. 被引量：1
8杨刚,王乐,戴丽珍,杨辉,陆荣秀.基于AQPSO的RBF神经网络自组织学习[J].控制与决策,2018,33(9):1631-1636. 被引量：6
9庞亮,孟雪井.遗传优化神经网络的激光散斑数据建模与分析[J].激光杂志,2018,39(9):148-151.
10陈翔,唐俊勇.基于贝叶斯与因果岭回归的物联网流量预测模型[J].四川大学学报（自然科学版）,2018,55(5):965-970. 被引量：11

同被引文献47

1耿晶晶,刘玉敏,李洋,赵哲耘.基于CNN-LSTM的股票指数预测模型[J].统计与决策,2021(5):134-138. 被引量：18
2徐映梅,陈尧.季节ARIMA模型与LSTM神经网络预测的比较[J].统计与决策,2021,37(2):46-50. 被引量：24
3刘玉敏,李洋,赵哲耘.基于特征选择的RF-LSTM模型成分股价格趋势预测[J].统计与决策,2021,37(1):157-160. 被引量：14
4李美洲,罗绍明.证券投资中技术指标KDJ之“K”和“J”值的应用[J].财经界,2020(25):101-103. 被引量：1
5贺本岚.股票价格预测的最优选择模型[J].统计与决策,2008,24(6):135-137. 被引量：13
6王文波,费浦生,羿旭明.基于EMD与神经网络的中国股票市场预测[J].系统工程理论与实践,2010,30(6):1027-1033. 被引量：62
7吴礼斌,崔岩岩.基于小波方差分解的沪深综指序列的特性分析[J].统计与决策,2010,26(23):138-140. 被引量：2
8郭朋.国外高频交易的发展现状及启示[J].证券市场导报,2012(7):56-61. 被引量：23
9孙志军,薛磊,许阳明,王正.深度学习研究综述[J].计算机应用研究,2012,29(8):2806-2810. 被引量：608
10余凯,贾磊,陈雨强,徐伟.深度学习的昨天、今天和明天[J].计算机研究与发展,2013,50(9):1799-1804. 被引量：604

引证文献4

1于永瑞.心理线指标在债券交易中的应用研究[J].工程经济,2022,32(5):28-33.
2王毓谦.深度学习框架下LSTM网络的期货价格预测模型研究[J].中小企业管理与科技,2021,5(36):137-139. 被引量：1
3赵煜,王珊.上证指数混联预测模型的构建研究[J].兰州财经大学学报,2021,37(6):50-61.
4关永锋,喻敏.基于组合模型的股指价格短期预测[J].运筹与管理,2023,32(4):177-183. 被引量：1

二级引证文献2

1蔡体菁,胡啸林.基于长短期记忆网络的重力测量误差补偿法[J].压电与声光,2022,44(4):643-646.
2吴劭锟.基于GARCH族模型的波动率研究——以燕京啤酒股票收益率为例[J].商展经济,2024(14):155-159.

1刘卉,李翰君,曲毅,何晓光,周志鹏,于冰.无反光点人体运动自动捕捉人工智能系统的有效性[J].北京体育大学学报,2021,44(1):125-133. 被引量：16
2刘宇辰,周静,张天骐,刘一.自控拍摄机器人的研究[J].IT经理世界,2020,23(12):4-4.

控制与决策

2021年第4期

浏览历史

内容加载中请稍等...

基于近端强化学习的股价预测方法被引量：4

参考文献3

二级参考文献20

共引文献42

同被引文献47

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于近端强化学习的股价预测方法 被引量：4

参考文献3

二级参考文献20

共引文献42

同被引文献47

引证文献4

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

基于近端强化学习的股价预测方法被引量：4