文章旨在提出一种结合文本数据情感值、文本主题、社交数据,并基于深度学习算法LSTM模型(Long-Short Term Memory,长短期记忆网络)的股价预测方法。文章通过将情感测量值丰富到6种,特别是测量了情感分歧值(情感值标准差),为情感参与股...文章旨在提出一种结合文本数据情感值、文本主题、社交数据,并基于深度学习算法LSTM模型(Long-Short Term Memory,长短期记忆网络)的股价预测方法。文章通过将情感测量值丰富到6种,特别是测量了情感分歧值(情感值标准差),为情感参与股价预测提供了新的特征值。同时,将社交数据(文本的阅读数、点赞数)纳入模型中,考虑到了社交影响因素。在此基础上,文章将文本的主题因素纳入股价预测中,最终形成情感、主题、社交相结合的丰富文本特征集。基于OLS回归,首先验证了情感、主题、社交等特征和股价的相关性,然后,使用LSTM算法对特征与预测值进行了模型训练,最后基于训练好的模型对样本进行了回测。从回测结果看,增加了情感和主题后,模型具有良好的预测能力,对下一天收盘价的预测误差控制在0.5元以内。展开更多
文摘文章旨在提出一种结合文本数据情感值、文本主题、社交数据,并基于深度学习算法LSTM模型(Long-Short Term Memory,长短期记忆网络)的股价预测方法。文章通过将情感测量值丰富到6种,特别是测量了情感分歧值(情感值标准差),为情感参与股价预测提供了新的特征值。同时,将社交数据(文本的阅读数、点赞数)纳入模型中,考虑到了社交影响因素。在此基础上,文章将文本的主题因素纳入股价预测中,最终形成情感、主题、社交相结合的丰富文本特征集。基于OLS回归,首先验证了情感、主题、社交等特征和股价的相关性,然后,使用LSTM算法对特征与预测值进行了模型训练,最后基于训练好的模型对样本进行了回测。从回测结果看,增加了情感和主题后,模型具有良好的预测能力,对下一天收盘价的预测误差控制在0.5元以内。