MI和改进PCA的降维算法在股价预测中的应用被引量：8

Application of Mutual Information and Improved PCA Dimensionality Reduction Algorithm in Stock Price Forecasting

下载PDF

导出

摘要考虑到单个特征对标签的有效性及多特征之间的信息冗余问题,提出一种联合互信息和改进PCA的双重降维方法。利用互信息对众多的特征进行初步筛选,舍弃一部分对标签信息贡献较低的特征,使用累积方差贡献率和复相关系数共同确定主元个数的主成分分析法进行二次降维,不仅保证了主元模型的信息容量,同时也避免了过多噪声的参与,从而保证了预测过程的准确性。通过神经网络对实际股票数据进行预测,表明了提出的降维算法的有效性。 Considering the validity of a single feature on a tag and the information redundancy between multiple features,a method of mutual information combine with improving PCA for double dimensionality reduction are proposed.The mutual information is used to initially select a part of features from a large number of features,and some features that contribute less to the tag information are discarded.The principal component analysis method that uses the cumulative variance contribution rate and the multi-correlation coefficient to determine the number of principal elements is used for secondary dimensionality reduction.It not only ensures the information capacity of the principal component model,but also avoids the participation of excessive noise,thus ensuring the accuracy of the prediction process.The prediction of a single stock data through neural network shows the effectiveness of the dimensionality reduction algorithm proposed in this paper.

作者谢心蕊雷秀仁赵岩 XIE Xinrui;LEI Xiuren;ZHAO Yan(Department of Computational Mathematics,School of Mathematics,South China University of Technology,Guangzhou 510640,China;Department of Probability Theory and Mathematical Statistics,School of Mathematics,South China University of Technology,Guangzhou 510640,China)

机构地区华南理工大学数学学院信息与计算科学系华南理工大学数学学院统计与金融数学系

出处《计算机工程与应用》 CSCD 北大核心 2020年第21期139-144,共6页 Computer Engineering and Applications

基金国家自然科学基金(No.11572127)。

关键词互信息改进PCA 双重降维神经网络预测 Mutual Information(MI) improved PCA double dimensionality reduction neural network prediction

分类号 TP39 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1张淑清,任爽,姜安琦,胡永涛,张航飞,乔永静.PCA-GRNN在综合气象短期负荷预测中的应用[J].计量学报,2017,38(3):340-344. 被引量：10
2胡洁.高维数据特征降维研究综述[J].计算机应用研究,2008,25(9):2601-2606. 被引量：65
3刘敬浩,毛思平,付晓梅.基于ICA算法与深度神经网络的入侵检测模型[J].信息网络安全,2019(3):1-10. 被引量：10
4范雪莉,冯海泓,原猛.基于互信息的主成分分析特征选择算法[J].控制与决策,2013,28(6):915-919. 被引量：105
5张新荣,熊伟丽,徐保国.基于PCA的发酵过程监控模型主元数的确定[J].计算机测量与控制,2009,17(6):1120-1122. 被引量：6

二级参考文献74

1肖应旺,徐保国.改进PCA在发酵过程监测与故障诊断中的应用[J].控制与决策,2005,20(5):571-574. 被引量：17
2刘飞,王一竹.基于Q统计量的工业过程监控实例分析[J].计算机与应用化学,2006,23(7):631-634. 被引量：6
3Flores--Cerrillo Jesus, MacGregor John F. Latent variable MPC for trajectory tracking in batch processes [J]. Journal of Process Control, 2005, 15 (6): 651--663.
4Valle S, Li W, Qin S. J. Selection of the number of principal components: the variance of the reconstruction error criterion with a comparison to other methods [J]. Ind. Eng. Chem. Res. , 1999, 38: 4389--4401.
5Dunia R, Qin S. J. Subspaee approach to multidimensional fault identification and reconstruction[J].AIChE J, 1998, 44: 1813--1831.
6Dahl K S, Piovoso M J, Kosanovich K A. Translating thirdorder data analysis methods to chemical batch processes[J].Chemom Intell Lab Syst, 1999, 46 (2): 161--180.
7SCHUTZE H, HULL D A, PEDERSEN J O. A comparison of classifiers and document representations for the routing problem[ C ]//Proc of the 18th ACM Int Conf on Research and Development in Information Retrieval. New York : ACM, 1995:229- 237.
8CUTTING D R, KARGER D R, PEDERSON J O, et al. Scatter/gather:a cluster-based approach to browsing large document collections [ C ]//Proc of the 15th Annual Int ACM SIGIR Conf on Research and Development in Information Retrieval. New York:ACM, 1992:315- 329.
9SCHUTEZ H, SILVERSTEIN C. Projections for efficient document clustering[ C]//Proc of the 20th Annual Int ACM SIGIR Conf on Research and Development in Information Retrieval. New York: ACM, 1997,74-81.
10DHILLON I S, MALLELA S, MODHA S. Information theoretic coclustering[C]//Proc of the 9th ACM SIGKDD Int Conf on Knowledge Discovery and Data Mining. New York:ACM,2003:89-98.

共引文献186

1聂建军,刘书洪,叶少斌.基于多模型融合的可见光人脸活体检测方法[J].信息网络安全,2020(S02):32-35. 被引量：1
2王任一,张登辉,郭书生,黄导武,许彪.基于互信息矩阵的油层气油比识别新方法——以南海北部湾盆地涠洲油田为例[J].地球科学进展,2022,37(8):851-862.
3沈萍.高维数据挖掘技术研究[J].电脑知识与技术（过刊）,2009,0(6):1301-1303. 被引量：1
4茅赵阳.图像的聚类和可视化方法研究[J].现代计算机,2009,15(7):71-73. 被引量：1
5刘伟,张凤荔,程红蓉,万明成.改进ReliefF算法在图像型垃圾邮件检测中的应用研究[J].计算机应用研究,2009,26(9):3256-3258. 被引量：4
6孙娜.基于本体的文本分类研究综述[J].电脑知识与技术,2011,7(4):2251-2255.
7苏林,尚朝轩,连光耀,王宝龙.基于故障检测率的主元个数确定方法[J].计算机测量与控制,2011,19(8):1857-1860. 被引量：3
8夏慧异.运用增维的方法解决信息屏蔽问题[J].统计与信息论坛,2011,26(8):15-17. 被引量：1
9林伟,孟凡荣,王志晓.基于概念特征的语义文本分类[J].计算机工程与应用,2011,47(28):139-142. 被引量：4
10刘立月,黄兆华,刘遵雄.高维数据分类中的特征降维研究[J].江西师范大学学报（自然科学版）,2012,36(2):131-134. 被引量：4

同被引文献97

1刘玉敏,李洋,赵哲耘.基于特征选择的RF-LSTM模型成分股价格趋势预测[J].统计与决策,2021,37(1):157-160. 被引量：15
2林舜江,李欣然,刘杨华,罗安,金群,刘艳阳,陈辉华,唐外文.电力负荷动特性分类方法研究[J].电力系统自动化,2005,29(22):33-38. 被引量：31
3覃思乾.股价预测的GM(1,1)模型[J].统计与决策,2006,22(6):22-23. 被引量：6
4戴稳胜,吕奇杰,David Pitt.金融时间序列预测模型——基于离散小波分解与支持向量回归的研究[J].统计与决策,2007,23(14):4-7. 被引量：8
5林志勇,张维强,徐晨.基于小波变换与MOBP的股价预测[J].计算机工程与应用,2008,44(16):215-217. 被引量：3
6孙泉,赵旭峰,钱存华.基于多点加权马尔可夫链模型的股价预测分析[J].南京工业大学学报（自然科学版）,2008,30(3):89-92. 被引量：4
7张立军,苑迪.基于GA-Elman动态回归神经网络的股价预测模型研究[J].华东经济管理,2008,22(9):79-82. 被引量：8
8韩习武,赵铁军.一种聚类质量的评价方法及其应用[J].哈尔滨工业大学学报,2009,41(11):225-227. 被引量：7
9甘昕艳,张钰玲,潘家英.基于股价指数预测的仿真研究[J].计算机仿真,2010,27(10):297-300. 被引量：9
10傅德胜,周辰.基于密度的改进K均值算法及实现[J].计算机应用,2011,31(2):432-434. 被引量：76

引证文献8

1宋军英,崔益伟,李欣然,钟伟,邹鑫,李培强.基于欧氏动态时间弯曲距离与熵权法的负荷曲线聚类方法[J].电力系统自动化,2020(15):87-98. 被引量：32
2李晓雯,王陆权,曾亚光,陈允照,王茗祎,钟俊平,王雪花,熊红莲,陈勇.基于主成分分析的随机森林视网膜OCT图像分层算法研究[J].生物化学与生物物理进展,2021,48(3):336-343. 被引量：2
3海商容.大数据挖掘的房地产价格波动实时估计研究[J].甘肃科学学报,2021,33(5):47-51.
4唐加山,段丹丹.文本分类中基于CHI和PCA混合特征的降维方法[J].重庆邮电大学学报（自然科学版）,2022,34(1):164-171. 被引量：9
5孟令雯,张锐锋,汪明媚,席禹,陈波.基于改进DBN和K-means的变压器数据异常检测[J].电力信息与通信技术,2023,21(10):48-55. 被引量：3
6韩金磊,熊萍萍,孙继红.基于LSTM和灰色模型的股价时间序列预测研究[J].南京信息工程大学学报(自然科学版),2023,15(6):631-642. 被引量：4
7马美琛,林天华,赵霞.基于RF-MIC-PCA的股票趋势预测[J].河北省科学院学报,2024,41(2):13-21.
8葛璐瑶.基于PCA方法的移动医疗高维数据降维处理[J].科学技术创新,2024(11):88-91.

二级引证文献50

1陈德杰.壮族将军当兵记[J].民族,2000(1):18-20.
2宋军英,崔益伟,李欣然,钟伟,刘韬文,李培强.改进分段线性表示与动态时间弯曲相结合的负荷曲线聚类方法[J].电力系统自动化,2021,45(2):89-96. 被引量：26
3杨俊,黄际元,胡湘伟,李人晟,吴东琳,曾林俊.基于动态时间规整的变电站综合负荷行业解析方法[J].电器与能效管理技术,2021(2):31-36. 被引量：5
4李克明,江亚群,黄世付,李建奇,杨民生.基于DTW距离和聚类分析的配电台区低压拓扑结构辨识方法[J].电力系统保护与控制,2021,49(14):29-36. 被引量：31
5徐贤,管益斌,周挺,赵香,张重阳,柳伟.基于FCM和DTW的多分区电压支撑能力评估[J].电力工程技术,2021,40(4):101-107. 被引量：2
6黄冬梅,葛书阳,胡安铎,孙锦中,时帅,孙园.采用中心优化和双尺度相似性度量的改进K-means负荷聚类方法[J].电力系统及其自动化学报,2021,33(12):93-100. 被引量：13
7葛听雨,应雨龙,王申华,张菲菲,李靖超.基于轴向积分双谱与灰色关联分类器的通信辐射源识别[J].上海电力大学学报,2022,38(1):82-88. 被引量：2
8姚黄金,雷霞,付鑫权,胡益.基于改进自适应密度峰值算法的日负荷曲线聚类分析[J].电力系统保护与控制,2022,50(3):121-130. 被引量：8
9姚天宇,李勇,乔学博,韩宇,矫舒美,曹一家.计及安全边界和智能软开关协同配置的配电网分布式光伏准入容量优化[J].电力自动化设备,2022,42(4):63-70. 被引量：16
10张慧波,王守相,赵倩宇,任杰,王海.考虑数据不均衡的居民用户负荷曲线分类方法[J].电力工程技术,2022,41(3):186-193. 被引量：7

1张爽爽,陈焕新,张弘韬,郭亚宾.基于改进主元分析方法的空调系统传感器故障检测和诊断研究[J].制冷学报,2020,41(1):147-153. 被引量：11
2宋冰冰.基于语料库2020年政府工作报告的英译研究[J].现代语言学,2020,8(4):557-563.
3黄思玉,叶星辰,吕竹芬,陈燕忠.3D打印技术制备穿心莲内酯口崩片的处方优化研究[J].海峡药学,2020,32(9):13-17.
4欢迎订阅《农机科技推广》杂志[J].农机科技推广,2020(10).
5肖顺,杨乐祺,余偲,辛慧敏,阎虎勤.基于人工神经网络模型的沪深300指数预测[J].世界经济探索,2020,9(2):24-32.
6邓云天.大型燃煤电站锅炉积灰的智能神经网络预测[J].电气传动自动化,2020,42(3):24-25. 被引量：2
7周乔,刘宁宁,沈灵聪.基于股票图像与CNN的股价预测模型研究[J].金融,2020,10(4):334-342. 被引量：2
8刘丽云,国蓉,牛鲁娜,栗月姣,胡海军.基于主元分析方法的化工过程故障诊断与识别[J].化工自动化及仪表,2020,47(5):398-406. 被引量：9
9林潇,薛敬宏,乔晓林.基于降维的极化敏感阵列幅相误差自校正算法[J].现代雷达,2020,42(10):51-56. 被引量：7
10林启凤,陈燕忠,叶星辰,吕竹芬,黄思玉.星点设计-效应面法优化3D打印速效救心口崩片的处方及其质量评价[J].中药材,2020,43(2):415-418. 被引量：5

计算机工程与应用

2020年第21期

浏览历史

内容加载中请稍等...

MI和改进PCA的降维算法在股价预测中的应用被引量：8

参考文献5

二级参考文献74

共引文献186

同被引文献97

引证文献8

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

MI和改进PCA的降维算法在股价预测中的应用 被引量：8

参考文献5

二级参考文献74

共引文献186

同被引文献97

引证文献8

二级引证文献50

相关作者

相关机构

相关主题

浏览历史

MI和改进PCA的降维算法在股价预测中的应用被引量：8