期刊文献+

基于文本挖掘和多模块融合的金融数据分类分级方法

A Financial Data Grading Method based on Text Mining and Model Stacking
原文传递
导出
摘要 随着对金融行业对数据安全保护工作的逐步重视,提升数据分类分级的能力将有效赋能该行业推进数据安全建设.针对既有研究难以获取数据字段的准确表征以及数据不均衡等问题,本文构建了基于文本挖掘和多模块融合的金融数据分类分级方法.具体地,在数据输入模块中,分别基于数据结构和专业语料库对数据字段进行特征增强和语义增强,以准确地表征字段;在模型训练和融合模块中,采用Stacking框架将Adaboost,MLP和LSTM神经网络进行有效融合,进一步提升数据分类分级的准确性和泛化能力.以广发银行研发中心的27694条数据字段为样本进行了一系列的模型检验和性能对比分析,结果显示融合模型的准确率可以达到0.822,相对于单一方法表现更优且更为稳健.由此表明:本文所构建的数据分类分级方法具有较高的准确性和有效性,在金融领域、特别是针对商业银行的数据分级分类问题具有较高的实践价值. With the gradual emphasis on data security protection in the financial industry,improving the performance of data grading will greatly facilitate data security construction.To overcome the difficulty of obtaining an accurate representation of data and solve the problem of data imbalance presented in existing literature,this study proposes a financial data grading method based on text mining and multi-module fusion.Particularly,in the data input module,both feature enhancement and semantic augmentation based on data structure and professional corpus are performed so as to obtain an accurate representation of data.In the model training and fusion module,the stacking framework is used to integrate Adaboost,MLP and LSTM neural networks to further improve the accuracy of data grading and model generalizability.Using 27,694 data samples from China Guangfa Bank,this study conducts a series of empirical analyses.The result shows that the accuracy of the fusion models reaches 0.822,performing better than any single model.Besides,the result has confirmed the accuracy and efficacy of the proposed method,which also provides practical value,particularly for commercial banks to deal with data grading challenges in the financial industry.
作者 叶强 詹宝强 马笑晨 李永立 YE Qiang;ZHAN Baoqiang;MA Xiaochen;LI Yongli
出处 《信息技术与管理应用》 2022年第1期120-133,共14页 Information Technology and Management Application
基金 国家自然科学基金创新研究群体项目“基于大数据的管理科学研究”(72121001) 国家自然科学基金面上项目“面向复杂网络价值属性的量化模型及应用研究”(72171059)。
关键词 文本挖掘 数据分类分级 特征增强 Stacking融合框架 Text Mining Data Grading Feature Enhancement Stacking Fusion Framework
  • 相关文献

参考文献14

二级参考文献166

共引文献498

相关作者

内容加载中请稍等...

相关机构

内容加载中请稍等...

相关主题

内容加载中请稍等...

浏览历史

内容加载中请稍等...
;
使用帮助 返回顶部