基于XGBoost算法的上市公司财务报表舞弊识别研究被引量：3

Research on the identification of financial statement fraud of listed companies based on XGBoost algorithm

下载PDF

导出

摘要研究了财务报表舞弊识别问题。以2011-2020年深沪A股上市公司的财务报表为样本数据,引入信息值构建指标筛选模型,提取17个财务变量和4个非财务变量,对样本数据进行清洗和归一化后,运用XGBoost算法对样本数据进行分类。实验结果表明,基于XGBoost算法构建的财务报表舞弊识别模型在所有性能指标上都优于机器学习算法中的逻辑回归、支持向量机和随机森林算法。 In this paper,the identification of financial statement fraud is studied.Taking the financial statements of ShenzhenShanghai A-share listed companies from 2011 to 2020 as sample data,the information value is introduced to construct an index screening model,and 17 financial variables and 4 non-financial variables are extracted.After cleaning and normalizing the sample data,the XGBoost algorithm is used to classify the sample data.The experimental results show that the financial statement fraud identification model based on the XGBoost algorithm is superior to the logistic regression(LR),support vector machine(SVM)and random forest(RF)algorithms in machine learning algorithms in all performance indicators.

作者吴贞如 Wu Zhenru(School of Information and Engineering,Nanjing Audit University,Nanjing,Jiangsu 211815,China)

机构地区南京审计大学信息工程学院

出处《计算机时代》 2022年第8期29-33,共5页 Computer Era

关键词上市公司财务报表舞弊机器学习 XGBoost listed company financial statement fraud machine learning XGBoost

分类号 F275.5 [经济管理—企业管理]

引文网络
相关文献

参考文献3

1王晖妤.财务报表列报需关注的几个问题[J].中国注册会计师,2018(4):88-90. 被引量：4
2黄志刚,刘佳进,林朝颖.基于机器学习的上市公司财报舞弊识别前沿方法比较研究[J].系统科学与数学,2020,40(10):1882-1900. 被引量：16
3高采文,朱晓琳,曾林蕊.生长曲线模型的变量选择[J].应用概率统计,2014,30(2):213-222. 被引量：3

二级参考文献19

1刘爱义.生长曲线模型的协变量选择与参数估计[J].数学学报（中文版）,1994,37(3):362-372. 被引量：4
2蔡志岳,吴世农.基于公司治理的信息披露舞弊预警研究[J].管理科学,2006,19(4):79-90. 被引量：32
3潘建新.增长曲线模型中回归参数的最小二乘估计及Gauss-Markov定理[J].数理统计与应用概率,1988,3(2):169-185.
4Zou, H., The adaptive Lasso and its oracle properties, Journal of the American Statistical Association, 101(476)(2006), 1419-1426.
5Fan, J.Q. and Li, R., Variable selection via nonconcave penalized likelihood and its oracle properties, Journal of the American Statistical Association, 96(456)(2001), 1348-1360.
6Knight, K. and Fu, W., Asymptotics for Lasso-type estimators, The Annals of Statistics, 28(5)(2000), 1356-1378.
7丁世飞,齐丙娟,谭红艳.支持向量机理论与算法研究综述[J].电子科技大学学报,2011,40(1):2-10. 被引量：899
8岳殿民,吴晓丹,韩传模,申娜娜.基于Logistic方法的上市公司会计舞弊检测研究[J].经济与管理研究,2012,33(2):88-95. 被引量：14
9张日权.PC准则下生长曲线模型回归参数阵岭估计的优良性[J].工程数学学报,2000,17(1):113-116. 被引量：8
10张学工.关于统计学习理论与支持向量机[J].自动化学报,2000,26(1):32-42. 被引量：2264

共引文献20

1陈涛,吴贞如.上市公司财务报表舞弊识别模型的比较研究[J].中国审计评论,2022(2):132-148.
2徐静,李俊林,唐少清.上市公司财务异常与舞弊疑点检测研究[J].中国软科学,2021(S01):421-428. 被引量：7
3蒋旻.浅析房地产企业财务报表分析[J].中国乡镇企业会计,2019,0(12):109-110. 被引量：4
4何晓婷.基于EVA的医药企业绩效评价——以千金药业为例[J].价值工程,2020,39(4):12-14. 被引量：2
5杨兰军,白鹏.正态条件下带AR(1)-型方差结构GMANOVA-MANOVA模型极大似然估计的小样本特征[J].系统科学与数学,2020,40(1):156-170.
6刘倩倩.基于信息融合的企业会计信息舞弊风险识别方法[J].河北北方学院学报（自然科学版）,2022,38(3):55-60. 被引量：1
7章银平,郭凤华.面向上市企业财务报表舞弊判断的机器学习算法研究[J].贵阳学院学报（自然科学版）,2022,17(1):38-42. 被引量：3
8龚谊承,王晓杰,邹一鸣.基于蓄水池抽样的智能医保动态风险决策及应用[J].系统科学与数学,2022,42(4):802-817.
9王玉龙,周榴,张涤霏.企业债务违约风险预测——基于机器学习的视角[J].财政科学,2022(6):62-74. 被引量：7
10张熠,徐阳,李维萍.基于LDA主题模型的上市公司违规识别——以中国A股上市银行为例[J].审计与经济研究,2022,37(5):107-116. 被引量：3

同被引文献20

1杨清香,俞麟,陈娜.董事会特征与财务舞弊——来自中国上市公司的经验证据[J].会计研究,2009(7):64-70. 被引量：152
2洪荭,胡华夏,郭春飞.基于GONE理论的上市公司财务报告舞弊识别研究[J].会计研究,2012(8):84-90. 被引量：131
3朱国泓.上市公司财务报告舞弊的二元治理——激励优化与会计控制强化[J].管理世界,2001,17(4):153-162. 被引量：23
4章美珍.财务报告舞弊端倪甄别及治理对策[J].当代财经,2002(5):67-70. 被引量：18
5赵丽芳,武婷.基于舞弊三角理论识别的上市公司违规行为研究[J].财会通讯（下）,2014(9):67-70. 被引量：3
6张曾莲,高雅.财务舞弊识别模型构建及实证检验[J].统计与决策,2017,33(9):172-175. 被引量：14
7王晖妤.财务报表列报需关注的几个问题[J].中国注册会计师,2018(4):88-90. 被引量：4
8王威.稀疏组Lasso-logistic回归模型在财务报告舞弊识别中的应用研究[J].数学的实践与认识,2020,50(9):49-58. 被引量：10
9黄世忠,叶钦华,徐珊,叶凡.2010~2019年中国上市公司财务舞弊分析[J].财会月刊,2020(14):153-160. 被引量：100
10吕晨,程建华.基于Logistic模型的上市公司财务造假识别研究[J].中原工学院学报,2020,31(5):72-77. 被引量：2

引证文献3

1张帅,蔡素贤,蔡德阳,李雪.基于XGBoost算法的建筑企业财务报表授信风险识别研究[J].现代商业银行导刊,2022(11):46-52.
2宋晓丽.基于Logistic回归分析的我国上市公司财务舞弊识别研究[J].河北企业,2023(11):97-100.
3王琦,熊莎丽娜,詹柔,张露,杨鑫,张健.非平衡数据集下基于XGBoost模型的财务舞弊识别研究[J].计算机时代,2023(12):59-63.

1战希臣,杨睿英,郭聚.基于粗糙集理论的装备质量基因要素信息筛选[J].舰船电子工程,2022,42(5):30-35. 被引量：1
2耿世平,余敏,郭晓鹏,牛东晓,许晓敏.基于柔性变电站的交直流配电技术经济评估[J].电力科学与技术学报,2022,37(1):140-150. 被引量：12
3刘太明,邓祖兵.高质量发展区域经济数据异常趋势智能预测研究[J].微型电脑应用,2022,38(7):58-62. 被引量：2
4邓晴元,刘舟,张顺明.交易者过度自信与信息相关性暖昧的资产定价[J].系统工程理论与实践,2022,42(7):1755-1769. 被引量：8

计算机时代

2022年第8期

浏览历史

内容加载中请稍等...

基于XGBoost算法的上市公司财务报表舞弊识别研究被引量：3

参考文献3

二级参考文献19

共引文献20

同被引文献20

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于XGBoost算法的上市公司财务报表舞弊识别研究 被引量：3

参考文献3

二级参考文献19

共引文献20

同被引文献20

引证文献3

相关作者

相关机构

相关主题

浏览历史

基于XGBoost算法的上市公司财务报表舞弊识别研究被引量：3