基于多数据源融合的创业板上市公司财务造假异常检测被引量：3

Data Analysis and Knowledge Discovery Financial Fraud Detection for Growth Enterprise Market Listed Companies Based on Data Fusion

原文传递

导出

摘要【目的】研究创业板上市公司财务造假检测识别问题,构建异常检测模型对公司财务欺诈进行检测和识别。【方法】构建基于数据融合的财务造假异常检测框架,在数据层融合结构化和文本数据、财务及非财务信息的多源异构数据并构造特征,在信息层组合不同的采样和集成分类模型,在知识层融合领域现状构造模型评价指标。【结果】非平衡处理后模型各项评价指标优于未处理的结果,优化后SMOTE+ENN+LightGBM模型的Fβ达到0.7738。此外,包含多种类型特征的检测结果优于仅包含单类特征的检测结果。【局限】本文方法主要用于发掘市场中可疑的财务造假公司,无法区分和判断具体的造假类别。【结论】非平衡处理有利于提升模型对异常样本的识别能力,融合多源异构数据对财务造假的识别有积极作用,为监管部门检测上市公司财务造假提供了参考。 [Objective]This paper builds ensemble models to detect financial frauds of Growth Enterprise Market(GEM)listed companies.[Methods]We constructed a financial fraud anomaly detection framework based on data fusion.In the data layer,we fused structured,text,and multi-source heterogeneous data to construct financial and non-financial information features.In the information layer,we combined different sampling and ensemble classification models.In the knowledge layer,we fused current domain information to construct the model evaluation indicators.[Results]After non-balance processing,the evaluation indicators of the model were better than those of the un-processed results.The optimized SMOTE+ENN+LightGBM model achieved an F_(β) of 0.7738.In addition,the detection results containing multiple types of features were better than those containing only single-class features.[Limitations]The proposed method mainly identifies suspicious financial fraud companies.It cannot distinguish or determine specific types of fraud.[Conclusions]Non-balance processing is beneficial for improving the model’s ability to find abnormal samples,and the fusion of multi-source heterogeneous data positive affects the identification of financial frauds in listed companies.

作者李爱华王迪文续维佳李子沫姚思涵 Li Aihua;Wang Diwen;Xu Weijia;Li Zimo;Yao Sihan(School of Management Science and Engineering,Central University of Finance and Economics,Beijing 100081,China)

机构地区中央财经大学管理科学与工程学院

出处《数据分析与知识发现》 CSCD 北大核心 2023年第5期33-47,共15页 Data Analysis and Knowledge Discovery

基金国家自然科学基金项目(项目编号:71932008) 中央高校基本科研业务费专项基金项目(项目编号:20170065)的研究成果之一。

关键词财务造假数据融合异常检测非平衡数据 Financial Fraud Data Fusion Anomaly Detection Unbalance Data

分类号 F275 [经济管理—企业管理]

引文网络
相关文献

参考文献13

1张春梅,赵明清,吴学子.基于新闻情感的上市公司财务造假识别方法研究[J].山东科技大学学报（自然科学版）,2021,40(1):91-99. 被引量：3
2余玉苗,吕凡.财务舞弊风险的识别--基于财务指标增量信息的研究视角[J].经济评论,2010(4):124-130. 被引量：26
3袁先智,周云鹏,严诚幸,刘海洋,钱国骐,王帆,韦立坚,李志勇,李波,李祥林,曾途.财务欺诈风险特征筛选框架的建立和应用[J].中国管理科学,2022,30(3):43-54. 被引量：13
4张悦,宋海涛.基于代价敏感学习的财务造假识别研究[J].财会研究,2022(2):22-29. 被引量：5
5姚欣.我国上市公司财务舞弊影响因素实证分析[J].行政事业资产与财务,2019(20):83-84. 被引量：3
6中国银行湖南省分行青年智库审计预警项目组,李书信,倪晴,曹起,李书泉,张倚胜,魏威,刘丽娟,周慧琳,周佳梅,林兰钧,王盼玉,胡晋媛.基于财务造假识别模型的公司授信风险预警研究及应用[J].国际金融,2019(1):30-33. 被引量：1
7吴建华,张颖,原雪梅.动态贝叶斯信用评级的宏观经济冲击模型[J].数理统计与管理,2022,41(6):969-981. 被引量：2
8杜德林,黄洁,王姣娥.基于多源数据的中国智慧城市发展状态评价[J].地球信息科学学报,2020,22(6):1294-1306. 被引量：28
9陈科文,张祖平,龙军.多源信息融合关键问题、研究进展与新动向[J].计算机科学,2013,40(8):6-13. 被引量：68
10王克敏,王华杰,李栋栋,戴杏云.年报文本信息复杂性与管理者自利——来自中国上市公司的证据[J].管理世界,2018,34(12):120-132. 被引量：174

二级参考文献128

1徐勇.上市公司财务困境预测模型实证研究——基于制造业的实例[J].财会通讯（学术版）,2007(1):47-50. 被引量：4
2顾曰国.礼貌、语用与文化[J].外语教学与研究,1992,24(4):10-17. 被引量：1148
3吕锋,王秀青,杜海莲,辛涛.基于信息融合技术故障诊断方法与进展[J].华中科技大学学报（自然科学版）,2009,37(S1):217-221. 被引量：12
4甄峰,席广亮,秦萧.基于地理视角的智慧城市规划与建设的理论思考[J].地理科学进展,2015,34(4):402-409. 被引量：94
5曹阳,甄峰.基于智慧城市的可持续城市空间发展模型总体架构[J].地理科学进展,2015,34(4):430-437. 被引量：69
6王丰龙,王冬根.主观幸福感度量研究进展及其对智慧城市建设的启示[J].地理科学进展,2015,34(4):482-493. 被引量：36
7辛金国,邢莉萍,开家将.舞弊审计程序研究[J].审计研究,2004(4):60-63. 被引量：16
8黄世忠,黄京菁.财务报表舞弊行为特征及预警信号综述[J].财会通讯（上）,2004(12):4-9. 被引量：57
9梁杰,王璇,李进中.现代公司治理结构与会计舞弊关系的实证研究[J].南开管理评论,2004,7(6):47-51. 被引量：120
10徐峰,张铃.基于商空间的非均匀粒度聚类分析[J].计算机工程,2005,31(3):26-28. 被引量：14

共引文献353

1高延歌.企业数字化转型与年报可读性:治理效应抑或噪音效应?[J].投资研究,2024,43(2):121-144.
2刘会芹,施先旺.年报文本信息可读性与股价崩盘风险[J].投资研究,2022,41(7):129-148. 被引量：11
3郑晓瑜,刘俊晗.信号还是噪声?——基于上市公司年报文本变动的研究[J].投资研究,2022,41(4):70-90. 被引量：1
4高雅,刘嫦.管理层讨论与分析披露语调对资产误定价的影响[J].投资研究,2020,39(1):77-91. 被引量：27
5张宏亮,景仕杰,王靖宇.开放式基金大股东与上市公司共享审计师对审计质量的影响研究[J].审计研究,2021(2):56-67. 被引量：6
6王绍凯,杜思臻,张自力,赵学军.管理层陈述能否降低股价崩盘风险?[J].上海金融,2021(11):26-33. 被引量：1
7刘晨,吕可夫,阮永平.实地调研抑制了上市公司的选择性披露吗?[J].外国经济与管理,2021(2):20-35. 被引量：12
8翟淑萍,甦叶,袁克丽.分析师实地调研与企业分类转移盈余管理[J].会计与经济研究,2022,36(3):33-53. 被引量：2
9孙炜初,孙光国.互动式信息披露与股价波动性[J].会计与控制评论,2021(2):22-53.
10闫伟宸,高思悦.高管团队的社会关系与企业创新——基于“本家关系”的视角[J].会计研究,2022(2):70-85. 被引量：8

同被引文献19

1陈孝新.上市公司财务欺诈的识别模型[J].统计与决策,2005,21(07S):44-45. 被引量：7
2余玉苗,吕凡.财务舞弊风险的识别--基于财务指标增量信息的研究视角[J].经济评论,2010(4):124-130. 被引量：26
3王飞.iLOF*:一种改进的局部异常检测算法[J].计算机系统应用,2015,24(12):233-238. 被引量：8
4杨芳,刘端,汪子文.现金流量指标在上市公司财务欺诈识别中应用的实证研究[J].金融经济（下半月）,2006,0(8):122-124. 被引量：2
5顾国庆,李晓辉.基于箱线图异常检测的指数加权平滑预测模型[J].计算机与现代化,2021(1):28-33. 被引量：11
6陈适宜.一种基于XGboost的异常检测算法[J].电脑知识与技术,2021,17(2):188-189. 被引量：2
7刘志硕,彭涛,侯娜.基于局部异常因子算法的首都机场航班延误预警研究[J].民航学报,2022,6(2):21-25. 被引量：2
8冯华伟.基于深度神经网络的异常财务数据识别方法[J].电子设计工程,2022,30(10):31-35. 被引量：6
9聂文芳.基于卷积神经网络的学生课堂参与度评价系统设计[J].信息与电脑,2022,34(5):79-81. 被引量：2
10加雪莲,谌颃.基于自编码器神经网络的会计异常数据自动审计方案[J].贵阳学院学报（自然科学版）,2022,17(3):73-78. 被引量：2

引证文献3

1刘柯倩.基于大数据和卷积神经网络的财务数据异常告警方法[J].信息与电脑,2023,35(15):52-54. 被引量：1
2薛浩,马静,郭小宇.基于Focal Loss改进LightGBM的供水管网毛刺数据检测[J].计算机与现代化,2024(9):74-81.
3付秀莲,肖惠予.企业财务欺诈异常检测及其最新进展[J].现代管理,2024,14(4):566-573.

二级引证文献1

1肖潇,牛晓雷,贤柱英,郭壮军,韦海.基于卷积神经网络的输电现场作业风险告警方法[J].长江信息通信,2024,37(5):19-21.

1李晓欢,霍科辛,颜晓凤,唐欣,徐韶华.基于特征加权视觉增强的雷视融合车辆检测方法[J].公路交通科技,2023,40(2):182-189. 被引量：3
2郭政,吴武清,刘源,曾志武,杨玎.基于多任务支持向量机的能源互联网数据深度融合方法[J].计算机应用与软件,2023,40(3):22-27. 被引量：2
3陆铭,许彩娟.人造板甲醛释放量检测试件平衡处理装置研制[J].中国人造板,2023,30(9):27-29.
4黄珺,汪玉荷,韩菲菲,李云.ESG信息披露:内涵辨析、评价方法与作用机制[J].外国经济与管理,2023,45(6):3-18. 被引量：38
5双莉华,黄康,吴晨.分析无偿献血者乙型肝炎病毒酶免检测和核酸检测的检测结果[J].当代医学,2023,29(2):178-180.
6刘偲,舒婷.血涂片镜检在临检工作中的重要性[J].中文科技期刊数据库（全文版）医药卫生,2023(9):12-14.
7李小东,李涵,陈平.会计师事务所受托审计风险及应对策略[J].理财（审计）,2023(8):9-11. 被引量：1
8王志强,王姿旖,王庆德,徐华福.基于LightGBM的区块链异常交易检测技术研究[J].信息安全研究,2023,9(9):877-883. 被引量：1
9张广琪,甘芝霖,杨阳,高玮蔓.基于红外光谱技术的蜂蜜理化性质快速检测[J].农业工程学报,2023,39(10):275-284. 被引量：4
10长期“霸占”园区收益万科物业被业主告上法庭[J].中国消费者,2023(6):9-9.

数据分析与知识发现

2023年第5期

浏览历史

内容加载中请稍等...

基于多数据源融合的创业板上市公司财务造假异常检测被引量：3

参考文献13

二级参考文献128

共引文献353

同被引文献19

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多数据源融合的创业板上市公司财务造假异常检测 被引量：3

参考文献13

二级参考文献128

共引文献353

同被引文献19

引证文献3

二级引证文献1

相关作者

相关机构

相关主题

浏览历史

基于多数据源融合的创业板上市公司财务造假异常检测被引量：3