基于迭代式聚类的审计疑点发现——以上市公司财报数据为例被引量：15

Iterative Clustering Method for Detecting Audit Doubts——Based on financial statements data of listed companies

下载PDF

导出

摘要数据库查询技术作为目前计算机审计的主要方法,是一种通过审计人员先验知识发现审计疑点的方法。但当缺乏相关审计知识时,便难以给出从海量数据中发现疑点的方法。为破解这一难题,提出基于迭代式聚类的审计疑点发现方法。该方法可在无先验知识的情形下,通过对审计指标的分析,将与大多数被审计对象行为明显相异的少数对象自主识别为审计疑点。利用多种非结构化信息及网络爬取技术,从140份审计报告中自动提取出高频审计问题并据此选定财务指标;归集2008—2012年913家上市公司的财报数据,应用迭代式聚类方法,挖掘出68家疑点公司进行分析。并利用证监会等机构的非结构化网络信息,验证了此方法的有效性。验证结果表明:迭代式聚类方法有助于从海量数据中自主发现审计疑点,缩小疑点筛查范围,提高审计效率。 As a main IT audit method at present, audit method based on database query technology utilizes prior knowledge of auditors to find out audit doubts. However, when lack of relevant knowledge, auditors can hardly identify doubtful points in mass audit data. In this situation, clustering technology can automatically detect audit doubts explicitly different from majority auditees by analyzing audit indicators. We took advantage of various unstructured information and web crawling technology, automatically extracted audit findings with high frequency from 140 audit reports and selected financial indicators, collected financial statements data of 913 listed companies from 2008 to 2012, and run iterative clustering. Finally, we dug out 68 companies with audit doubts. Wecompared our results with the unstructured information disclosed by China Securities Regulatory Commission and other organizations, and proved the effectiveness of this method.

作者杨蕴毅孙中和卢靖

机构地区审计署计算机技术中心

出处《审计研究》 CSSCI 北大核心 2015年第4期60-66,共7页 Auditing Research

基金国家科技支撑计划项目(项目批准号:2012BAH08B02) 国家自然科学基金项目(项目批准号:71272216) 教育部人文社会科学研究(项目批准号:13YJCZH143)联合资助

关键词计算机审计聚类审计疑点海量数据 IT audit, iterative clustering method, audit doubts, mass data

分类号 F239.6 [经济管理—会计学]

引文网络
相关文献

参考文献11

1陈丹萍.数据挖掘技术在现代审计中的运用研究[J].南京审计学院学报,2009,6(2):57-61. 被引量：24
2方新丽.浅议数据挖掘技术在计算机审计中的应用[J].电脑知识与技术,2013,9(5X):3445-3446. 被引量：4
3韩家炜.数据挖掘概念与技术[M].北京:机械工业出版社,2004.
4蒋超.数据挖掘技术在计算机审计中的应用研究[J].中国管理信息化,2014,17(20):18-19. 被引量：4
5吕新民,王学荣.数据挖掘在审计数据分析中的应用研究[J].审计与经济研究,2007,22(6):35-38. 被引量：24
6王会金.中观信息系统审计风险控制体系研究——以COBIT框架与数据挖掘技术相结合为视角[J].审计与经济研究,2012,27(1):16-23. 被引量：24
7汪荣鑫.数理统计[M].西安交通大学出版社,2004.198,209.
8王伟钧,马晓凯.基于证券行业半结构化数据的抽取技术[J].成都大学学报（自然科学版）,2008,27(2):127-130. 被引量：4
9应里孟.计算机审计领域几个相关概念之辨析[J].中国农业会计,2013(6):14-15. 被引量：2
10易仁萍,王昊,朱玉全.基于数据挖掘的审计模型框架[J].中国审计,2003(3):55-57. 被引量：16

二级参考文献45

1张振亚,李金龙,罗文坚,王煦法.基于事件发现的审计线索发现[J].审计研究,2006(S1):67-70. 被引量：2
2黄永平.孤立点分析方法在计算机审计中的应用[J].审计研究,2006(S1):86-89. 被引量：9
3钱进,孟祥萍,徐冬寅.一种有效的关联规则增量式更新算法[J].长春工程学院学报（自然科学版）,2003,4(3):11-14. 被引量：4
4薛跃,韩之俊,章亚南,王雪荣.应用数据挖掘技术提高虚假财务报告识别效率[J].现代管理科学,2004(8):5-6. 被引量：5
5吴沁红.信息技术环境下财务审计与信息系统审计的比较[J].中国注册会计师,2004(8):38-40. 被引量：4
6申向东,张海潮.基于加权关联规则的入侵检测研究[J].现代电子技术,2004,27(18):74-76. 被引量：2
7黄修丹.数据挖掘领域中的聚类分析及应用[J].闽江学院学报,2004,25(5):44-47. 被引量：5
8邹宏,陈海,魏勍颋.基于数据挖掘的入侵检测技术研究[J].计算机与现代化,2005(4):39-41. 被引量：6
9金文,张金城.基于COBIT的信息系统管理、控制与审计的模型构建研究[J].审计研究,2005(4):75-79. 被引量：29
10张文婧.基于数据挖掘的审计风险决策[J].商业经济,2006(3):47-49. 被引量：5

共引文献100

1张振亚,李金龙,罗文坚,王煦法.基于事件发现的审计线索发现[J].审计研究,2006(S1):67-70. 被引量：2
2李明.基于决策树的数据检测模式获取[J].计算机时代,2005(7):37-38. 被引量：1
3汪周华,郭平,周克明,张地洪,王丽,高慧君.酸性天然气拟临界参数计算式[J].石油与天然气化工,2005,34(4):310-314. 被引量：2
4刘启诚.合作建立销售服务中心将是一个趋势[J].通信世界,2005(41):23-23.
5武永成,蔡之华.一种基于遗传算法的用于排序(Ranking)的分类方法[J].计算机与现代化,2006(10):32-34.
6郭强,陈芳芸.企业执行风险预警的智能化研究[J].山西财经大学学报,2006,28(5):86-92. 被引量：3
7常启军.计算机审计模式研究述评[J].财会通讯（学术版）,2008(6):81-83. 被引量：4
8武永成.一种新的代价敏感分类方法[J].计算机与现代化,2009(3):73-75. 被引量：1
9梁雪芳,别荣芳,段季芳,付增梅.基于人工免疫网络的k-平均聚类算法的研究[J].北京师范大学学报（自然科学版）,2009,45(2):152-155. 被引量：1
10段季芳,梁雪芳,别荣芳,林定移.基于免疫算法的频繁项集挖掘[J].北京师范大学学报（自然科学版）,2009,45(2):161-163. 被引量：1

同被引文献155

1黄丹阳,毕博洋,朱映秋.基于高斯谱聚类的风险商户聚类分析[J].统计研究,2021,38(6):145-160. 被引量：4
2宋建波,冯晓晴.关键审计事项信息含量与公司债券发行定价——基于文本相似度视角[J].会计研究,2022(3):174-191. 被引量：24
3张德勇.利用业务跟踪法开展信息系统审计的一个案例[J].审计研究,2006(S1):105-107. 被引量：3
4丛秋实,黄作明,柳巧玲.面向服务架构的计算机审计系统研究[J].审计与经济研究,2013,28(2):35-41. 被引量：7
5赵劲松.对我国政府审计开展计算机审计的理论思考[J].中国管理信息化,2005,8(6):20-21. 被引量：3
6石爱中.审计学的学科属性及其教学要求[J].审计与经济研究,2005,20(4):3-6. 被引量：143
7王飞跃.社会计算——科学、技术与人文的数字化动态交融[J].中国基础科学,2005,7(5):5-12. 被引量：41
8宋常,胡家俊,陈宋生.关于绩效审计研究的新思考[J].审计与经济研究,2006,21(1):3-9. 被引量：39
9陈伟,刘思峰,邱广华.计算机审计中数据处理新方法探讨[J].审计与经济研究,2006,21(1):37-39. 被引量：20
10吕新民,王学荣.数据挖掘在审计数据分析中的应用研究[J].审计与经济研究,2007,22(6):35-38. 被引量：24

引证文献15

1裴育,郑石桥.电子数据审计的技术属性和逻辑过程:一个理论分析框架[J].江苏社会科学,2016(6):37-44. 被引量：19
2郝玉贵,徐远洒.大数据驱动的审计研究主题与趋势——基于中国知网2012-2016核心期刊文献来源[J].杭州电子科技大学学报（社会科学版）,2017,13(2):1-6. 被引量：2
3邵锦炜,林俊,刘雅婷,肖嘉丽.基于改进Leaders算子的审计潜在疑点发现[J].计算机与现代化,2018(4):79-83.
4常远,康娜娜.K-means聚类在审计疑点发现中的应用探索[J].中国注册会计师,2018(5):84-86. 被引量：4
5吕天阳,杨蕴毅,邱玉慧.审计大数据的提出、特征及挑战[J].财会月刊,2018(3):142-150. 被引量：22
6王雪荣,孟永佳,庄建玲.计算机辅助审计技术在投资审计中的应用研究[J].商业会计,2019,0(7):48-51. 被引量：6
7陈旭,陈红平.孤立点分析在审计疑点发现中的应用探讨——基于K-Means聚类算法的Python实现[J].会计之友,2019,0(17):72-76. 被引量：6
8王珍.基于数据挖掘的计算机审计方法现状分析及改进策略[J].科学与信息化,2019,0(26):30-30.
9杨柔坚,李洋,苏艳阳.基于大数据的政策跟踪审计方法研究——以就业政策跟踪审计为例[J].审计研究,2020(4):28-34. 被引量：29
10叶苗苗,徐四星.大数据审计平台的构建与实施方法[J].财政监督,2020(19):99-104. 被引量：10

二级引证文献107

1后小仙,郑田丹.政策落实跟踪审计特征提取、问题聚焦及优化建议——基于国家审计公告的文本量化分析[J].中国审计评论,2024(1):35-54.
2李曼,陈紫昀.内部审计促进组织落实国家重大政策措施的路径——基于政策措施落实难度和执行主体能力的分析[J].中国审计评论,2023(2):30-42.
3高思凡.新兴技术驱动下审计活动的数字化转型:主体、客体和方法[J].中国审计评论,2021(1):104-119.
4祁渊,张莉,朱琦.智慧审计的理论框架与实践探索[J].会计与控制评论,2022(1):95-113.
5王彪华,王帆,刘国梁.政策落实跟踪审计能够降低区域碳排放吗——基于“三大攻坚战”政策跟踪的研究[J].会计研究,2023(12):146-158.
6程平,陈锐,付元承,徐婧.基于深度去噪自编码器的智能内部审计预警研究[J].中国注册会计师,2024(9):74-84.
7罗蕾.对大数据时代下注册会计师审计的思考[J].大众投资指南,2020(24):121-122.
8金小良.研究型审计:一个概念的理论蕴含与时代价值[J].财务管理研究,2023(12):74-81. 被引量：2
9孙钰鹏.后扶贫时代政策落实跟踪审计的长效机制构建[J].财务管理研究,2023(6):140-150.
10檀磊.大数据审计平台的构建与实施方法[J].财经界,2021(8):167-168. 被引量：4

1肖文英.浅谈捕捉审计疑点和查证的技巧[J].内蒙古科技与经济,2005(18):77-78.
2谭绍军,范梅艳.捕捉审计疑点的方法[J].中国内部审计,2011(7):74-74.
3侯玮昀.发现审计疑点的方法[J].中国审计,2015,0(1):66-67. 被引量：1
4林伟庆.账表证之外的几种审计疑点发现方法[J].审计与理财,2010(4):28-28.
5郭新.从奇异处发现审计疑点[J].中国审计,2008(24):56-56.
6卢义.在会计账表查证以外的审计技巧[J].审计文摘,2007(4):48-48.
7张丽.提高非现场审计疑点核实准确率之我见[J].现代商业银行导刊,2008(7):57-59.
8周海良.恪守职业道德维护审计尊严[J].中国审计,2016,0(18):87-87.
9李梦云.浅谈捕捉审计疑点和查证的技巧[J].经济视角（下）,2007,0(10):94-95.
10叶颖立.新会计准则的实施对上市公司财务的影响[J].现代商业,2008(30):240-240.

审计研究

2015年第4期

浏览历史

内容加载中请稍等...

基于迭代式聚类的审计疑点发现——以上市公司财报数据为例被引量：15

参考文献11

二级参考文献45

共引文献100

同被引文献155

引证文献15

二级引证文献107

相关作者

相关机构

相关主题

浏览历史

基于迭代式聚类的审计疑点发现——以上市公司财报数据为例 被引量：15

参考文献11

二级参考文献45

共引文献100

同被引文献155

引证文献15

二级引证文献107

相关作者

相关机构

相关主题

浏览历史

基于迭代式聚类的审计疑点发现——以上市公司财报数据为例被引量：15