-
题名审计大数据下模糊匹配审计证据获取方法研究
被引量:4
- 1
-
-
作者
林俊
方宽
-
机构
广东电网有限责任公司
-
出处
《计算机与数字工程》
2018年第4期758-763,778,共7页
-
基金
国家自然科学基金项目<基于多特征融合的自发表情识别研究>(编号:61672199)
国家自然科学基金项目<自然和谐的人机交互中人脸表情识别研究>(编号:61100100)资助
-
文摘
针对大数据审计面临的运行效率和审计证据有效获取问题,在分析得到不同数据源中的相似重新审计数据可能为舞弊数据的基础上,提出一种基于模糊匹配的审计证据获取方法,首先通过引入位置参数改进外存倒排索引结构,并采用非对称查询模式自适应地选择待匹配数据,实现审计大数据表格公共字段的快速模糊匹配,保证了算法在大数据下的运行效率,其次在公共字段匹配基础上,对字段内数据进一步进行相似性判断,从而发现相似审计舞弊数据,获得审计证据。实验结果表明,算法保证了审计证据的有效获取,减少了数据处理的运行时间,提高了数据处理的效率。
-
关键词
审计证据获取
模糊匹配
外存倒排索引
编辑距离
-
Keywords
audit evidence obtaining
fuzzy matching
external memory inverted index
edit distance
-
分类号
TP393.0
[自动化与计算机技术—计算机应用技术]
-