-
题名基于并行随机森林的审计大数据疑点预测
被引量:6
- 1
-
-
作者
卢利娟
余从容
梁东贵
张伟政
-
机构
广州供电局有限公司
-
出处
《计算机与数字工程》
2019年第1期174-179,共6页
-
基金
国家自然科学基金(编号:61501337)
中国南方电网有限责任公司科研项目"基于大数据分析技术的数据式审计方式方法手段的研究和应用"(编号:GZHKJXM20160060)资助
-
文摘
为使审计计划的制定具有科学的数据支撑,在审计大数据背景下,提出基于并行改进随机森林算法的审计疑点预测算法。首先建立基于Hadoop的电力企业审计大数据管理方案,将各电网子系统采集到的异构审计数据整合并存储,在此基础上,实现基于三层MapRaduce的并行化随机森林算法预测审计疑点概率,在保证预测精度的情况下,提高算法运行效率,以满足大数据处理需要。实验结果表示,提出的并行算法运行速率满足大数据要求,预测精确度要优化常用的决策树算法。
-
关键词
审计疑点预测
随机森林算法
并行化改进
HADOOP
-
Keywords
audit problem prediction
random forest algorithm
parallelization improvements
Hadoop
-
分类号
TP393.0
[自动化与计算机技术—计算机应用技术]
-