基于神经网络的混合数据的因果发现

Causal Discovery of Mixed Data Based on Neural Network

下载PDF

导出

摘要因果推理正在成为机器学习领域一个越来越受关注的研究热点,现阶段的因果发现主要是在研究某一种假设条件下,基于纯粹的观测数据推断变量之间的因果方向。然而在现实世界中观察到的数据往往是由一些假设生成,使得传统因果推断方法的识别率不高、稳定性较差。针对当前的问题,提出了一种基于神经网络来解决混合数据因果推断的方法。该方法在混合加性噪声模型(ANM-MM)的假设下,使用梯度下降法最优化改进的损失函数得到混合数据的抽象因果分布参数,然后将分布参数看作是原因变量和结果变量之间的隐变量,通过比较原因变量和分布参数之间的HilberSchmidt独立性来确定二元变量的因果方向。在理论上证明了该方法的可行性,并通过实验表明该算法在人工数据和真实数据的表现较传统的IGCI,ANM,PNL,LiNGAM,SLOPE方法具有较好的准确率和稳定性。 Causal discovery is becoming a research hotspot in the field of machine learning. At present,the causal discovery is mainly to investigate the causal direction between variables based on pure observation data under the study of a certain assumption. However,the data observed in the real world is often generated by some assumptions,which makes the traditional causal inference method less accurate and less stable. Aiming at the current problem,a method based on neural network to solve the causal inference of mixed data is proposed. Under the assumption of additive noise model-mixture model(ANM-MM),the gradient loss method is used to optimize the improved loss function to obtain the abstract causal distribution parameters of the mixed data,and then the distribution parameters are regarded as hidden variable between the cause variable and the result variable. The hidden variable determines the causal direction of the binary variable by comparing the HilberSchmidt independence between the causal variable and the distribution parameter. The feasibility of the method is proved theoretically. The experiment shows that the proposed algorithm has better accuracy and stability than the traditional methods like IGCI,ANM,PNL,LiNGAM and SLOPE.

作者耿家兴万亚平李洪飞 GENG Jia-xing;WAN Ya-ping;LI Hong-fei(School of Computer Science,University of South China,Hengyang 421001,China;CNNC Key Laboratory on High Trusted Computing,Hengyang 421001,China)

机构地区南华大学计算机学院中核集团高可信计算重点学科实验室

出处《计算机技术与发展》 2020年第5期26-31,共6页 Computer Technology and Development

基金国家自然科学基金(11805093) 中央军委科技委创新特区项目(17-163-15-XJ-002-002-04) 湖南省教育重点项目(17A185) 湖南省自然科学基金资助项目(2019JJ0486)。

关键词神经网络混合加性噪声因果推断梯度下降 HilberSchmidt独立性 neural network mixed additive noise causal inference gradient descent HilberSchmidt independence

分类号 TP181 [自动化与计算机技术—控制理论与控制工程]

引文网络
相关文献

参考文献2

1赵森栋,刘挺.因果关系及其在社会媒体上的应用研究综述[J].软件学报,2014,25(12):2733-2752. 被引量：15
2郝志峰,陈薇,蔡瑞初,黄瑞慧,温雯,王丽娟.基于典型因果推断算法的无线网络性能优化[J].计算机应用,2016,36(8):2114-2120. 被引量：2

二级参考文献23

1白俊杰,何长艳.No.7信令网的网络优化[J].天津通信技术,2004(4):52-53. 被引量：4
2周文静.无线网络优化方式新思路的探讨[J].广东通信技术,2006,26(12):2-6. 被引量：8
3卢纪宇,白波.GSM无线网络的优化[J].电信技术,2006(12):60-62. 被引量：1
4AGRAWAL R, MANNILA H, SRIKANT R, et al. Fast discovery of association rules [ M]//Advances in Knowledge Discovery and Data Mining. Menlo Park, CA: American Association for Artificial Intel- ligence, 1996:307-328.
5CAI R, ZHANG Z, HAO Z. BASSUM: a Bayesian semi-super- vised method for classification feature selection [ J]. Pattern Rec- ognition, 2011, 44(4) : 811 -820.
6PEARL J. Causality: Models, Reasoning and Inference [ M]. 2nd ed. Cambridge, UK: Cambridge University Press, 2009:49 -51.
7HOYER P O, JANZING D, MOOIJ J M, et al. Nonlinear causal discovery with additive noise models [ C] // Advances in Neural In- formation Processing Systems 21. Cambridge, MA: MIT Press, 2008:689 - 696.
8XIE X, GENG Z. A recursive method for structural learning of di- rected acyclic graphs [ J]. Journal of Machine Learning Research, 2008, 9:459-483.
9HAN L, SONG G, CONG G, et al. Overlapping decomposition for causal graphical modeling [ C]//KDD '12: Proceedings of the 18th ACM SIGKDD International Conference on Knowledge Discovery and Data Mining. New York: ACM, 2012:114-122.
10TSAMARDINOS I, BROWN L E, ALIFERIS C F. The max-min hill-climbing Bayesian network structure learning algorithm [ J]. Machine Learning, 2006, 65(1): 31-78.

共引文献15

1漆小红,于洋,孟媛媛.基于例证条件下的竞技体育大数据变革分析[J].山东体育科技,2016,38(1):29-32. 被引量：1
2贾君枝,冯婕.基于因果链求解算法的人物关系挖掘研究——以Wikidata知识库为例[J].情报学报,2017,36(3):221-230. 被引量：5
3王小伟.基于重叠分片法的网络顽健性动态增强仿真[J].计算机仿真,2020,37(3):288-291.
4蔡瑞初,谢泳,陈薇,曾艳,郝志峰,杜文俊.面向社交媒体的直接因果网络发现算法[J].计算机应用研究,2020,37(9):2689-2693. 被引量：2
5鞠海龙,彭珺.基于评论挖掘的用户购买行为因果事理图谱分析[J].情报科学,2021,39(10):170-177. 被引量：8
6魏少伟,任爱新,赵靖暄,杨信廷,李明,刘慧英.北京地区秋季日光温室黄瓜白粉病预测的贝叶斯网络模型研究[J].中国瓜菜,2022,35(2):20-27. 被引量：1
7赵凯华,徐建民,鲍彩倩.一个基于信念网络的微博推荐模型[J].河北大学学报（自然科学版）,2022,42(4):438-448. 被引量：2
8郝志峰,陈正鸣,谢峰,陈薇,蔡瑞初.一种任意分布下的隐变量因果结构学习算法[J].计算机工程,2022,48(9):121-129. 被引量：1
9郭楠,黄慧慧.面向偏差问题的推荐方法研究综述[J].计算机应用研究,2022,39(10):2881-2890. 被引量：3
10江波,章恒远,魏雨昂.如何判定自适应学习系统的有效性——基于因果结构分析框架[J].现代远程教育研究,2023,35(2):95-101. 被引量：6

1杨凌云,谭辉.农药领域发明专利中“简单实验数据”的有效性和证明力分析[J].中国发明与专利,2019,16(S02):132-137.
2雷波.计算机图像处理与识别技术应用研究[J].信息与电脑,2020,32(6):124-126. 被引量：7
3高善文.疫情对中国经济影响几何[J].清华金融评论,2020,0(3):58-59.
4刘明检.1例急性完全性脊髓炎运动治疗个案报告[J].中国伤残医学,2020,28(7):65-66.
5刘俊霞,陈槐,薛丹,高永恒,刘建亮,杨军.微生物介导的甲烷厌氧氧化过程及其影响因子研究进展[J].生态学杂志,2020,39(3):1033-1044. 被引量：8
6陈文文,郑文铝,余硕,花晨,戴秋云.马尔堡病毒GP蛋白C肽的抑制活性及作用机理研究[J].生物技术通讯,2020,31(1):44-50. 被引量：1

计算机技术与发展

2020年第5期

浏览历史

内容加载中请稍等...

基于神经网络的混合数据的因果发现

参考文献2

二级参考文献23

共引文献15

相关作者

相关机构

相关主题

浏览历史