非图宾根基准下LLM ChatGPT的因果发现和因果推理能力

Causal Discovery and Causal Inference of LLM ChatGPT under Non-Tubingen Benchmarks

下载PDF

导出

摘要基于图宾根基准在多学科的因果测试,建立了不同于该基准的两个变量的因果关系对(人文社会科学)因果关系数据库;在此基础上分析了LLM在新的基准下因果发现中的能力和问题;探讨了在因果估计阶段,系统在数据或条件不充分下的因果推理能力。期望LLM以一种新的、友好的因果研究范式与传统方法结合,为我们日常处理因果问题提供全新的助力。 Based on the Tubingen benchmark for causal testing in multiple disciplines,we built a causal database of causal pairs(humanities and social sciences)for two variables different from the benchmark;on this basis,we analyzed the capabilities and problems of LLM in causal discovery under the new benchmark;and then explored the capabilities of the system for causal inference under insufficient data or conditions in the causal estimation stage.It is expected that LLM provide a new boost to our daily treatment of causal problems with a new and friendly causal research paradigm combined with traditional methods.

作者邱德钧 Qiu Dejun(School of Philosophy and Sociology,Lanzhou University Lanzhou 730000,China)

机构地区兰州大学哲学社会学院

出处《科学．经济．社会》 2023年第3期27-39,共13页 Science Economy Society

基金国家社会科学基金“人工智能中关于因果关系的归纳模型研究”(20BZX107)。

关键词 LLM 图宾根基准因果发现因果估计 LLM ChatGPT Tubingen benchmark causal discovery causal estimation

分类号 B815 [哲学宗教—逻辑学]

引文网络
相关文献

1魏月娥,石映坤.血液透析治疗肾病综合征致急性肾衰竭的临床分析[J].中文科技期刊数据库（全文版）医药卫生,2020(9):0026-0027.
2王争荣.腰椎间盘突出症保守治疗中腰背肌锻炼的价值探究[J].中文科技期刊数据库（全文版）医药卫生,2020(12):0055-0056.
3苏建宾,陈都鑫,郑东海,苏阳,李新.追索为什么?地球系统科学中的因果推理[J].中国科学：地球科学,2023,53(10):2199-2216.
4王倩.中药外敷减轻化疗消化道毒副反应的临床评价[J].中文科技期刊数据库（全文版）医药卫生,2020(11):0255-0256.
5申薇娅,吴明霞.母亲抑郁对母亲养育压力的影响:父母反省功能的中介作用[J].心理学进展,2023,13(10):4311-4319.
6张盟沛,付慧媛.互联网工单业务智能小助手应用的设计与实现[J].自动化应用,2023,64(18):64-65.
7袁远.规范出具商定程序报告的一些体会[J].中国注册会计师,2023(9):86-88.
8申腾.ZPW-2000A型无绝缘轨道电路调谐区故障分析研究[J].设备管理与维修,2023(18):26-27.
9范鹏宇,谌力群,朱辉严,吴驰,郑永生.CT平扫影像特征及临床危险因素预测脑出血血肿扩大的评分系统分析[J].智慧健康,2023,9(19):1-4.
10刘福星,贺娟,吴汉辉,冯中朝.政策性农业保险的收入效应分析——来自华中3省的微观调查[J].中国农业资源与区划,2023,44(8):202-212.

科学．经济．社会

2023年第3期

浏览历史

内容加载中请稍等...

非图宾根基准下LLM ChatGPT的因果发现和因果推理能力

相关作者

相关机构

相关主题

浏览历史