目的比较BIC估计法与MCMC近似法两种后验概率法在贝叶斯基准剂量估计中的稳健性,并为山西省洪洞县儿童羟基代谢物可接受剂量的制定提供参考建议。方法首先介绍基于BIC估计法和MCMC近似法计算后验权重的原理,模拟研究选用Integrated Risk...目的比较BIC估计法与MCMC近似法两种后验概率法在贝叶斯基准剂量估计中的稳健性,并为山西省洪洞县儿童羟基代谢物可接受剂量的制定提供参考建议。方法首先介绍基于BIC估计法和MCMC近似法计算后验权重的原理,模拟研究选用Integrated Risk Information System数据库中不同剂量-反应数据集共30个,分析比较两种方法的优劣,并在实例研究中采用权重法进行数据整合。结果模拟研究结果显示在所研究的30个数据集中BIC估计法在BMR为0.01时有4个数据集出现BMDL预测失败的情况,在BMR为0.001时有1个数据集出现BMD预测失败的情况,以及6个数据集出现BMDL预测失败的情况。MCMC近似法计算的BMD/BMDL在每一种模型都有70%以上的数据集高于BIC估计法得到的BMD/BMDL。实例分析表明符合洪洞县儿童体内羟基代谢物剂量-反应关系的模型有linear(P=0.13,β=14.3%)、logistic(P=0.06,β=9.5%)、Weibull(P=0.14,β=10.6%)、multistage(P=0.15,β=31.1%)、Hill(P=0.21,β=34.6%)。在BMR为0.001的情况下,洪洞县儿童体内八种羟基代谢物(2-OHN、1-OHN、9-OHF、2-OHF、2-OHphe、1-OHphe、1-OHBaP、3-OHBaP)的可接受剂量(μmol/mol)依次为0.577μmol/mol、1.546μmol/mol、8.135μmol/mol、0.359μmol/mol、0.120μmol/mol、0.098μmol/mol、0.044μmol/mol、0.003μmol/mol。结论MCMC近似法在BMD估计中具有较好的稳定性和鲁棒性。展开更多
大语言模型(Large Language Models,LLMs)目前正在重塑各行各业的学习方式、思维模式和研究范式。如何使LLMs与行业结合、重构LLMs与行业的关系,是推动企业数字化变革和社会发展的重要命题。要实现LLMs在垂域发挥重要作用,最重要的是提...大语言模型(Large Language Models,LLMs)目前正在重塑各行各业的学习方式、思维模式和研究范式。如何使LLMs与行业结合、重构LLMs与行业的关系,是推动企业数字化变革和社会发展的重要命题。要实现LLMs在垂域发挥重要作用,最重要的是提升LLMs的推理能力。本文以如何提升LLMs在会计领域的推理能力为起点,提出会计垂域推理能力的概念、研究路径、评测标准,分析中文开源模型清华智谱的GLM系列的评测结果,为后续的推理研究提供标准范式,并为如何提升会计推理能力提供评价标准,力图推动LLMs在会计领域达到应有水平。同时,为验证LLMs的会计推理能力,本文比较了GLM-6B、GLM-130B、GLM-4在算术推理能力和会计常识推理能力方面的差别,并将OPENAI的GPT-4作为基准进行分析。结果表明,在不同推理提示工程下,模型规模显著影响推理能力,虽然各种模型算术推理能力已经得到极大的提高,但是会计推理能力还远不能达到应用水平,需要在应用中逐层优化,研究为LLMs会计垂域进入应用实践的优化过程提供参考。展开更多
文摘目的比较BIC估计法与MCMC近似法两种后验概率法在贝叶斯基准剂量估计中的稳健性,并为山西省洪洞县儿童羟基代谢物可接受剂量的制定提供参考建议。方法首先介绍基于BIC估计法和MCMC近似法计算后验权重的原理,模拟研究选用Integrated Risk Information System数据库中不同剂量-反应数据集共30个,分析比较两种方法的优劣,并在实例研究中采用权重法进行数据整合。结果模拟研究结果显示在所研究的30个数据集中BIC估计法在BMR为0.01时有4个数据集出现BMDL预测失败的情况,在BMR为0.001时有1个数据集出现BMD预测失败的情况,以及6个数据集出现BMDL预测失败的情况。MCMC近似法计算的BMD/BMDL在每一种模型都有70%以上的数据集高于BIC估计法得到的BMD/BMDL。实例分析表明符合洪洞县儿童体内羟基代谢物剂量-反应关系的模型有linear(P=0.13,β=14.3%)、logistic(P=0.06,β=9.5%)、Weibull(P=0.14,β=10.6%)、multistage(P=0.15,β=31.1%)、Hill(P=0.21,β=34.6%)。在BMR为0.001的情况下,洪洞县儿童体内八种羟基代谢物(2-OHN、1-OHN、9-OHF、2-OHF、2-OHphe、1-OHphe、1-OHBaP、3-OHBaP)的可接受剂量(μmol/mol)依次为0.577μmol/mol、1.546μmol/mol、8.135μmol/mol、0.359μmol/mol、0.120μmol/mol、0.098μmol/mol、0.044μmol/mol、0.003μmol/mol。结论MCMC近似法在BMD估计中具有较好的稳定性和鲁棒性。
文摘大语言模型(Large Language Models,LLMs)目前正在重塑各行各业的学习方式、思维模式和研究范式。如何使LLMs与行业结合、重构LLMs与行业的关系,是推动企业数字化变革和社会发展的重要命题。要实现LLMs在垂域发挥重要作用,最重要的是提升LLMs的推理能力。本文以如何提升LLMs在会计领域的推理能力为起点,提出会计垂域推理能力的概念、研究路径、评测标准,分析中文开源模型清华智谱的GLM系列的评测结果,为后续的推理研究提供标准范式,并为如何提升会计推理能力提供评价标准,力图推动LLMs在会计领域达到应有水平。同时,为验证LLMs的会计推理能力,本文比较了GLM-6B、GLM-130B、GLM-4在算术推理能力和会计常识推理能力方面的差别,并将OPENAI的GPT-4作为基准进行分析。结果表明,在不同推理提示工程下,模型规模显著影响推理能力,虽然各种模型算术推理能力已经得到极大的提高,但是会计推理能力还远不能达到应用水平,需要在应用中逐层优化,研究为LLMs会计垂域进入应用实践的优化过程提供参考。