期刊文献+
共找到16篇文章
< 1 >
每页显示 20 50 100
基于SHAP值机器学习的江西暖季暴雨预报因子重要性分析
1
作者 夏侯杰 肖安 《气象与减灾研究》 2024年第1期12-23,共12页
机器学习模型(Machine Learning,ML)的不可解释性给其在气象业务中的应用带来了挑战。模型解释和可视化是解决这一问题的有效途径。文中将SHAP值应用于天气预报ML模型解释,研究了江西省暖季暴雨模型的预报因子对预报结果的影响。分别选... 机器学习模型(Machine Learning,ML)的不可解释性给其在气象业务中的应用带来了挑战。模型解释和可视化是解决这一问题的有效途径。文中将SHAP值应用于天气预报ML模型解释,研究了江西省暖季暴雨模型的预报因子对预报结果的影响。分别选取2016—2020年、2021—2022年4—9月ECWMF(European Centre for Medium-Range Weather Forecasts)高分辨率数值模式物理量及国家站降水观测数据进行XGBoost建模与模型解释。结果表明,全局重要性排名前4位依次是总降水(重要性42.70%)、850 hPa比湿(重要性11.17%)、925 hPa相对湿度(重要性10.44%)、500 hPa相对湿度(重要性9.16%)。个例分析表明,命中个例中高重要性物理因子在暴雨区的SHAP值较大,漏报(空报)个例在漏报(空报)区域高重要性物理因子的SHAP值偏小(偏大)。SHAP值从全局和局部可定量给出ML模型有物理意义的解释,解释结果与天气学原理和业务经验较一致,有利于ML在气象业务中的深入应用。 展开更多
关键词 SHAP值 机器学习 暴雨 因子重要性 可解释性
下载PDF
基于机器学习的东非植被变化因子重要性分析
2
作者 张秀梅 马波 张怡捷 《水土保持通报》 CSCD 北大核心 2023年第6期227-236,共10页
[目的]基于机器学习算法对东非植被变化进行因子重要性分析,测度不同算法在各情况下的精度差异及适用性,为保护、恢复和促进可持续森林管理、水土流失综合防治提供科学依据。[方法]以东非9个国家2001—2020年的归一化植被指数(normalize... [目的]基于机器学习算法对东非植被变化进行因子重要性分析,测度不同算法在各情况下的精度差异及适用性,为保护、恢复和促进可持续森林管理、水土流失综合防治提供科学依据。[方法]以东非9个国家2001—2020年的归一化植被指数(normalized difference vegetation index,NDVI)变化为研究对象,选取影响东非植被变化的2个气候因子及5个人类活动因子作为自变量,利用随机森林(random forest,RF)、BP神经网络(BP neural networks,BP)、支持向量机(support vector machines,SVM)、遗传算法(genetic algorithm,GA)、径向基神经网络(radial basis function,RBF)、卷积神经网络(convolutional neural networks,CNN)6种机器学习算法建立NDVI预测模型,以决定系数(R^(2))、平均绝对误差(MAE,mean absolute error)、平均相对误差(MRE,mean relative error)3个指标评价评估6种机器学习算法预测NDVI变化的潜力,并基于所得的最优模型即对选取的7个因子进行重要性分析。[结果]精度验证结果表明,研究区内在全因子的情况下,CNN算法的回归精度最差;经逐轮删除一个综合表现不佳的算法后,RF算法建立的模型在东非NDVI变化分析中回归精度较高;基于随机森林算法的不同因子变量对NDVI变化的重要性表明,年降水量、N_(2)O排放量、CH_(4)排放量、牲畜数量4个变量对NDVI变化回归的结果影响较大。[结论]随机森林算法的回归能力在东非NDVI模拟中具有相对优势,降水量是影响植被变化最重要的气候因子,同时,温室气体的排放对于东非植被的变化也具有一定的影响。东非各国应提高植被变化对气候环境、社会经济和政治制度相互依存关系的认识和理解,并制定适当的政策以促进可持续森林管理、防治荒漠化。 展开更多
关键词 归一化植被指数(NDVI) 机器学习 精度评估 因子重要性 东非
下载PDF
作物产量模型中因子重要性的排序 被引量:1
3
作者 杨锦忠 陆强 《农业系统科学与综合研究》 CSCD 北大核心 1997年第2期151-153,共3页
作物产量的二次回归模型是优化作物生产系统的有力工具,但还未解决因子对作物产量影响程度的量化问题。利用求二次项系数矩阵特征根与特征向量的方法,提出了确定因子重要性排序的计算方法。同时举实例说明了该方法的应用。
关键词 二次回归模型 作物产量 因子重要性 特征根
下载PDF
基于随机森林算法的水土流失影响因子重要性分析 被引量:17
4
作者 陈妙金 汪小钦 吴思颖 《自然灾害学报》 CSCD 北大核心 2019年第4期209-219,共11页
水土流失是诸多因素综合所致,确定水土流失因子的重要性具有重要意义。本文以福建省为例,利用土壤侵蚀强度等级数据及导致水土流失的年侵蚀降雨量、土壤类型、坡度、坡长、植被覆盖度及土地利用类型等数据,引入随机森林算法,提出通过平... 水土流失是诸多因素综合所致,确定水土流失因子的重要性具有重要意义。本文以福建省为例,利用土壤侵蚀强度等级数据及导致水土流失的年侵蚀降雨量、土壤类型、坡度、坡长、植被覆盖度及土地利用类型等数据,引入随机森林算法,提出通过平均精确率减少值(MDA)和平均不纯度减少值(MDG)归一化相加的方法确定要素重要性,并与MDA和MDG排序赋值相加的方法进行对比。结果表明:随机森林算法适用于水土流失影响因子重要性分析;归一化相加法对因子重要性的表征效果较好,优于排序赋值相加法,不仅能判别因子的相对重要性,还可定量表达因子间差异的显著性;在所分析的六个要素中,植被覆盖度最为重要,地形特征次之,而土壤类型对是否发生水土流失重要性影响较弱,与已有的实验和研究结果吻合,结果合理。在判断无流失与其它流失等级间关系时,植被覆盖度的重要性具有很大的优势,量级上是第二位的2倍以上。 展开更多
关键词 水土流失 因子重要性 随机森林算法 平均精确率减少值(MDA) 平均不纯度减少值(MDG)
下载PDF
基于因子分析与IPA分析文化创意园满意度影响因素研究——以广州红专厂为例 被引量:3
5
作者 陈建斌 赖曼婷 《统计与管理》 2017年第4期56-62,共7页
本文以广州文化创意产业园区代表之一的红专厂为例,通过实地问卷调查与访谈相结合的方式,采用因子分析和IPA分析法对文化创意园满意度影响因素进行了研究。研究发现设施与环境、餐饮与购物、交通与服务、娱乐与知识和文化创意景观是影... 本文以广州文化创意产业园区代表之一的红专厂为例,通过实地问卷调查与访谈相结合的方式,采用因子分析和IPA分析法对文化创意园满意度影响因素进行了研究。研究发现设施与环境、餐饮与购物、交通与服务、娱乐与知识和文化创意景观是影响文化创意园游客满意度的五大主因子。并在IPA分析基础上,提出有针对性的建议措施,以提高文化创意园区游客满意度,并希望能对文化创意园区的更好发展提供参考。 展开更多
关键词 红专厂 文化创意产业园 游客满意度 因子分析重要性 绩效分析
下载PDF
异质信息网络高阶层次化嵌入学习与推荐预测
6
作者 荀亚玲 毕慧敏 张继福 《软件学报》 EI CSCD 北大核心 2023年第11期5230-5248,共19页
异质信息网络是一种异质数据表示形式,如何融合异质数据复杂语义信息,是推荐系统面临的挑战之一.利用弱关系具有的丰富语义和信息传递能力,构建一种面向推荐系统的异质信息网络高阶嵌入学习框架,主要包括:初始化信息嵌入、高阶信息嵌入... 异质信息网络是一种异质数据表示形式,如何融合异质数据复杂语义信息,是推荐系统面临的挑战之一.利用弱关系具有的丰富语义和信息传递能力,构建一种面向推荐系统的异质信息网络高阶嵌入学习框架,主要包括:初始化信息嵌入、高阶信息嵌入聚合与推荐预测3个模块.初始化信息嵌入模块首先采用基于弱关系的异质信息网络最佳信任路径筛选算法,有效地避免在全关系异质信息网络中,采样固定数量邻居造成的信息损失,其次利用新定义的基于多头图注意力的多任务共享特征重要性度量因子,筛选出节点的语义信息,并结合交互结构,有效地表征网络节点;高阶信息嵌入聚合模块通过融入弱关系及网络嵌入对知识良好的表征能力,实现高阶信息表达,并利用异质信息网络的层级传播机制,将被采样节点的特征聚合到待预测节点;推荐预测模块利用高阶信息的影响力推荐方法,实现了推荐任务.该框架具有嵌入节点类型丰富、融合共享属性和隐式交互信息等特点.最后,实验验证UI-HEHo学习框架可有效地改善评级预测的准确性,以及推荐生成的针对性、新颖性和多样性,尤其是在数据稀疏的应用场景中,具有良好的推荐效果. 展开更多
关键词 推荐预测 异质信息网络 网络嵌入 共享特征 重要性度量因子
下载PDF
随机森林在降水量长期预报中的应用 被引量:20
7
作者 余胜男 陈元芳 +2 位作者 顾圣华 康有 贺冉冉 《南水北调与水利科技》 CAS CSCD 北大核心 2016年第1期78-83,共6页
随机森林是21世纪提出的基于分类树的算法,在处理大数据集中具有明显优势,首度将其应用在降水长期预报中。以长江中下游地区1月份降水预报为例,运用随机森林模型构建原则,在74项大气环流因子以及前期月降水中筛选模型预报因子,进行长期... 随机森林是21世纪提出的基于分类树的算法,在处理大数据集中具有明显优势,首度将其应用在降水长期预报中。以长江中下游地区1月份降水预报为例,运用随机森林模型构建原则,在74项大气环流因子以及前期月降水中筛选模型预报因子,进行长期降水量预报,并将其与神经网络模型预报效果进行对比,发现随机森林的泛化误差为13%,预报准确率达到75%,而神经网络的预报准确率仅为67%。此外,本研究还对长江中下游地区的汛期降水量进行了长期预报,结果表明,随机森林模型进行降水量长期预报中模拟和预报的效果令人满意,值得进一步研究和应用。 展开更多
关键词 随机森林 长期降水预报 等级预报 泛化误差 重要性因子评价 决策树 神经网络
下载PDF
基于信息量-机器学习耦合的野火灾害易发性评估
8
作者 岳韦霆 任超 梁月吉 《消防科学与技术》 CAS 北大核心 2023年第10期1444-1452,共9页
为充分发挥统计学和机器学习模型在野火灾害易发性分析和评估中的优势,以森林资源丰富且深受野火灾害困扰的桂林市为研究区,分别从气候、地形、水文以及人文等方面选取16个评价因子。将信息量(IV)模型分别与逻辑回归(LR)、人工神经网络(... 为充分发挥统计学和机器学习模型在野火灾害易发性分析和评估中的优势,以森林资源丰富且深受野火灾害困扰的桂林市为研究区,分别从气候、地形、水文以及人文等方面选取16个评价因子。将信息量(IV)模型分别与逻辑回归(LR)、人工神经网络(ANN)、随机森林(RF)和极致梯度提升(XGBoost)4种机器学习(ML)模型相耦合,对桂林市野火灾害易发性进行评价分析。结果表明,IV-XGBoost模型的AUC和准确率分别为0.957和0.921,具有最佳的预测性能,能够有效评估野火灾害的易发性,并为当地野火灾害的防治提供有价值的参考。 展开更多
关键词 野火易发性评价 信息量模型 机器学习模型 野火灾害 因子重要性分析
下载PDF
工程项目投标决策的影响因素:来自中国承包商的研究 被引量:3
9
作者 王春梅 徐冰冰 《中国港湾建设》 2016年第11期71-76,共6页
有效识别和掌握投标决策的影响因素,有助于更好地评估投标决策行为,提高决策的科学性。文章采用文献浏览、专家讨论和访谈等方法识别国内工程项目投标决策的影响因素44个,依据属性将其分为业主类、承包商类、项目类、环境类。在此基础上... 有效识别和掌握投标决策的影响因素,有助于更好地评估投标决策行为,提高决策的科学性。文章采用文献浏览、专家讨论和访谈等方法识别国内工程项目投标决策的影响因素44个,依据属性将其分为业主类、承包商类、项目类、环境类。在此基础上,以国内工程项目承包商投标管理人员为被试,采用问卷调查方法对上述因素的重要性进行分析,得出结论:与业主的关系强弱、项目预期利润、投标者的风险倾向是影响承包商投标决策的关键因素;业主类因素对其综合影响最大,而环境类因素对其综合影响较弱。对现有研究成果进行了有益补充和解释,也为进一步完善投标决策模型提供实证支撑。 展开更多
关键词 投标决策 影响因素 承包商 重要性因子
下载PDF
普洱市不同产茶区普洱生茶香气成分差异性分析 被引量:11
10
作者 张晨霞 王国成 +3 位作者 王超 李清 刘顺航 毕开顺 《食品研究与开发》 CAS 北大核心 2020年第1期177-184,共8页
采用顶空固相微萃取(headspace solid-phase microextraction,HS-SPME)结合气相色谱-质谱联用仪(gas chromatography-mass spectrometry,GC-MS)分别对普洱市5个产茶区的普洱生茶香气组分进行分析。结果表明,42个普洱生茶样品中共检测出8... 采用顶空固相微萃取(headspace solid-phase microextraction,HS-SPME)结合气相色谱-质谱联用仪(gas chromatography-mass spectrometry,GC-MS)分别对普洱市5个产茶区的普洱生茶香气组分进行分析。结果表明,42个普洱生茶样品中共检测出83种香气成分,其中醇类化合物23种,碳氢类化合物20种,酯类化合物12种,甲氧基苯类化合物8种,酮类化合物8种,酸类化合物4种,酚类化合物3种,醛类化合物3种,含氮类化合物2种。不同产茶区普洱生茶中醇类、碳氢类和醛类化合物相对百分含量差异均不显著,甲氧基苯类化合物含量差异显著性比例较大,酯类、酮类、酚类、酸类和含氮类化合物含量差异显著性比例较小。以83种香气成分相对百分含量为变量进行偏最小二乘判别分析(partial least squares-discriminant analysis,PLS-DA),不同产茶区的普洱生茶样品呈现明显的分离趋势,变量重要性因子(variable importance in the projection,VIP)分析,33种香气成分对不同产茶区普洱生茶样品区分起主要作用(VIP> 1),33种香气成分中甲氧基苯类、酮类、酯类和醇类物质占比最大。 展开更多
关键词 普洱生茶 香气成分 普洱市不同产茶区 偏最小二乘判别分析(PLS-DA) 变量重要性因子(VIP)分析
下载PDF
钢桥火灾风险评估及耐火性增强方法研究 被引量:3
11
作者 吴玉刚 郭强 李翠娟 《中外公路》 北大核心 2018年第1期212-219,共8页
该文介绍了一种降低火灾风险的实用方法。该方法首先评估桥梁的火灾风险,然后制定减小火灾危害的对策。在风险评估阶段,基于火灾重要性因子,通过特定的分析程序分析桥梁的火灾易损性。当桥梁的火灾风险等级较高时,采用有限元软件建立连... 该文介绍了一种降低火灾风险的实用方法。该方法首先评估桥梁的火灾风险,然后制定减小火灾危害的对策。在风险评估阶段,基于火灾重要性因子,通过特定的分析程序分析桥梁的火灾易损性。当桥梁的火灾风险等级较高时,采用有限元软件建立连续分析模型,研究减轻火灾危害的策略。通过对近几年因发生火灾事故而失效的3大钢桥案例研究来证明该方法的可行性,研究表明:该方法可以有效地锁定重要桥梁发生火灾时的危险点,然后制定解决方案,减轻关键桥梁火灾危害的危险性。 展开更多
关键词 桥梁火灾 钢梁 防火性能 火灾风险评估 重要性因子 有限元分析
下载PDF
一种新颖的基于人脸检测的图像预处理方案
12
作者 余红斌 余松煜 王慈 《上海交通大学学报》 EI CAS CSCD 北大核心 2004年第z1期10-13,共4页
提出了一种新颖的图像预处理方案.本方案对图像进行人脸检测,并根据检测结果给该图像的不同部分赋予相应的重要性因子.利用该重要性因子图,可以引入几种有效的图像预处理算法,其中的一种方案(根据重要性分类的预量化)和图像压缩算法独立... 提出了一种新颖的图像预处理方案.本方案对图像进行人脸检测,并根据检测结果给该图像的不同部分赋予相应的重要性因子.利用该重要性因子图,可以引入几种有效的图像预处理算法,其中的一种方案(根据重要性分类的预量化)和图像压缩算法独立,可以很容易地嵌入到现有的图像压缩算法之中. 展开更多
关键词 图像处理 图像压缩 人脸检测 重要性因子 根据重要性分类的预量化
下载PDF
Kill probability modeling of multi-purpose guided missile against gunship and its application
13
作者 DU Zheng CHEN Wan-chun 《Journal of Measurement Science and Instrumentation》 CAS 2014年第2期9-18,共10页
Aimed at current deficiencies of multi-purpose guided missile kill probability model against gunship, the concept of the important coefficient of vulnerability blade unit is proposed in this paper. Laser fuze actuatio... Aimed at current deficiencies of multi-purpose guided missile kill probability model against gunship, the concept of the important coefficient of vulnerability blade unit is proposed in this paper. Laser fuze actuation model and warhead condition kill probability model of rotor blades are established by Monte Carlo method and kinetics theory with new ideas. Based on limited data, armor thickness of gunship is estimated, and a complete multi-purpose guided missile kill probability mathematical model is established, which provides necessary mathematical tool for the accurate and objective analysis of multi-purpose guided missile kill probability against gunship. Based on the establishment of the model, sensitivity analysis and optimal design of the main factors of multi-purpose guided missile kill probability are conducted, and the results show that the single multi-purpose guided missile lethality performance can be improved significantly by sensitivity analysis and optimization. 展开更多
关键词 multi-purpose guided missile gunship rotor blade the important coefficient of vulnerability blade unit armorthickness kill probability
下载PDF
基于人工神经网络的ChinaFLUX观测站CO_2模拟研究通量 被引量:8
14
作者 何洪林 于贵瑞 +2 位作者 张雷明 孙晓敏 苏文 《中国科学(D辑)》 CSCD 北大核心 2006年第A01期234-243,共10页
涡度相关技术的发展,为准确获取区域尺度的CO2通量分布格局提供了数据基础.但由于涡度相关技术自身的局限性,需要利用模型模拟作为获取区域CO2通量的重要手段.可是CO2通量和其他微气象变量之间的非线性关系给模拟CO2通量的时空动态变... 涡度相关技术的发展,为准确获取区域尺度的CO2通量分布格局提供了数据基础.但由于涡度相关技术自身的局限性,需要利用模型模拟作为获取区域CO2通量的重要手段.可是CO2通量和其他微气象变量之间的非线性关系给模拟CO2通量的时空动态变化带来了一定的困难.人工神经网络模型为模拟CO2通量与其他微气象变量的非线性关系提供了一种新的手段.在ChinaFLUX三个不同类型(农田、森林、草地)生态系统中,基于2003年6~8月的半小时涡度相关观测数据,采用BP人工神经网络模型,以能量通量(净辐射、潜热、显热和土壤热通量)以及温度(空气温度、土壤温度)和表层土壤水分作为输入变量,模拟了CO2通量的动态变化.结果表明,人工神经网络模型具有较好的模拟结果,其R2系数在0.75与0.866之间.RMSE在0.008μmol/m2与0.012μmol/m2之间,MAE在1.38μmol/m2与3.60μmol/m2之间,其中农田和森林生态系统的模拟精度略高于草地生态系统.其次,通过比较土壤水分要素是否参与模拟的结果表明,在生长季期间,不存在土壤水分胁迫的情况下,土壤水分的参与并不能显著提供模型模拟的精度.最后,应用连接权重方法进行了神经网络模型不同输入变量的重要性分析,指出神经网络模型不完全是一个黑箱模型,也可以有效地揭示出某些机理性现象.该研究证明,神经网络模型不仅可以有效地模拟CO2通量,也可以揭示出一些机理现象,为通过涡度相关观测与遥感反演技术的集成途径,利用已获取的区域尺度能量通量数据,模拟分析区域尺度的CO2通量分布格局提供了一种有效的方法. 展开更多
关键词 CHINAFLUX BP人工神经网络 CO2通量 能量通量 因子重要性分析
原文传递
次临界反应性测量方法研究 被引量:1
15
作者 唐霄 肖鹏 +6 位作者 刘同先 廖鸿宽 黄灿 赵德华 刘明权 卢迪 李满仓 《核动力工程》 EI CAS CSCD 北大核心 2020年第6期214-217,共4页
压水堆启动前需要进行物理启动试验,其中调临界是相对耗时的一部分。采用次临界条件下的试验,可以省去调临界的步骤,提高物理启动试验的安全性和适用性,加速物理启动试验的进程,提高压水堆的负荷因子。目前,次临界反应性测量受限于测量... 压水堆启动前需要进行物理启动试验,其中调临界是相对耗时的一部分。采用次临界条件下的试验,可以省去调临界的步骤,提高物理启动试验的安全性和适用性,加速物理启动试验的进程,提高压水堆的负荷因子。目前,次临界反应性测量受限于测量信号较弱,背景噪声强,误差较大,难以满足商用压水堆的工程应用要求。本文基于源倍增方法,利用空间重要性修正因子和信号线性修正提高次临界反应性测量的精度,成功地在核电厂首循环上实现了次临界反应性测量的蒙特卡罗方法计算,取得了较好的计算精度与效果。 展开更多
关键词 次临界反应性测量 源倍增方法 空间重要性修正因子 信号线性修正
原文传递
基于机器学习的公司违规预测研究
16
作者 李莹 曲晓辉 《财务研究》 CSSCI 2022年第4期54-66,共13页
公司违规研究一般采用传统的线性回归模型处理历史数据,本文则构建了基于机器学习算法的公司违规预测模型并实施检验。研究发现:(1)通过比对分析可知,广为使用的线性回归模型不能充分挖掘数据信息并进行有效预测,机器学习的树模型(Rando... 公司违规研究一般采用传统的线性回归模型处理历史数据,本文则构建了基于机器学习算法的公司违规预测模型并实施检验。研究发现:(1)通过比对分析可知,广为使用的线性回归模型不能充分挖掘数据信息并进行有效预测,机器学习的树模型(RandomForest和GBDT)和神经网络模型(RNN和LSTM)的预测效果更优;(2)采用SHAP方法探寻公司违规的重要预警因子及其贡献度,发现公司治理相关变量对违规预警具有重要贡献,传统线性回归模型过分强调财务数据的预警能力,弱化了公司治理因子对违规预警的贡献;(3)进一步采用SHAP方法将RandomForest和GBDT模型的运作过程和贡献分布可视化,挖掘重要因子对公司未来违规的影响机理,并计算主要影响因子的警惕阈值。本研究实现了公司违规行为预测研究方法的创新,对投资者和监管机构的决策优化具有借鉴意义。 展开更多
关键词 违规预测 机器学习 传统预测模型 因子重要性 可视化
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部