期刊文献+
共找到78篇文章
< 1 2 4 >
每页显示 20 50 100
管理层讨论与分析能预示企业违约吗?——基于中国股市的实证分析 被引量:1
1
作者 沈隆 周颖 《系统管理学报》 CSSCI CSCD 北大核心 2024年第2期441-459,共19页
采用文本挖掘技术,对上市公司年报中的管理层讨论与分析(MD&A)内容进行文本分析,从文本相似度、文本可读性、文本语调以及管理层预期的角度构建了MD&A评价体系。通过构建代价敏感GBDT(csGBDT)模型,考察多维管理层讨论与分析指... 采用文本挖掘技术,对上市公司年报中的管理层讨论与分析(MD&A)内容进行文本分析,从文本相似度、文本可读性、文本语调以及管理层预期的角度构建了MD&A评价体系。通过构建代价敏感GBDT(csGBDT)模型,考察多维管理层讨论与分析指标对企业违约预测的影响,并进一步分析了对企业违约状态有重要影响的MD&A指标及其对违约状态作用的边际效应。研究表明:MD&A指标可以作为替代性数据源准确预测上市公司违约状态;MD&A指标相比传统违约预测变量的预测效果较差;MD&A指标在传统违约判别指标基础上提供了额外的信息含量;csGBDT模型显著提高了对企业(尤其是对违约企业)的判别能力,在违约预测的大数据方法中具有明显优势。在众多管理层讨论与分析指标中,对企业违约有重要影响的MD&A指标依次为:与前一年相比文本相似度、词汇总量、情感语调2、词汇总量/句子数量、情感语调1和管理层是否发出业绩预测。本文将企业违约预测的研究边界从结构化数据拓展到非结构化文本数据,有助于抑制信息不对称导致的企业违约风险。 展开更多
关键词 文本挖掘 管理层讨论与分析 违约预测 代价敏感GBDT 信息不对称
下载PDF
测试时间代价敏感决策树
2
作者 孔婕 胡军 《重庆邮电大学学报(自然科学版)》 CSCD 北大核心 2024年第5期1062-1070,共9页
决策树作为一种重要的分类算法已在许多领域得到了广泛应用。针对传统决策树算法未考虑实际应用中代价约束的问题,已有研究提出在限制代价的情况下构建决策树的方法。这些方法中代价的定义并没有考虑测试样本通过决策树进行分类的时间... 决策树作为一种重要的分类算法已在许多领域得到了广泛应用。针对传统决策树算法未考虑实际应用中代价约束的问题,已有研究提出在限制代价的情况下构建决策树的方法。这些方法中代价的定义并没有考虑测试样本通过决策树进行分类的时间代价。为了最小化样本通过决策树进行分类的测试时间,提出了一种测试时间代价敏感决策树算法。定义了样本的测试时间代价,定义了衡量属性重要度的决策指数,给出了构造代价敏感决策树的算法。实验结果表明,算法的测试时间代价相较于C4.5、RSDT和CSGR等主要算法平均提升了11.7%,且在不同数据集下分类准确度平均提升了5.3%。 展开更多
关键词 决策树 代价敏感 决策指数 测试时间
下载PDF
基于差分隐私保护知识迁移的联邦学习方法 被引量:4
3
作者 徐晨阳 葛丽娜 +3 位作者 王哲 周永权 秦霞 田蕾 《计算机应用研究》 CSCD 北大核心 2023年第8期2473-2480,共8页
联邦学习解决了机器学习的数据孤岛问题,然而,各方的数据集在数据样本空间和特征空间上可能存在较大差异,导致联邦模型的预测精度下降。针对上述问题,提出了一种基于差分隐私保护知识迁移的联邦学习方法。该方法使用边界扩展局部敏感散... 联邦学习解决了机器学习的数据孤岛问题,然而,各方的数据集在数据样本空间和特征空间上可能存在较大差异,导致联邦模型的预测精度下降。针对上述问题,提出了一种基于差分隐私保护知识迁移的联邦学习方法。该方法使用边界扩展局部敏感散列计算各方实例之间的相似度,根据相似度对实例进行加权训练,实现基于实例的联邦迁移学习。在此过程中,实例本身无须透露给其他方,防止了隐私的直接泄露。同时,为了减少知识迁移过程的隐私间接泄露,在知识迁移过程中引入差分隐私机制,对需要在各方之间传输的梯度数据进行扰动,实现知识迁移过程的隐私保护。理论分析表明,知识迁移过程满足ε-差分隐私保护。在XGBoost梯度提升树模型上实现了所提方法,实验结果表明,与无知识迁移方法相比,所提方法使联邦模型测试误差平均下降6%以上。 展开更多
关键词 联邦学习 迁移学习 局部敏感散列 差分隐私 梯度提升树
下载PDF
面向非独立同分布数据的联邦梯度提升决策树 被引量:1
4
作者 赵雪 李晓会 《计算机应用研究》 CSCD 北大核心 2023年第7期2184-2191,共8页
随着联邦学习的不断兴起,梯度提升决策树(GBDT)作为一种传统的机器学习方法,逐渐应用于联邦学习中以达到理想的分类效果。针对现有GBDT的横向联邦学习模型,存在精度受非独立同分布数据的影响较大、信息泄露和通信成本高等问题,提出了一... 随着联邦学习的不断兴起,梯度提升决策树(GBDT)作为一种传统的机器学习方法,逐渐应用于联邦学习中以达到理想的分类效果。针对现有GBDT的横向联邦学习模型,存在精度受非独立同分布数据的影响较大、信息泄露和通信成本高等问题,提出了一种面向非独立同分布数据的联邦梯度提升决策树(federated GBDT for non-IID dataset,nFL-GBDT)。首先,采用局部敏感哈希(LSH)来计算各个参与方之间的相似样本,通过加权梯度来构建第一棵树。其次,由可靠第三方计算只需要一轮通信的全局叶权重来更新树模型。最后,实验分析表明了该算法能够实现对原始数据的隐私保护,并且通信成本低于simFL和FederBoost。同时,实验按照不平衡比率来划分三组公共的数据集,结果表明该算法与Individual、TFL及F-GBDT-G相比,准确率分别提升了3.53%、5.46%和4.43%。 展开更多
关键词 联邦学习 梯度提升决策树 非独立同分布 局部敏感哈希
下载PDF
基于优化决策树的时延敏感流智能感知调度 被引量:1
5
作者 王雪荣 唐政治 +3 位作者 李银川 齐美玉 朱建波 张亮 《电信科学》 2023年第4期120-132,共13页
目前流量调度策略无法做到智能按需化,尤其对于网络突发故障造成的拥塞以及高价值业务的护航场景,无法按需保障时延敏感的业务体验。通过分析研究不同网络业务流量时延敏感性属性需求,探索挖掘不同网络业务流量的行为特征与其时延敏感... 目前流量调度策略无法做到智能按需化,尤其对于网络突发故障造成的拥塞以及高价值业务的护航场景,无法按需保障时延敏感的业务体验。通过分析研究不同网络业务流量时延敏感性属性需求,探索挖掘不同网络业务流量的行为特征与其时延敏感性需求之间的内在关联关系。然后利用AI技术对这种内在的关联关系进行学习,构建其映射关系,实现了时延敏感流智能感知调度。同时,考虑AI模型的可解释性及可部署性实际问题,采用强化学习剪枝优化可解释性决策树模型,提高模型的鲁棒性同时使模型更轻量化,易于设备部署实现。通过真实网络流量实验,强化学习优化后的决策树模型在单次推理情形下感知正确率提高1.75%,推理速度提升约30%;同时,实验也证明了使用局部微观统计特征多次推理有助于提高模型感知正确率。在所有实验中,强化学习优化的决策树模型规模缩小了60.0%~87.2%,并且Saras比Q-learning具有更好的优化表现。 展开更多
关键词 流量分析 流量调度 时延敏感属性 强化学习 决策树
下载PDF
基于词义特性的电子邮件敏感信息过滤仿真
6
作者 冯健文 林璇 《计算机仿真》 北大核心 2023年第10期210-213,223,共5页
针对电子邮件敏感信息特征种类多,敏感信息过滤难度大的问题,提出一种基于决策树的过滤算法优化方法。建立电子邮件向量空间模型,给出信息对应词和所属类别向量关系,计算敏感信息中某一代表性词语与类别间的对应关系,通过词频出现概率... 针对电子邮件敏感信息特征种类多,敏感信息过滤难度大的问题,提出一种基于决策树的过滤算法优化方法。建立电子邮件向量空间模型,给出信息对应词和所属类别向量关系,计算敏感信息中某一代表性词语与类别间的对应关系,通过词频出现概率求得所属类别,提取邮件特征。考虑到敏感信息在不同时间点的词义特性会发生变化,建立决策树,通过映射得到敏感信息与上下文信息串之间的影响关系,对电子邮件中的敏感信息项添加标签,求得属性值参数,按照参数大小设定邮件抗体的成熟度值,用于调整邮件传输通道宽度,实现精准过滤。实验数据证明,所提方法过滤精准度高,所需运算代价小,具有一定的实用价值。 展开更多
关键词 决策树 电子邮件 敏感信息过滤 成熟度值 上下文信息串
下载PDF
基于代价敏感决策树的电压稳定在线评估方法
7
作者 付兆隆 蒋轶周 +1 位作者 梁鑫玉 王东哲 《东北电力技术》 2023年第11期17-22,26,共7页
近年来,电压失稳引起的大面积停电事故导致了巨大的经济损失,因此研究电压稳定评估方法十分重要。首先,将灵敏度指标和模糊聚类相结合,对电压薄弱点进行综合判断,从而更准确的识别电压薄弱区域,并采用该方法对电网正常运行和N-1事故进... 近年来,电压失稳引起的大面积停电事故导致了巨大的经济损失,因此研究电压稳定评估方法十分重要。首先,将灵敏度指标和模糊聚类相结合,对电压薄弱点进行综合判断,从而更准确的识别电压薄弱区域,并采用该方法对电网正常运行和N-1事故进行仿真分析,得到大量电压稳定/失稳的数据。然后,采用基于代价敏感的决策树模型对电压稳定进行评估,利用同步向量测量单元(phasor measurement unit,PMU)实时采集需要监测的变量数据,从而实现电压稳定在线评估。最后,在IEEE39节点系统上验证电压薄弱节点分区的准确性,并对某地区电压稳定/失稳样本数据进行仿真分析,从而验证采用的电压稳定在线评估方法的有效性。 展开更多
关键词 电压薄弱点 模糊聚类 灵敏度指标 决策树
下载PDF
Selecting decision trees for power system security assessment
8
作者 Al-Amin B.Bugaje Jochen L.Cremer +1 位作者 Mingyang Sun Goran Strbac 《Energy and AI》 2021年第4期21-30,共10页
Power systems transport an increasing amount of electricity,and in the future,involve more distributed renewables and dynamic interactions of the equipment.The system response to disturbances must be secure and predic... Power systems transport an increasing amount of electricity,and in the future,involve more distributed renewables and dynamic interactions of the equipment.The system response to disturbances must be secure and predictable to avoid power blackouts.The system response can be simulated in the time domain.However,this dynamic security assessment(DSA)is not computationally tractable in real-time.Particularly promising is to train decision trees(DTs)from machine learning as interpretable classifiers to predict whether the systemwide responses to disturbances are secure.In most research,selecting the best DT model focuses on predictive accuracy.However,it is insufficient to focus solely on predictive accuracy.Missed alarms and false alarms have drastically different costs,and as security assessment is a critical task,interpretability is crucial for operators.In this work,the multiple objectives of interpretability,varying costs,and accuracies are considered for DT model selection.We propose a rigorous workflow to select the best classifier.In addition,we present two graphical approaches for visual inspection to illustrate the selection sensitivity to probability and impacts of disturbances.We propose cost curves to inspect selection combining all three objectives for the first time.Case studies on the IEEE 68 bus system and the French system show that the proposed approach allows for better DT-selections,with an 80%increase in interpretability,5%reduction in expected operating cost,while making almost zero accuracy compromises.The proposed approach scales well with larger systems and can be used for models beyond DTs.Hence,this work provides insights into criteria for model selection in a promising application for methods from artificial intelligence(AI). 展开更多
关键词 Dynamic security assessment Machine learning decision trees ROC curve Cost curves Cost sensitivity
原文传递
基于数据挖掘的区域暂态电压稳定评估 被引量:29
9
作者 朱利鹏 陆超 +3 位作者 孙元章 黄河 苏寅生 李智欢 《电网技术》 EI CSCD 北大核心 2015年第4期1026-1032,共7页
针对区域暂态电压稳定评估相关理论还不完善、工程判据可靠性不足等问题,提出了基于数据挖掘的区域暂态电压稳定评估方法,构建了综合考虑单点负荷稳定与多点电压相互影响的2层评价框架。利用节点稳定度量指标及基于辨识的电压无功灵敏... 针对区域暂态电压稳定评估相关理论还不完善、工程判据可靠性不足等问题,提出了基于数据挖掘的区域暂态电压稳定评估方法,构建了综合考虑单点负荷稳定与多点电压相互影响的2层评价框架。利用节点稳定度量指标及基于辨识的电压无功灵敏度矩阵提取网络原始特征。面对区域暂态电压失稳尚无可靠界定标准的难题,采用基于约束的半监督学习方式对数据集进行可靠分类。基于决策树算法建立逐步更新的分类模型,生成区域暂态电压稳定判据,通过模型挖掘出有关电压分区、代表节点的内在规律。EPRI 36节点系统上的仿真结果证明了评估方案的有效性,以及分类评估模型的适应性和准确性。 展开更多
关键词 区域暂态电压稳定评估 数据挖掘 灵敏度辨识 半监督学习 决策树
下载PDF
代价敏感分类的软件缺陷预测方法 被引量:15
10
作者 李勇 黄志球 +1 位作者 房丙午 王勇 《计算机科学与探索》 CSCD 2014年第12期1442-1451,共10页
软件缺陷预测是提高软件测试效率,保证软件可靠性的重要途径。考虑到软件缺陷预测模型对软件模块错误分类代价的不同,提出了代价敏感分类的软件缺陷预测模型构建方法。针对代码属性度量数据,采用Bagging方式有放回地多次随机抽取训练样... 软件缺陷预测是提高软件测试效率,保证软件可靠性的重要途径。考虑到软件缺陷预测模型对软件模块错误分类代价的不同,提出了代价敏感分类的软件缺陷预测模型构建方法。针对代码属性度量数据,采用Bagging方式有放回地多次随机抽取训练样本来构建代价敏感分类的决策树基分类器,然后通过投票的方式集成后进行软件模块的缺陷预测,并给出模型构建过程中代价因子最优值的判定选择方法。使用公开的NASA软件缺陷预测数据集进行仿真实验,结果表明该方法在保证缺陷预测率的前提下,误报率明显降低,综合评价指标AUC和F值均优于现有方法。 展开更多
关键词 软件缺陷预测 代价敏感分类 最优代价因子 决策树 集成算法
下载PDF
一种基于NNIA多目标优化的代价敏感决策树构建方法 被引量:8
11
作者 赵士伟 卓力 +1 位作者 王素玉 沈兰荪 《电子学报》 EI CAS CSCD 北大核心 2011年第10期2348-2352,2396,共6页
本文提出了一种基于非支配邻域免疫算法(NNIA,Nondominated Neighbor Immune Algorithm)多目标优化的代价敏感决策树构建方法.将平均误分类代价和平均测试代价作为两个优化目标,然后利用NNIA对决策树进行优化,最终获取了一组Pareto最优... 本文提出了一种基于非支配邻域免疫算法(NNIA,Nondominated Neighbor Immune Algorithm)多目标优化的代价敏感决策树构建方法.将平均误分类代价和平均测试代价作为两个优化目标,然后利用NNIA对决策树进行优化,最终获取了一组Pareto最优的决策树。对多个测试集的测试结果表明,与C4.5算法和CSDB(Cost Sensitive DecisionTree)算法比较,本文方法不仅在平均误分类代价和平均测试代价两方面均可以取得优于两者的性能,而且获得的决策树具有更小的规模,泛化能力更强. 展开更多
关键词 代价敏感 误分类代价 测试代价 多目标优化 决策树
下载PDF
基于相对等待时间的代价敏感决策树 被引量:3
12
作者 袁鼎荣 张师超 +1 位作者 朱晓峰 张晨 《计算机科学与探索》 CSCD 2007年第3期314-324,共11页
首先引入相对等待时间代价,将它与测试代价一起称为有形代价,利用单位有形代价中无形代价(即误分类代价)降低最多的原则选择分裂属性;然后结合序列测试策略和批量测试策略建立相对等待时间代价敏感决策树。实验结果显示,该方法无论在误... 首先引入相对等待时间代价,将它与测试代价一起称为有形代价,利用单位有形代价中无形代价(即误分类代价)降低最多的原则选择分裂属性;然后结合序列测试策略和批量测试策略建立相对等待时间代价敏感决策树。实验结果显示,该方法无论在误分类代价的减少量上还是所需有形代价的数量上都优于存在的算法,并且实验地分析了建立代价敏感决策树考虑相对等待时间是必要的。 展开更多
关键词 等待时间 代价敏感 决策树 WAITING TIME 时间代价 分类代价 测试策略 实验 测试代价 减少量 属性 选择 显示 算法 批量 方法 单位
下载PDF
基于相关性的类偏好敏感决策树算法 被引量:4
13
作者 周美琴 徐章艳 +3 位作者 陈诗旭 李艳红 马顺 展雪梅 《计算机工程与应用》 CSCD 北大核心 2017年第5期45-50,146,共7页
针对决策者在面对几个分类结果时会有选择其中某一个结果的倾向性这一事实,提出了一种基于相关性的类偏好敏感决策树分类算法(CPSDT)。该算法引入了类偏好度、偏好代价矩阵等概念。为弥补在传统决策树构造过程中,选择分裂属性时未考虑... 针对决策者在面对几个分类结果时会有选择其中某一个结果的倾向性这一事实,提出了一种基于相关性的类偏好敏感决策树分类算法(CPSDT)。该算法引入了类偏好度、偏好代价矩阵等概念。为弥补在传统决策树构造过程中,选择分裂属性时未考虑非类属性之间相关性的不足,该算法在进行学习之前先采用基于相关性的特征预筛选排除属性冗余并重新构造了基于相关性的属性选择因子。经实验证明,该算法能够有效减小决策树规模,且能够在实现对偏好类的高精度预测的同时保证决策树拥有较好的整体精度。 展开更多
关键词 分类 决策树 属性选择因子 偏好敏感
下载PDF
新型偏好敏感决策树算法 被引量:3
14
作者 周美琴 徐章艳 +3 位作者 陈诗旭 李艳红 马顺 展雪梅 《计算机应用研究》 CSCD 北大核心 2016年第10期3001-3006,共6页
针对现有决策树模型在分类过程中没有考虑决策者对结果的偏好行为,因而不能很好地预测具有明显偏好倾向问题的不足,提出了一种偏好敏感决策树(preference sensitive decision tree,PSDT)分类算法。该算法引入了偏好度和偏好代价的概念,... 针对现有决策树模型在分类过程中没有考虑决策者对结果的偏好行为,因而不能很好地预测具有明显偏好倾向问题的不足,提出了一种偏好敏感决策树(preference sensitive decision tree,PSDT)分类算法。该算法引入了偏好度和偏好代价的概念,并通过综合考虑属性信息和有效偏好,构建新型属性选择因子和基于有效偏好的节点类标号分配准则。通过自适应调整偏好度,可生成最佳偏好敏感决策树。实验结果证明,该算法既能实现对偏好类的高精度预测,同时能够保证决策树拥有良好的整体精度,且具有较高的有效性和实用性,能够很好地解决偏好敏感环境下的决策问题。 展开更多
关键词 决策树 偏好敏感 偏好度 属性选择 代价敏感 分类
下载PDF
医院药物经济性评价系统的建立 被引量:5
15
作者 许星莹 梁洁 +3 位作者 刘颖 张业象 陈冠全 匡文龙 《中国药房》 CAS 北大核心 2018年第19期2675-2679,共5页
目的:建立医院药物经济性评价系统。方法:通过成本-效果分析和决策树算法构建医院药物经济性评价系统,并对该系统的设计过程、整体构架、应用功能和应用示例(阿托伐他汀钙片与瑞舒伐他汀钙片比较)等进行介绍。结果:建立的医院药物经济... 目的:建立医院药物经济性评价系统。方法:通过成本-效果分析和决策树算法构建医院药物经济性评价系统,并对该系统的设计过程、整体构架、应用功能和应用示例(阿托伐他汀钙片与瑞舒伐他汀钙片比较)等进行介绍。结果:建立的医院药物经济性评价系统通过对药物成本、治疗效果等数据进行抽取、分析和整合,以决策树算法进行处理,最终将药物经济性评价结果以图表的方式展示给使用者。该系统的整体构架主要包括医院业务平台、数据集成平台、信息处理平台和应用服务平台;应用功能主要包括药物成本-效果分析、药物增量成本-效果分析以及评价结果的敏感性分析。示例分析显示,瑞舒伐他汀钙片的期望成本-效果比为6 644.44元,阿托伐他汀钙片的期望成本-效果比为6 926.63元,阿托伐他汀钙片的增量期望成本-效果比为117 579.17元;敏感性分析结论与成本-效果分析结论一致。结论:所建系统解决了医疗机构开展药物经济性评价时存在的"成本-效果数据收集困难""计算方法不统一""评价结果缺乏敏感度分析"等问题,可促进医院合理用药。 展开更多
关键词 药物经济性评价系统 成本-效果分析 敏感性分析 决策树 应用
下载PDF
基于文本内容的敏感词决策树信息过滤算法 被引量:32
16
作者 邓一贵 伍玉英 《计算机工程》 CAS CSCD 2014年第9期300-304,共5页
随着互联网的高速发展,各种各样的信息资源呈指数级增长,随之出现许多负面影响,需要构建一个安全健康的网络环境。为此,提出针对网页文本内容的敏感信息过滤算法(SWDT-IFA)。该算法不依赖词典与分词,通过构建敏感词决策树,将网页文本内... 随着互联网的高速发展,各种各样的信息资源呈指数级增长,随之出现许多负面影响,需要构建一个安全健康的网络环境。为此,提出针对网页文本内容的敏感信息过滤算法(SWDT-IFA)。该算法不依赖词典与分词,通过构建敏感词决策树,将网页文本内容以数据流形式检索决策树,记录敏感词词频、区域信息以及敏感词级别,计算文本整体敏感度,过滤敏感文本。实验结果表明,SWDT-IFA算法具有较高的查准率和查全率,且执行时间能够满足当前网络环境的实时性要求。 展开更多
关键词 文本过滤 敏感级别 决策树 分流 词频
下载PDF
基于LBP和CCS-AdaBoost的多视角人脸检测 被引量:6
17
作者 何智翔 丁晓青 +1 位作者 方驰 文迪 《浙江大学学报(工学版)》 EI CAS CSCD 北大核心 2013年第4期622-629,共8页
为了解决多视角人脸检测中多视角导致的人脸结构不同的问题和人脸与非人脸之间的误分类风险不同的问题,检测特征使用局部二值模式(LBP)及统计直方图,人脸非人脸分类器使用可控风险敏感AdaBoost(CCS-Ada-Boost).LBP及统计直方图能够描述... 为了解决多视角人脸检测中多视角导致的人脸结构不同的问题和人脸与非人脸之间的误分类风险不同的问题,检测特征使用局部二值模式(LBP)及统计直方图,人脸非人脸分类器使用可控风险敏感AdaBoost(CCS-Ada-Boost).LBP及统计直方图能够描述多视角的人脸结构;CCS-AdaBoost能够在降低总体的误分类风险的同时最小化分类错误率.实验中,LBP特征的性能在正面人脸检测上比Haar-like特征更好.CCS-AdaBoost分类器在一定条件下也比普通AdaBoost分类器有更好的性能,并且弥补了风险敏感AdaBoost分类器(CS-AdaBoost)对靠近分类边界的样本分类不好的缺陷.最终的多视角人脸检测器在CMU-Profile测试集上获得了满意的结果.该算法实现了鲁棒的多视角人脸检测方法,在相同虚警率下获得比其他人脸检测方法更好的结果,能够有效地解决多视角人脸检测中的2个问题. 展开更多
关键词 多视角人脸检测 可控风险敏感AdaBoost 局部二值模式(LBP) 宽度优先搜索 决策树
下载PDF
基于GBDT算法的参考作物蒸散量模型在江苏省的预测 被引量:13
18
作者 张薇 韦群 +3 位作者 吴天傲 林洁 邵光成 丁鸣鸣 《江苏农业学报》 CSCD 北大核心 2020年第5期1169-1180,共12页
选取江苏省6个气象站点1997-2016年的逐日气象资料,建立了3种基于树型算法的参考作物蒸散量(ET 0)预测模型,包括梯度提升决策树(Gradient boosting decision tree,GBDT)、随机森林(Random forest,RF)和回归树(Regression tree)模型,以FA... 选取江苏省6个气象站点1997-2016年的逐日气象资料,建立了3种基于树型算法的参考作物蒸散量(ET 0)预测模型,包括梯度提升决策树(Gradient boosting decision tree,GBDT)、随机森林(Random forest,RF)和回归树(Regression tree)模型,以FAO-56 Penman-Monteith公式计算所得的ET 0值作为标准值,对GBDT、RF、Regresssion tree模型和3种经验模型(EI-Sebail、Irmak、Hargreaves-Samani模型)的预测结果进行比较分析。结果表明:在相同气象因子输入组合下,GBDT、RF模型能取得较高的模拟精度,且明显高于Regression tree模型和经验模型,其中,气象参数组合为最高气温、最低气温和辐射的GBDT模型具有最高的模拟精度[全局评价指标(GPI)排名第1];通过敏感性分析发现,辐射是对江苏省逐日ET 0影响最为显著的气象因子,其直接通径系数为0.512,对决定系数(R 2)的贡献度为0.740,显著高于其他气象因子;通过可移植性分析发现,气象因子组合为最高气温、最低气温和辐射的GBDT、RF模型在江苏省内6个站点相互交叉验证下仍具有较高的预测精度。因此,可以将GBDT、RF模型应用于江苏省气象资料缺乏时的ET 0预测,为农业灌溉提供可靠依据。 展开更多
关键词 参考作物蒸散量 梯度提升决策树(GBDT)算法 随机森林(RF)算法 可移植性分析 敏感性分析
下载PDF
基于均衡系数的决策树优化算法 被引量:4
19
作者 董跃华 刘力 《计算机应用与软件》 CSCD 2016年第7期266-272,共7页
针对ID3算法多值偏向及误分类代价被忽视的问题,结合属性相似度和代价敏感学习,提出基于均衡系数的决策树优化算法。该算法既克服了多值偏向,又考虑了误分类代价问题。首先引进属性相似度和性价比值两者的均衡系数,对ID3算法进行改进;... 针对ID3算法多值偏向及误分类代价被忽视的问题,结合属性相似度和代价敏感学习,提出基于均衡系数的决策树优化算法。该算法既克服了多值偏向,又考虑了误分类代价问题。首先引进属性相似度和性价比值两者的均衡系数,对ID3算法进行改进;然后运用麦克劳林公式对ID3算法进行公式简化;最后将算法改进和公式简化相结合,得到基于均衡系数的决策树优化算法。实验结果表明,基于均衡系数的决策树优化算法,既能够提高分类精度,缩短决策树生成时间,又能考虑代价问题并降低误分类代价,还能克服多值偏向问题。 展开更多
关键词 ID3算法 属性相似度 代价敏感学习 决策树 均衡系数
下载PDF
基于分类挖掘方法的商业银行个人理财业务客户流失分析 被引量:7
20
作者 张旭梅 石瀚凌 《工业工程》 北大核心 2011年第6期126-132,共7页
针对客户流失分析中实际客户样本数据量大、流失与未流失客户样本分布不平衡的特点,提出一种基于Boos-ting与代价敏感决策树的集成方法,并将其应用于商业银行个人理财业务的客户流失分析。通过实际商业银行客户数据集测试,并与支持向量... 针对客户流失分析中实际客户样本数据量大、流失与未流失客户样本分布不平衡的特点,提出一种基于Boos-ting与代价敏感决策树的集成方法,并将其应用于商业银行个人理财业务的客户流失分析。通过实际商业银行客户数据集测试,并与支持向量机、人工神经网络和Logistic回归等方法进行比较,发现该方法能够有效解决客户流失问题。 展开更多
关键词 客户流失 数据挖掘 决策树 BOOSTING算法 代价敏感学习 商业银行个人理财业务
下载PDF
上一页 1 2 4 下一页 到第
使用帮助 返回顶部