期刊文献+
共找到10篇文章
< 1 >
每页显示 20 50 100
不完整数据集的信息熵集成分类算法 被引量:6
1
作者 赵姝 吕靖 +1 位作者 张燕平 张以文 《模式识别与人工智能》 EI CSCD 北大核心 2014年第3期193-198,共6页
集成方法是处理包含缺失属性数据集分类问题的一种简单有效的方法,但目前针对不完整数据的集成分类算法在衡量各子分类器的权重时只考虑对应的数据子集的维数和大小.考虑到不完整数据集的缺失属性对类别的贡献度,使用信息熵衡量缺失属... 集成方法是处理包含缺失属性数据集分类问题的一种简单有效的方法,但目前针对不完整数据的集成分类算法在衡量各子分类器的权重时只考虑对应的数据子集的维数和大小.考虑到不完整数据集的缺失属性对类别的贡献度,使用信息熵衡量缺失属性之间的差异,提出一种新的针对不完整数据的集成学习分类算法———信息熵集成分类算法(EECA).应用以BP神经网络为基础分类器的集成分类器在UCI数据集上进行实验.实验结果表明,EECA比简单使用缺失属性的多少计算子分类器权重的方法更有效,最终结果准确度更高. 展开更多
关键词 信息熵 不完整数据 集成学习 信息熵集成分类算法
下载PDF
不平衡时间序列集成分类算法 被引量:2
2
作者 曹阳 闫秋艳 吴鑫 《计算机应用》 CSCD 北大核心 2021年第3期651-656,共6页
针对现有集成分类方法对不平衡时间序列数据学习能力欠佳的问题,采用优化组件算法性能和集成策略的思路,以异构集成方法即基于变换的集合的层次投票集合(HIVE-COTE)为基础,提出一种不平衡时间序列集成分类算法IMHIVE-COTE。该算法主要... 针对现有集成分类方法对不平衡时间序列数据学习能力欠佳的问题,采用优化组件算法性能和集成策略的思路,以异构集成方法即基于变换的集合的层次投票集合(HIVE-COTE)为基础,提出一种不平衡时间序列集成分类算法IMHIVE-COTE。该算法主要包含两个改进内容:首先,增加了一个新的不平衡分类组件SBST-HESCA,引入Boosting结合重采样的思路,并通过交叉验证预测结果来更新样本权重,从而使数据集的重采样过程更有利于提升少数类样本的分类质量;其次,结合SBST-HESCA组件对HIVE-COTE计算框架进行改进,通过优化组件算法的权重使不平衡时间序列分类算法对分类结果拥有更高的投票比重,从而再次提升集成算法整体的分类质量。实验部分对IMHIVE-COTE的性能进行了验证和分析:和对比方法相比,IMHIVE-COTE有最高的整体分类评价,并且在三个不平衡分类指标值上分别得到了最优、最优、第三优的整体分类评价,可以证明IMHIVE-COTE解决不平衡时间序列分类问题的能力明显较高。 展开更多
关键词 不平衡时间序列 集成分类算法 提升方法 K最近邻 基于变换的集合的层次投票集合
下载PDF
基于集成分类算法的系统性金融风险预警研究 被引量:1
3
作者 汤淳 刘晓星 《运筹与管理》 CSSCI CSCD 北大核心 2023年第6期186-191,198,共7页
利用四种风险测度建立我国系统性金融风险测度体系,基于模糊评价方法与基分类器构建集成分类算法,结合孤立森林对风险的分类预警系统性金融风险,并深入分析预警指标的特征重要性及其对系统性金融风险的静态及动态影响。研究表明:集成分... 利用四种风险测度建立我国系统性金融风险测度体系,基于模糊评价方法与基分类器构建集成分类算法,结合孤立森林对风险的分类预警系统性金融风险,并深入分析预警指标的特征重要性及其对系统性金融风险的静态及动态影响。研究表明:集成分类算法是系统性金融风险预警的一种有效技术手段,数据降维能够进一步提升预警精度且更适用于对极端尾部事件的预警,而滞后期及分类数目的增加则会明显降低预警准确性。预警过程中,股票市场、外部市场及银行体系指标具有较高的特征重要性,这些指标在极端系统性金融风险爆发时期以股市的高位波动及利差收窄为主要特征,同时其对系统性金融风险还具有明显的时变影响。 展开更多
关键词 系统性金融风险 集成分类算法 风险预警 时变性
下载PDF
基于改进Stacking集成分类算法的用户用电信息异常识别 被引量:4
4
作者 闫相伟 宋国壮 刘怡豪 《电子技术应用》 2023年第8期13-18,共6页
随着电力用户信息采集系统的发展,更丰富的用户用电信息被用于用户用电信息异常的识别。基于FDI攻击进行虚假数据注入,构造用户用电信息异常数据集,并提出了一种基于召回率的改进Stacking集成分类算法。该算法采用K-近邻算法(k-Nearest ... 随着电力用户信息采集系统的发展,更丰富的用户用电信息被用于用户用电信息异常的识别。基于FDI攻击进行虚假数据注入,构造用户用电信息异常数据集,并提出了一种基于召回率的改进Stacking集成分类算法。该算法采用K-近邻算法(k-Nearest Neighbors,KNN)、随机森林模型(Random Forests,RF)、支持向量机(Support Vector Machine,SVM)以及梯度决策树(Gradient Boosting Decision Tree,GBDT)作为Stacking结构的基分类模型;采用逻辑回归(Logistic Regression,LR)作为Stacking结构的元分类模型。并基于召回率为基分类模型的输出结果进行权值赋值,从而作为元分类模型的输入数据集。通过实验验证,所提的基于召回率的改进Stacking集成分类算法相比于传统Stacking集成分类算法拥有更高效的分类性能。 展开更多
关键词 用户用电信息 异常识别 改进Stacking集成分类算法 FDI
下载PDF
随机森林的集成分类算法对心胸外科ICU患者谵妄风险的预测分析 被引量:3
5
作者 陈苗 陈青 尹晓清 《中国胸心血管外科临床杂志》 CSCD 北大核心 2022年第7期886-891,共6页
目的分析随机森林的集成分类算法对心胸外科ICU患者谵妄风险的预测效能。方法回顾性分析2019年6月—2020年12月于湖南中医药大学第一附属医院心胸外科ICU治疗360例患者的临床资料,其中男193例、女167例,年龄18~80(56.45±9.33)岁。... 目的分析随机森林的集成分类算法对心胸外科ICU患者谵妄风险的预测效能。方法回顾性分析2019年6月—2020年12月于湖南中医药大学第一附属医院心胸外科ICU治疗360例患者的临床资料,其中男193例、女167例,年龄18~80(56.45±9.33)岁。根据患者住院期间是否发生谵妄分为谵妄组和对照组。比较两组的临床资料,分别通过多因素logistic回归分析模型和随机森林的集成分类算法对影响心胸外科ICU患者发生谵妄风险的相关因素进行预测,并比较两者间预测效能的差异。结果纳入研究的患者中有19例脱落,剩余患者中有165例发生了ICU谵妄列为谵妄组,ICU谵妄发生率为48.39%;176例未发生ICU谵妄者列为对照组。两组性别、文化水平等一般资料差异无统计学意义(P>0.05);但相比于对照组,谵妄组年龄较大,住院时间长,急性生理学和慢性健康状况评分系统Ⅱ(acute physiology and chronic health evaluationⅡ,APACHEⅡ)得分、机械辅助通气所占比例、身体约束所占比例和使用镇静药物所占比例均较高(P<0.05)。多因素logistic回归分析显示:年龄(OR=1.162)、住院时间(OR=1.238)、APACHEⅡ得分(OR=1.057)、机械辅助通气(OR=1.329)、身体约束(OR=1.345)和使用镇静药物(OR=1.630)是心胸外科ICU患者发生谵妄风险的独立危险因素。对随机森林模型各变量的重要程度进行排序,排名在前的重要预测变量为:年龄、住院时间、APACHEⅡ得分、机械辅助通气、身体约束和使用镇静药物。随机森林的集成分类算法的诊断效能明显高于多因素logistic回归分析的诊断效能,其中随机森林的集成分类算法受试者工作特征曲线下面积为0.87,多因素logistic回归分析模型曲线下面积为0.79。结论随机森林的集成分类算法分析预测心胸外科ICU患者发生谵妄的诊断效能更高,可于临床推广应用,有助于早期识别和加强护理高危患者。 展开更多
关键词 随机森林 集成分类算法 谵妄 预测效能 人工智能
原文传递
基于集成SVM数据流分类算法的公司微博金融事件检测方法 被引量:3
6
作者 夏千姿 倪丽萍 +2 位作者 倪志伟 朱旭辉 李想 《计算机应用与软件》 北大核心 2021年第8期150-159,174,共11页
先前事件检测算法需要大量训练样本并且不能动态检测事件。为了从微博短文本中检测金融事件,提出一种从微博中检测公司金融事件的新模型。结合词嵌入与数据流集成分类算法,词嵌入和触发词典用于中文微博文本表示。带有动态时间窗的集成... 先前事件检测算法需要大量训练样本并且不能动态检测事件。为了从微博短文本中检测金融事件,提出一种从微博中检测公司金融事件的新模型。结合词嵌入与数据流集成分类算法,词嵌入和触发词典用于中文微博文本表示。带有动态时间窗的集成数据流分类算法(DSESVM)用于在线事件分类,大大减少了训练数据并动态检测事件。使用五家上市公司的微博文本作为语料库进行测试,实验结果表明,该方法不仅降低了训练样本的比例,还检测了概念漂移,可以有效提高微博中公司金融事件检测的准确性,相对于已有方法,其平均F1值提升5.6~7.2百分点。 展开更多
关键词 公司金融事件检测 集成分类算法 数据流挖掘 词嵌入
下载PDF
分类树集成算法在县域金融贷款风险分类评估中的应用 被引量:3
7
作者 周启清 李毓 《经济问题》 CSSCI 北大核心 2009年第12期94-97,共4页
分类树方法是一种由计算机实现,基于统计理论的非参数识别技术。首先给出Bagging分类树集成算法用于风险评估的基本思想和实现步骤,并以河南省农户贷款的数据为例,分别采用事先预留检验数据集方法和V折交叉确认法来验证Bagging分类树集... 分类树方法是一种由计算机实现,基于统计理论的非参数识别技术。首先给出Bagging分类树集成算法用于风险评估的基本思想和实现步骤,并以河南省农户贷款的数据为例,分别采用事先预留检验数据集方法和V折交叉确认法来验证Bagging分类树集成算法的预测能力。实证结果表明,与分类树算法、线性判别分析方法进行比较,Bagging分类树集成算法在贷款风险分类评估中具有较好的预测能力。 展开更多
关键词 贷款风险评估 BAGGING 分类集成算法
下载PDF
机器学习分类问题及算法研究综述 被引量:176
8
作者 杨剑锋 乔佩蕊 +1 位作者 李永梅 王宁 《统计与决策》 CSSCI 北大核心 2019年第6期36-40,共5页
分类问题及其算法是机器学习的一个重要分支,其应用越来越广泛,相关算法及应用研究取得了长足进展。文章对近年来机器学习分类算法的研究成果进行了回顾,从单一分类算法到集成分类算法分别进行总结,比较了不同分类算法的核心思想、优缺... 分类问题及其算法是机器学习的一个重要分支,其应用越来越广泛,相关算法及应用研究取得了长足进展。文章对近年来机器学习分类算法的研究成果进行了回顾,从单一分类算法到集成分类算法分别进行总结,比较了不同分类算法的核心思想、优缺点以及实际应用,并分析了机器学习分类算法研究所面临的挑战和发展趋势。 展开更多
关键词 机器学习 分类算法 单一分类算法 集成分类算法
下载PDF
基于DBSCAN和BPAdaboost的农机作业地块划分方法 被引量:4
9
作者 李亚硕 赵博 +3 位作者 王长伟 徐名汉 伟利国 庞在溪 《农业机械学报》 EI CAS CSCD 北大核心 2023年第1期37-44,共8页
农业机械(农机)在多个地块作业,费用和效率有时需按地块统计,现有的农机监控系统仅能记录农机定位信息和作业状态信息,难以实现地块的自动精准划分。本文通过研究轨迹点属性特征,分析作业地块数量不确定性和轨迹点分布规律,采用基于密... 农业机械(农机)在多个地块作业,费用和效率有时需按地块统计,现有的农机监控系统仅能记录农机定位信息和作业状态信息,难以实现地块的自动精准划分。本文通过研究轨迹点属性特征,分析作业地块数量不确定性和轨迹点分布规律,采用基于密度聚类方法(Density-based spatial clustering of applications with noise, DBSCAN)和分类器集成算法(BP_Adaboost)结合的方法划分地块。根据DBSCAN算法对农机轨迹点多数有效、识别错误集中的特点,结合BP_Adaboost算法挖掘多维度信息关联、容错能力强、分类效果好等优势,先利用DBSCAN得到初步的轨迹点状态类别,再利用BP_Adaboost算法建立训练模型对农机轨迹点状态精准识别,根据时间序列和类别标记划分地块。本文方法既解决了只依靠阈值和经纬度信息聚类不准确的问题,也减少了大量样本标记工作。利用该方法轨迹点状态识别准确率达96.75%,地块划分准确率为97.74%。 展开更多
关键词 农业机械 作业轨迹 地块划分 密度聚类算法 分类集成算法
下载PDF
基于CFS-SAMME集成算法的入侵检测应用研究
10
作者 贾俊星 《网络安全技术与应用》 2019年第6期30-32,共3页
针对当前网络入侵隐蔽性强、危害大、手段高,传统的入侵检测方法已经难以有效防范的问题,本文进行了基于CFS和SAMME多分类集成算法的入侵检测的应用研究。实验结果表明:经过相关性特征选择后的SAMME多分类集成算法不仅提升了检测准确率... 针对当前网络入侵隐蔽性强、危害大、手段高,传统的入侵检测方法已经难以有效防范的问题,本文进行了基于CFS和SAMME多分类集成算法的入侵检测的应用研究。实验结果表明:经过相关性特征选择后的SAMME多分类集成算法不仅提升了检测准确率,也大幅度提高了入侵检测效率,为入侵检测提供了有效的思路和方法。 展开更多
关键词 CFS 最佳优先搜索 SAMME多分类集成算法
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部