期刊文献+
共找到2,380篇文章
< 1 2 119 >
每页显示 20 50 100
大学英语混合教学中合作学习与自主学习集成模式研究 被引量:20
1
作者 应洁琼 宁强 《教育理论与实践》 北大核心 2019年第3期45-47,共3页
在大学英语混合教学中,合作学习与自主学习集成模式将大学英语教学分成网络平台学习和课堂面授两大模块,学习者在网络平台上以自主学习方式学习知识型内容,在课堂和网络平台上以合作学习方式对技能型内容进行操练。该模式具有学习内容... 在大学英语混合教学中,合作学习与自主学习集成模式将大学英语教学分成网络平台学习和课堂面授两大模块,学习者在网络平台上以自主学习方式学习知识型内容,在课堂和网络平台上以合作学习方式对技能型内容进行操练。该模式具有学习内容多样化、学习载体多元化和学习交互对象国际化等特点。它提倡以学生为中心,实现教师与学生角色的转变,促进学习方式和学习语境的改变,进而提高学生的自主学习能力。这种以合作学习促自主学习的集成模式,有助于提高大学英语教学的效果,对大学英语混合教学有一定的借鉴意义。 展开更多
关键词 大学英语混合教学 合作学习 自主学习 合作学习与自主学习集成模式 学习内容多样化 学习载体多元化 学习交互对象国际化
下载PDF
基于局部异常因子的无监督学习集成异常检测 被引量:3
2
作者 周绪川 蔡利平 《西南民族大学学报(自然科学版)》 CAS 2012年第3期444-448,共5页
研究了基于局部异常因子(LOF)的无监督学习模型共享的集成学习异常检测方法,首先在局部采用LOF无监督学习得到检测模型,然后通过交换局部模型的方式实现集成异常检测.该方法能够从检测数据中自动发现异常样本,无需预先了解数据的分布特... 研究了基于局部异常因子(LOF)的无监督学习模型共享的集成学习异常检测方法,首先在局部采用LOF无监督学习得到检测模型,然后通过交换局部模型的方式实现集成异常检测.该方法能够从检测数据中自动发现异常样本,无需预先了解数据的分布特征,不对数据进行任何假设,适用范围广.方法通过交换检测模型实现数据有效信息的共享,相比集中式方法,减少了网络传输耗费.实验仿真表明,该方法能取得优于或和集中模型相当的检测性能. 展开更多
关键词 局部异常因子 无监督学习 集成学习 异常检测
下载PDF
基于深度学习集成的高速铁路信号设备故障诊断方法 被引量:24
3
作者 李新琴 张鹏翔 +1 位作者 史天运 李平 《铁道学报》 EI CAS CSCD 北大核心 2020年第12期97-105,共9页
基于高速铁路设备故障文本数据,提出高速铁路信号设备故障诊断方法。根据信号道岔设备故障文本数据,结合专家经验,构建两级道岔故障诊断类别;针对信号道岔设备故障样本不均衡性,采用ADASYN样本合成方法合成故障少类别样本;故障诊断模型... 基于高速铁路设备故障文本数据,提出高速铁路信号设备故障诊断方法。根据信号道岔设备故障文本数据,结合专家经验,构建两级道岔故障诊断类别;针对信号道岔设备故障样本不均衡性,采用ADASYN样本合成方法合成故障少类别样本;故障诊断模型中采用TF-IDF实现文本特征提取,应用深度学习BiGRU和BiLSTM对文本进行分类,设计组合权重计算方法将深度学习学习结果进行集成。采用高速铁路2009—2018年产生的信号道岔设备故障数据进行试验验证,试验证明深度学习集成方法能够进一步提升信号设备故障诊断分类性能。 展开更多
关键词 高速铁路信号设备 ADASYN数据合成 深度学习 集成学习 故障诊断
下载PDF
基于重采样和混合集成学习的不平衡窃电检测 被引量:2
4
作者 游文霞 梁皓 +3 位作者 杨楠 李清清 吴永华 李文武 《电网技术》 EI CSCD 北大核心 2024年第2期730-739,共10页
针对电力用户类别不平衡导致窃电检测具有偏向性问题,该文提出一种基于重采样和混合集成学习的不平衡窃电检测模型。首先以Easy-ensemble混合集成学习框架为基础确定最佳采样子集数;然后通过重采样自适应策略,即根据用户用电数据集的不... 针对电力用户类别不平衡导致窃电检测具有偏向性问题,该文提出一种基于重采样和混合集成学习的不平衡窃电检测模型。首先以Easy-ensemble混合集成学习框架为基础确定最佳采样子集数;然后通过重采样自适应策略,即根据用户用电数据集的不平衡度以及最佳采样子集数确定检测模型的重采样方式,使用电数据达到平衡;最后按照先串行集成减小偏差、后并行集成降低方差的混合集成方式,对重采样后的均衡样本进行窃电检测。算例对比分析表明所提检测模型通过重采样和混合集成有效解决了传统集成算法在不平衡窃电检测中的偏向问题,降低了由于用电数据的不平衡性对集成结果的影响,提高了用户类别不平衡的窃电检测效果,在多种不平衡度下模型的准确率、F1值和G均值均表现优异。 展开更多
关键词 窃电检测 不平衡数据 重采样 集成学习 Easy-Ensemble集成框架
下载PDF
基于特征提取和集成学习的个人信用评分方法 被引量:1
5
作者 康海燕 胡成倩 《计算机仿真》 2024年第1期311-320,共10页
在大数据蓬勃发展的今天,信息经济已经深入社会方方面面,个人信用体系建设的重要性越发突出。而传统的信用体系存在覆盖率不足、评价特征维度高、数据孤岛等问题,为了解决以上问题,提出一种基于特征提取和Stacking集成学习的个人信用评... 在大数据蓬勃发展的今天,信息经济已经深入社会方方面面,个人信用体系建设的重要性越发突出。而传统的信用体系存在覆盖率不足、评价特征维度高、数据孤岛等问题,为了解决以上问题,提出一种基于特征提取和Stacking集成学习的个人信用评分方法(PSL-Stacking)。方法首先利用Pearson和Spearman系数对数据进行初始化分析剔除不相关数据,利用LightGBM算法进行特征选择,减少冗余特征对模型的影响;其次选取XGboost、LightGBM、Random Forest以及Huber回归等算法,利用Stacking集成学习技术构造个人信用评分模型。最后,以某电信数据为研究对象,对该上述模型的个人信用评分能力进行验证。实验结果得出上述模型具有很好的预测能力,能够准确的对用户信用进行评分,有效降低企业遭受金融欺诈、团伙套利等问题的风险。 展开更多
关键词 信用评分 特征提取 集成学习 欺诈
下载PDF
集成学习框架下的车辆跟驰行为建模
6
作者 李立 李仕琪 +2 位作者 徐志刚 李光泽 汪贵平 《哈尔滨工业大学学报》 EI CAS CSCD 北大核心 2024年第3期46-55,共10页
为了提高复杂行驶环境下车辆跟驰行为预测精度,提出了一种集成学习框架下融合理论驱动模型和数据驱动模型的车辆跟驰行为建模方法。基于stacking集成学习框架,选择理论驱动的智能驾驶模型(IDM)、考虑车辆队列和周围行驶条件因素的数据... 为了提高复杂行驶环境下车辆跟驰行为预测精度,提出了一种集成学习框架下融合理论驱动模型和数据驱动模型的车辆跟驰行为建模方法。基于stacking集成学习框架,选择理论驱动的智能驾驶模型(IDM)、考虑车辆队列和周围行驶条件因素的数据驱动的长短时记忆(LSTM)网络和门控循环单元(GRU)网络作为跟驰行为特征的一级学习算法,选择3种线性和8种非线性回归方法作为备选二级学习算法来融合一级学习器的输出特征。通过对比使用实际车辆轨迹数据计算的模型预测精度,确定了最优模型。研究结果表明:包含车辆队列和周围行驶条件变量的数据驱动跟驰模型比IDM模型的预测精度更高;多数情况下采用非线性二级学习算法的融合跟驰模型的预测精度高于IDM模型、数据驱动跟驰模型以及采用线性二级学习算法的融合跟驰模型;分别采用GBRT回归和随机森林回归作为二级学习算法的IDM-LSTM-stacking模型和IDM-GRU-stacking模型具有最高的预测精度;外界干扰下的融合跟驰模型稳定性优于单一的理论和数据驱动跟驰模型。集成学习为驾驶行为建模提供了新方法。 展开更多
关键词 交通工程 跟驰模型 集成学习 理论驱动模型 数据驱动模型
下载PDF
结合LSTM自编码器与集成学习的井漏智能识别方法
7
作者 孙伟峰 冯剑寒 +3 位作者 张德志 李威桦 刘凯 戴永寿 《石油钻探技术》 CAS CSCD 北大核心 2024年第3期61-67,共7页
为了解决传统的井漏智能识别模型因井漏样本数量受限导致其识别准确率低的问题,提出了一种长短期记忆(long short-term memory,LSTM)网络与自编码器(auto-encoder,AE)相结合、集成LSTM-AE的井漏智能识别方法。首先,采用正常样本训练多... 为了解决传统的井漏智能识别模型因井漏样本数量受限导致其识别准确率低的问题,提出了一种长短期记忆(long short-term memory,LSTM)网络与自编码器(auto-encoder,AE)相结合、集成LSTM-AE的井漏智能识别方法。首先,采用正常样本训练多个包含不同隐藏层神经元数目的LSTM-AE模型,利用重构得分筛选出识别效果较好的几个模型作为基识别器;然后,采用集成学习对多个基识别器的识别结果进行加权融合,解决单一模型因对样本局部特征过度学习导致的误报与漏报问题,提高模型的识别准确率。从某油田18口井的钻井数据中选取了6000组正常钻进状态下的立压、出口流量、池体积数据,对集成LSTM-AE模型进行训练和测试,结果表明,提出方法的识别准确率达到了94.7%,优于其他常用的智能模型的识别结果,为井漏识别提供了一种新的技术途径。 展开更多
关键词 井漏识别 长短期记忆网络 自编码器 集成学习
下载PDF
面向不同类型概念漂移的两阶段自适应集成学习方法
8
作者 郭虎升 张洋 王文剑 《计算机研究与发展》 EI CSCD 北大核心 2024年第7期1799-1811,共13页
大数据时代,流数据大量涌现.概念漂移作为流数据挖掘中最典型且困难的问题,受到了越来越广泛的关注.集成学习是处理流数据中概念漂移的常用方法,然而在漂移发生后,学习模型往往无法对流数据的分布变化做出及时响应,且不能有效处理不同... 大数据时代,流数据大量涌现.概念漂移作为流数据挖掘中最典型且困难的问题,受到了越来越广泛的关注.集成学习是处理流数据中概念漂移的常用方法,然而在漂移发生后,学习模型往往无法对流数据的分布变化做出及时响应,且不能有效处理不同类型概念漂移,导致模型泛化性能下降.针对这个问题,提出一种面向不同类型概念漂移的两阶段自适应集成学习方法(two-stage adaptive ensemble learning method for different types of concept drift,TAEL).该方法首先通过检测漂移跨度来判断概念漂移类型,然后根据不同漂移类型,提出“过滤-扩充”两阶段样本处理机制动态选择合适的样本处理策略.具体地,在过滤阶段,针对不同漂移类型,创建不同的非关键样本过滤器,提取历史样本块中的关键样本,使历史数据分布更接近最新数据分布,提高基学习器有效性;在扩充阶段,提出一种分块优先抽样方法,针对不同漂移类型设置合适的抽取规模,并根据历史关键样本所属类别在当前样本块上的规模占比设置抽样优先级,再由抽样优先级确定抽样概率,依据抽样概率从历史关键样本块中抽取关键样本子集扩充当前样本块,缓解样本扩充后的类别不平衡现象,解决当前基学习器欠拟合问题的同时增强其稳定性.实验结果表明,所提方法能够对不同类型的概念漂移做出及时响应,加快漂移发生后在线集成模型的收敛速度,提高模型的整体泛化性能. 展开更多
关键词 流数据 概念漂移 集成学习 漂移类型 过滤阶段 扩充阶段
下载PDF
基于改进集成学习的矿井地下水污染风险预测研究
9
作者 李婷 李艳军 +2 位作者 吕英英 杨娟娟 白岩立 《环境科学与管理》 CAS 2024年第2期178-182,共5页
在进行矿井地下水污染风险预测过程中,由于选择的特征与污染风险相关性较低,导致预测精度较差,对此,提出基于改进集成学习的矿井地下水污染风险预测研究,首先利用主成分分析法对矿井地下水污染数据特征进行提取,然后利用SOM网络进行矿... 在进行矿井地下水污染风险预测过程中,由于选择的特征与污染风险相关性较低,导致预测精度较差,对此,提出基于改进集成学习的矿井地下水污染风险预测研究,首先利用主成分分析法对矿井地下水污染数据特征进行提取,然后利用SOM网络进行矿井地下水数据聚类处理,最后采用ENN模型进行矿井地下水污染风险预测。实验结果表明,所提方法的污染物浓度预测RMSE和MAPE分别为22 mg·L^(-1)与9.26%,矿井地下水污染风险指数与实际值拟合度高,且R 2值较大,说明所提方法的风险预测能力较好,具有实用性。 展开更多
关键词 改进集成学习 污染风险预测 SOM网络 ELMAN神经网络
下载PDF
基于组合时域特征提取和Stacking集成学习的燃煤锅炉NO_(x)排放浓度预测
10
作者 唐振浩 隋梦璇 曹生现 《中国电机工程学报》 EI CSCD 北大核心 2024年第16期6551-6564,I0022,共15页
为提高火电厂锅炉出口NO_(x)排放浓度的预测精度,提出一种考虑组合时域特征的Stacking集成学习模型。首先,为挖掘数据深层信息,采用时序分析、完全自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with ada... 为提高火电厂锅炉出口NO_(x)排放浓度的预测精度,提出一种考虑组合时域特征的Stacking集成学习模型。首先,为挖掘数据深层信息,采用时序分析、完全自适应噪声集合经验模态分解(complete ensemble empirical mode decomposition with adaptive noise analysis,CEEMDAN)和统计学计算数据标准差、偏度等特征的方法进行组合时域特征提取以构建重构数据;其次,考虑到重构数据中存在的冗余变量对模型的精度有所影响,利用遗传算法(genetic algorithm,GA)对重构数据进行特征降维;最后,为充分发挥各个模型的优势以提高模型的预测精度,构建以极限学习机(extreme learning machines,ELM)、深度神经网络(deep neural networks,DNN)、多层感知器(multilayer perceptron,MLP)、极限梯度提升算法(extreme gradient boosting,XGBoost)为基模型和以回声状态网络(echo state network,ESN)为元模型的Stacking集成学习NOx排放浓度预测模型。实验结果表明:该预测模型在不同数据集下都有着不错的预测效果,预测误差均小于2%,能够对锅炉NOx排放浓度实现精准预测。 展开更多
关键词 NO_(x)排放浓度 时序特征 时域特征 数据重构 Stacking集成学习
下载PDF
基于欠采样和多层集成学习的恶意网页识别
11
作者 王法玉 于晓文 陈洪涛 《计算机工程与设计》 北大核心 2024年第3期669-675,共7页
现实中恶意网页与良性网页比重严重失衡,传统的机器学习分类模型不能很好的应用,为此提出一种基于欠采样和多层集成学习的恶意网页检测模型。通过欠采样达到局部数据平衡;通过第一层基于权重和阈值的集成学习确保模型的准确度;通过第二... 现实中恶意网页与良性网页比重严重失衡,传统的机器学习分类模型不能很好的应用,为此提出一种基于欠采样和多层集成学习的恶意网页检测模型。通过欠采样达到局部数据平衡;通过第一层基于权重和阈值的集成学习确保模型的准确度;通过第二层基于投票的集成学习保证全局信息的完整性。实验结果表明,所提模型在不平衡数据集上的恶意网页识别性能优于传统机器学习模型。 展开更多
关键词 恶意网页识别 不平衡数据 多层分类器 欠采样 机器学习 集成学习 检测效果
下载PDF
基于Stacking算法集成学习的页岩油储层总有机碳含量评价方法
12
作者 宋延杰 刘英杰 +1 位作者 唐晓敏 张兆谦 《测井技术》 CAS 2024年第2期163-178,共16页
总有机碳含量(TOC)是页岩油储层评价的重要参数,而传统总有机碳含量测井评价方法精度较低且普适性较差,机器学习模型在一定程度上提高了总有机碳含量预测精度,但结果存在不稳定性。为了进一步提高页岩油储层总有机碳含量预测精度,基于... 总有机碳含量(TOC)是页岩油储层评价的重要参数,而传统总有机碳含量测井评价方法精度较低且普适性较差,机器学习模型在一定程度上提高了总有机碳含量预测精度,但结果存在不稳定性。为了进一步提高页岩油储层总有机碳含量预测精度,基于有机质岩石物理特征和不同总有机碳含量测井响应特征的深入分析,优选出深侧向电阻率、声波时差、补偿中子和密度测井曲线作为总有机碳含量的敏感测井响应,并将其作为输入特征,以岩心分析总有机碳含量作为期望输出值,分别建立了决策树模型、支持向量回归机模型、BP(Back Propagation)神经网络模型,并建立了以决策树模型为基模型、支持向量回归机模型为元模型的Stacking算法集成学习模型。利用B油田A区块的岩心样本数据和实际井数据对不同模型预测总有机碳含量结果进行了验证,结果表明,基于Stacking算法的集成学习模型的总有机碳含量预测精度最高,相较于决策树模型、支持向量回归机模型、BP神经网络模型和改进的ΔlgR法,预测精度有较大提高。因此,基于Stacking算法的集成学习模型为该研究区最有效的总有机碳含量计算方法,这为准确地评估页岩油储层的生烃潜力、确保页岩油储层的高效开采及资源利用奠定了基础。 展开更多
关键词 页岩油储层评价 总有机碳含量 决策树 支持向量回归机 Stacking算法 集成学习
下载PDF
基于Stacking集成学习的声波时差测井曲线复原研究
13
作者 曹志民 丁璐 韩建 《化工自动化及仪表》 CAS 2024年第3期470-476,共7页
声波时差测井曲线在石油勘探中发挥着不可或缺的作用,但是受地质或仪器的影响,经常会出现部分甚至完整的声波测井曲线缺失的情况。针对这一问题,提出了一种基于Stacking集成学习的声波时差测井曲线复原方法,该模型使用随机森林(RF)、梯... 声波时差测井曲线在石油勘探中发挥着不可或缺的作用,但是受地质或仪器的影响,经常会出现部分甚至完整的声波测井曲线缺失的情况。针对这一问题,提出了一种基于Stacking集成学习的声波时差测井曲线复原方法,该模型使用随机森林(RF)、梯度提升决策树(GBDT)、轻量梯度提升机(LightGBM)和极限梯度提升(XGBoost)作为基学习器,支持向量回归(SVR)作为元学习器,同时采用5折交叉验证的方法。实验选取了大庆油田某区块的实际测井数据,分别进行了同井和异井间的缺失声波时差测井曲线复原实验,结果表明,所提方法比单一模型预测更加准确,验证了此方法的可行性。 展开更多
关键词 声波时差测井曲线 Stacking集成学习 测井曲线复原 5折交叉验证
下载PDF
基于集成学习的无监督网络入侵检测方法
14
作者 江荣 刘海天 刘聪 《信息网络安全》 CSCD 北大核心 2024年第3期411-426,共16页
目前,网络对抗对入侵检测智能化和自主性的需求不断提高,基于深度学习的方法通过训练和学习来区分复杂攻击模式和行为,但有监督的学习方法需要专家知识和大量人工开销。针对上述问题,文章提出一种基于集成学习的无监督网络入侵检测方法... 目前,网络对抗对入侵检测智能化和自主性的需求不断提高,基于深度学习的方法通过训练和学习来区分复杂攻击模式和行为,但有监督的学习方法需要专家知识和大量人工开销。针对上述问题,文章提出一种基于集成学习的无监督网络入侵检测方法,并使用基于3种不同异常检测理念的深度学习检测器,在3种不同集成逻辑下对各单检测器的检测结果进行检测判定。该方法可以综合分析时间序列数据中不同类型的异常数据,降低无监督异常检测模型由于过度拟合所造成的影响,并以一种高效的在线方式检测可能存在的网络攻击数据流。在KDD CUP 1999和CSE-CICIDS 2018数据集上进行验证,实验结果表明,与其他单一的无监督异常检测模型相比,文章提出的集成方法结合了不同无监督检测模型的优势,适用于对多种网络入侵引起的异常进行检测。 展开更多
关键词 入侵检测系统 异常检测 无监督深度学习 集成学习
下载PDF
基于CNN-SVM和集成学习的固井质量评价方法
15
作者 肖红 钱祎鸣 《吉林大学学报(理学版)》 CAS 北大核心 2024年第4期960-970,共11页
为解决固井质量评价问题,提出一种基于CNN-SVM和集成学习的固井质量评价方法.首先,针对DenseNet模型采取缩减网络层数、增加多尺度卷积层、嵌入卷积注意力模块等改进措施,以提高模型的训练速度和评价准确率;其次,利用InceptionV1模块和... 为解决固井质量评价问题,提出一种基于CNN-SVM和集成学习的固井质量评价方法.首先,针对DenseNet模型采取缩减网络层数、增加多尺度卷积层、嵌入卷积注意力模块等改进措施,以提高模型的训练速度和评价准确率;其次,利用InceptionV1模块和扩张卷积构建一个模型复杂度相对较小且评价准确率相对较高的Inception-DCNN模型;再次,优选3个经典的卷积神经网络模型(ResNet50,MobileNetV3-Small, GhostNet),利用卷积神经网络强大的特征提取能力及支持向量机的结构风险最小化能力,将上述模型分别与支持向量机组合成新的CNN-SVM模型,以提升模型的泛化能力;最后,采用Bagging方式将5个新的CNN-SVM模型集成为一个强学习器,从而提升评价结果的准确度,增强模型的抗干扰能力.实验结果表明,该方法对测试集中的3类评价样本的准确率为97.69%,与单个模型和其他方法相比提升了1~9个百分点,验证了采用基于CNN-SVM和集成学习的方法进行固井质量评价是切实可行的. 展开更多
关键词 固井质量评价 扇区水泥胶结测井 集成学习 卷积神经网络 支持向量机
下载PDF
基于集成学习的内陆水体叶绿素a浓度反演
16
作者 孟黎 孟静 《海河水利》 2024年第2期17-21,共5页
利用卫星数据监测内陆或水质状态,对生态决策具有重要意义。基于具有高时空分辨率的哨兵二号卫星数据,联合2种集成学习算法反演山东省南四湖叶绿素a(Chla)浓度,结果表明经遥感反射率校正后的哨兵二号数据更加适用于水质反演。XGBoost模... 利用卫星数据监测内陆或水质状态,对生态决策具有重要意义。基于具有高时空分辨率的哨兵二号卫星数据,联合2种集成学习算法反演山东省南四湖叶绿素a(Chla)浓度,结果表明经遥感反射率校正后的哨兵二号数据更加适用于水质反演。XGBoost模型在五折交叉验证反演结果上表现最优(R^(2)=0.732 5,RMSE=9.168 1μg/L),反演结果更符合实际情况。因此,使用该模型反演南四湖叶绿素a浓度,能较好地掌握其时空变化情况,对其他区域类似研究可提供一定参考。 展开更多
关键词 哨兵二号数据 南四湖 叶绿素A 集成学习
下载PDF
基于Stacking集成学习的远程资源传输负荷预测
17
作者 商娟叶 《信息技术》 2024年第6期94-99,104,共7页
传统电网远程资源传输负荷预测方法忽略了对资源的集成训练,导致电网负荷预测结果与实际值偏差较大。为此,提出基于Stacking集成学习的远程资源传输负荷预测方法。构建Stacking集成学习模型,同时通过长短时记忆网络构建Stacking-LSTM网... 传统电网远程资源传输负荷预测方法忽略了对资源的集成训练,导致电网负荷预测结果与实际值偏差较大。为此,提出基于Stacking集成学习的远程资源传输负荷预测方法。构建Stacking集成学习模型,同时通过长短时记忆网络构建Stacking-LSTM网络混合模型,利用时间滑动窗口构建影响因素数据特征图,并将其输入网络混合模型,利用Stacking基础学习训练层实现训练,并将训练结果输入LSTM网络层,完成电网远程资源传输负荷预测。实验结果表明:该方法的网络收敛速度较快,获取特征的贡献度较高,且负荷预测结果接近实际值,可以较好地跟踪负荷变化情况。 展开更多
关键词 Stacking集成学习 远程资源传输 负荷预测 长短时记忆 滑动窗口
下载PDF
基于三重混合采样和集成学习的潜在高价值旅客发现
18
作者 冯霞 胡昉 《计算机应用与软件》 北大核心 2024年第1期12-17,35,共7页
考虑潜在高价值旅客特有的数据高度不平衡、旅客特征和价值类别弱相关等问题,提出一种基于三重混合采样和集成学习的潜在高价值旅客发现模型。采用RFM(Recency Frequency Monetary)方法标注旅客类别;使用三重混合采样对不平衡旅客数据... 考虑潜在高价值旅客特有的数据高度不平衡、旅客特征和价值类别弱相关等问题,提出一种基于三重混合采样和集成学习的潜在高价值旅客发现模型。采用RFM(Recency Frequency Monetary)方法标注旅客类别;使用三重混合采样对不平衡旅客数据集进行重采样;使用融合特征选择算法遴选旅客特征;使用梯度提升决策树作为分类器,构建旅客价值预测模型,识别潜在高价值旅客。在PNR数据集上的实验结果表明,与基准算法相比,该模型能取得更好的AUC值和F1值,可以较好地识别潜在高价值旅客。 展开更多
关键词 航空运输 三重混合采样 特征重要性排序 潜在高价值旅客 不平衡分类 集成学习
下载PDF
基于集成学习的航空器着陆跑道占用时间预测
19
作者 陈亚青 陈九龙 《现代计算机》 2024年第5期93-96,共4页
为准确预测航空器着陆跑道占用时间,提出了一种基于集成学习的航空器着陆跑道占用时间预测模型。首先,根据航空器机载QAR数据处理后得到的航空器影响因素,利用皮尔逊积矩相关系数进行相关性排序;其次构建了基于stacking集成学习策略的... 为准确预测航空器着陆跑道占用时间,提出了一种基于集成学习的航空器着陆跑道占用时间预测模型。首先,根据航空器机载QAR数据处理后得到的航空器影响因素,利用皮尔逊积矩相关系数进行相关性排序;其次构建了基于stacking集成学习策略的预测模型,实现了对着陆跑道占用时间的预测;最后通过模型评价指标对比了各预测模型预测精度。实验结果表明,提出的集成学习预测模型的准确性更高,可为机场实际运行效率提升提供理论依据。 展开更多
关键词 集成学习 跑道占用时间 预测模型 QAR
下载PDF
基于数据增强和集成学习的矿物图像识别 被引量:1
20
作者 王琳 季晓慧 +4 位作者 杨眉 何明跃 张招崇 曾姗 王玉柱 《地学前缘》 EI CAS CSCD 北大核心 2024年第4期87-94,共8页
矿物识别是地质学研究的一个重要部分,对于资源勘探、岩石分类和地质环境监测都有着重要的意义。然而,传统方法通常依赖人的经验进行主观判断,并且效率低下。近年来,已有许多研究将深度学习的图像分类技术应用于矿物识别,以客观快速地... 矿物识别是地质学研究的一个重要部分,对于资源勘探、岩石分类和地质环境监测都有着重要的意义。然而,传统方法通常依赖人的经验进行主观判断,并且效率低下。近年来,已有许多研究将深度学习的图像分类技术应用于矿物识别,以客观快速地识别矿物,这些研究都取得了一定的成果,但可识别矿物种类有限且精度需要进一步提升。为此本文首先解决了矿物数据集图像数据样本分布不平衡问题,对数据集中矿物图像较少的11个矿物类别采用DCGAN生成矿物图像进行数据增强,对比选择效果更好的方案对数据集进行扩充。其次,为了得到更可靠、精确度更高的识别模型,将ImageNet上表现较好的ResNet、RegNet、EfficientNet和Vision Transformer模型迁移到本文使用的矿物数据集上。针对训练好的基模型排列组合得到11个子模型,分别使用平均软投票法和加权软投票法两种方法进行集成,得到22个集成模型并对其训练得到识别结果,对比22个集成模型的结果选择出精度最高的集成模型。实验结果表明:使用DCGAN进行数据增强,在不同的模型上平均提升了3.12%的准确率,充分证明了DCGAN数据增强的有效性;在所有集成模型中,使用加权软投票法的模型表现较好,其中精度最高的是利用4个基分类模型进行加权软投票得到的集成模型,在扩充后的36种常见矿物数据集上达到了87.47%的准确率。 展开更多
关键词 矿物识别 深度卷积生成对抗网络 数据增强 集成学习
下载PDF
上一页 1 2 119 下一页 到第
使用帮助 返回顶部