大数据时代,流数据大量涌现.概念漂移作为流数据挖掘中最典型且困难的问题,受到了越来越广泛的关注.集成学习是处理流数据中概念漂移的常用方法,然而在漂移发生后,学习模型往往无法对流数据的分布变化做出及时响应,且不能有效处理不同...大数据时代,流数据大量涌现.概念漂移作为流数据挖掘中最典型且困难的问题,受到了越来越广泛的关注.集成学习是处理流数据中概念漂移的常用方法,然而在漂移发生后,学习模型往往无法对流数据的分布变化做出及时响应,且不能有效处理不同类型概念漂移,导致模型泛化性能下降.针对这个问题,提出一种面向不同类型概念漂移的两阶段自适应集成学习方法(two-stage adaptive ensemble learning method for different types of concept drift,TAEL).该方法首先通过检测漂移跨度来判断概念漂移类型,然后根据不同漂移类型,提出“过滤-扩充”两阶段样本处理机制动态选择合适的样本处理策略.具体地,在过滤阶段,针对不同漂移类型,创建不同的非关键样本过滤器,提取历史样本块中的关键样本,使历史数据分布更接近最新数据分布,提高基学习器有效性;在扩充阶段,提出一种分块优先抽样方法,针对不同漂移类型设置合适的抽取规模,并根据历史关键样本所属类别在当前样本块上的规模占比设置抽样优先级,再由抽样优先级确定抽样概率,依据抽样概率从历史关键样本块中抽取关键样本子集扩充当前样本块,缓解样本扩充后的类别不平衡现象,解决当前基学习器欠拟合问题的同时增强其稳定性.实验结果表明,所提方法能够对不同类型的概念漂移做出及时响应,加快漂移发生后在线集成模型的收敛速度,提高模型的整体泛化性能.展开更多
针对服装风格人工分类受主观性、地域等因素影响而造成的分类错误问题,研究了一种基于人工智能的服装风格图像分类方法。首先,在FashionStyle14数据集基础上筛除重复或无效图像,构建服装风格图像数据集;然后,采用迁移学习方法,对Efficie...针对服装风格人工分类受主观性、地域等因素影响而造成的分类错误问题,研究了一种基于人工智能的服装风格图像分类方法。首先,在FashionStyle14数据集基础上筛除重复或无效图像,构建服装风格图像数据集;然后,采用迁移学习方法,对EfficientNet V2、RegNet Y 16GF和ViT Large 16等模型进行微调训练,生成新模型,实现基于单个深度学习的服装风格图像分类;最后,为进一步提高图像分类的准确性、可靠性和鲁棒性,分别采用基于投票、加权平均和堆叠的集成学习方法对上述单个模型进行组合预测。迁移学习实验结果表明,基于ViT Large 16的深度学习模型在测试集上表现最佳,平均准确率为77.024%;集成学习方法实验结果显示,基于投票的集成学习方法在相同测试集上平均准确率可达78.833%。研究结果为解决服装风格分类问题提供了新的思路。展开更多
地震是极具破坏性与不确定性的自然现象,在人们毫无察觉的情况下地震发生在人口稠密区时,将严重危害人们生命财产安全。人们不断努力了解地震的物理特征和物理危害与环境之间的相互作用,以便在地震发生前发出适当的警报。可靠的地震预...地震是极具破坏性与不确定性的自然现象,在人们毫无察觉的情况下地震发生在人口稠密区时,将严重危害人们生命财产安全。人们不断努力了解地震的物理特征和物理危害与环境之间的相互作用,以便在地震发生前发出适当的警报。可靠的地震预测应包含对地震信号的分析,但是这些信号在地震发生前不明显;因此使用数据驱动机器学习的方法来分析这些信号与地震的联系并预测地震。通过建立观测台网连续监测与地震发生相关的各种物理量或化学量,据此获取的地震前兆信息是地震预测的研究基础。地震发生前,地球物理场发生显著变化,伴随电磁和地声等多种前兆信号,其中电磁和地声信号具有临震特性,是开展地震临震观测预测研究的重要数据来源;因此对地下的电磁扰动和地声信号进行实时监测,获取长期观测数据用于数据驱动机器学习方法预测地震。该文基于AETA数据的临震模型预报,针对多分量地震监测预测系统(Acoustic and Electromagnetic Testing All in one system,AETA)在川滇地区记录的电磁和地声数据,提取时域和频域特征,采用基于随机森林算法、轻量级梯度提升决策树和极度随机树的集成学习方法共同预测该区域的发震情况,选取发震概率最大的子区域中心位置作为震中预测结果,进一步训练LightGBM回归模型以预测此子区域的震级,按周对地震三要素进行预测。实验结果表明,该方法在川滇地区地震风险预测上,准确率可达0.64,震级预测的平均误差为0.38,最小误差为0.00,具有良好的预测效果。展开更多
目前,网络对抗对入侵检测智能化和自主性的需求不断提高,基于深度学习的方法通过训练和学习来区分复杂攻击模式和行为,但有监督的学习方法需要专家知识和大量人工开销。针对上述问题,文章提出一种基于集成学习的无监督网络入侵检测方法...目前,网络对抗对入侵检测智能化和自主性的需求不断提高,基于深度学习的方法通过训练和学习来区分复杂攻击模式和行为,但有监督的学习方法需要专家知识和大量人工开销。针对上述问题,文章提出一种基于集成学习的无监督网络入侵检测方法,并使用基于3种不同异常检测理念的深度学习检测器,在3种不同集成逻辑下对各单检测器的检测结果进行检测判定。该方法可以综合分析时间序列数据中不同类型的异常数据,降低无监督异常检测模型由于过度拟合所造成的影响,并以一种高效的在线方式检测可能存在的网络攻击数据流。在KDD CUP 1999和CSE-CICIDS 2018数据集上进行验证,实验结果表明,与其他单一的无监督异常检测模型相比,文章提出的集成方法结合了不同无监督检测模型的优势,适用于对多种网络入侵引起的异常进行检测。展开更多
文摘大数据时代,流数据大量涌现.概念漂移作为流数据挖掘中最典型且困难的问题,受到了越来越广泛的关注.集成学习是处理流数据中概念漂移的常用方法,然而在漂移发生后,学习模型往往无法对流数据的分布变化做出及时响应,且不能有效处理不同类型概念漂移,导致模型泛化性能下降.针对这个问题,提出一种面向不同类型概念漂移的两阶段自适应集成学习方法(two-stage adaptive ensemble learning method for different types of concept drift,TAEL).该方法首先通过检测漂移跨度来判断概念漂移类型,然后根据不同漂移类型,提出“过滤-扩充”两阶段样本处理机制动态选择合适的样本处理策略.具体地,在过滤阶段,针对不同漂移类型,创建不同的非关键样本过滤器,提取历史样本块中的关键样本,使历史数据分布更接近最新数据分布,提高基学习器有效性;在扩充阶段,提出一种分块优先抽样方法,针对不同漂移类型设置合适的抽取规模,并根据历史关键样本所属类别在当前样本块上的规模占比设置抽样优先级,再由抽样优先级确定抽样概率,依据抽样概率从历史关键样本块中抽取关键样本子集扩充当前样本块,缓解样本扩充后的类别不平衡现象,解决当前基学习器欠拟合问题的同时增强其稳定性.实验结果表明,所提方法能够对不同类型的概念漂移做出及时响应,加快漂移发生后在线集成模型的收敛速度,提高模型的整体泛化性能.
文摘针对服装风格人工分类受主观性、地域等因素影响而造成的分类错误问题,研究了一种基于人工智能的服装风格图像分类方法。首先,在FashionStyle14数据集基础上筛除重复或无效图像,构建服装风格图像数据集;然后,采用迁移学习方法,对EfficientNet V2、RegNet Y 16GF和ViT Large 16等模型进行微调训练,生成新模型,实现基于单个深度学习的服装风格图像分类;最后,为进一步提高图像分类的准确性、可靠性和鲁棒性,分别采用基于投票、加权平均和堆叠的集成学习方法对上述单个模型进行组合预测。迁移学习实验结果表明,基于ViT Large 16的深度学习模型在测试集上表现最佳,平均准确率为77.024%;集成学习方法实验结果显示,基于投票的集成学习方法在相同测试集上平均准确率可达78.833%。研究结果为解决服装风格分类问题提供了新的思路。
文摘地震是极具破坏性与不确定性的自然现象,在人们毫无察觉的情况下地震发生在人口稠密区时,将严重危害人们生命财产安全。人们不断努力了解地震的物理特征和物理危害与环境之间的相互作用,以便在地震发生前发出适当的警报。可靠的地震预测应包含对地震信号的分析,但是这些信号在地震发生前不明显;因此使用数据驱动机器学习的方法来分析这些信号与地震的联系并预测地震。通过建立观测台网连续监测与地震发生相关的各种物理量或化学量,据此获取的地震前兆信息是地震预测的研究基础。地震发生前,地球物理场发生显著变化,伴随电磁和地声等多种前兆信号,其中电磁和地声信号具有临震特性,是开展地震临震观测预测研究的重要数据来源;因此对地下的电磁扰动和地声信号进行实时监测,获取长期观测数据用于数据驱动机器学习方法预测地震。该文基于AETA数据的临震模型预报,针对多分量地震监测预测系统(Acoustic and Electromagnetic Testing All in one system,AETA)在川滇地区记录的电磁和地声数据,提取时域和频域特征,采用基于随机森林算法、轻量级梯度提升决策树和极度随机树的集成学习方法共同预测该区域的发震情况,选取发震概率最大的子区域中心位置作为震中预测结果,进一步训练LightGBM回归模型以预测此子区域的震级,按周对地震三要素进行预测。实验结果表明,该方法在川滇地区地震风险预测上,准确率可达0.64,震级预测的平均误差为0.38,最小误差为0.00,具有良好的预测效果。
文摘目前,网络对抗对入侵检测智能化和自主性的需求不断提高,基于深度学习的方法通过训练和学习来区分复杂攻击模式和行为,但有监督的学习方法需要专家知识和大量人工开销。针对上述问题,文章提出一种基于集成学习的无监督网络入侵检测方法,并使用基于3种不同异常检测理念的深度学习检测器,在3种不同集成逻辑下对各单检测器的检测结果进行检测判定。该方法可以综合分析时间序列数据中不同类型的异常数据,降低无监督异常检测模型由于过度拟合所造成的影响,并以一种高效的在线方式检测可能存在的网络攻击数据流。在KDD CUP 1999和CSE-CICIDS 2018数据集上进行验证,实验结果表明,与其他单一的无监督异常检测模型相比,文章提出的集成方法结合了不同无监督检测模型的优势,适用于对多种网络入侵引起的异常进行检测。