期刊文献+
共找到44篇文章
< 1 2 3 >
每页显示 20 50 100
基于深度学习的位置大数据统计发布与隐私保护方法 被引量:9
1
作者 晏燕 丛一鸣 +1 位作者 Adnan Mahmood 盛权政 《通信学报》 EI CSCD 北大核心 2022年第1期203-216,共14页
针对传统位置大数据统计划分发布结构不合理、划分发布方法效率低下的问题,提出一种基于深度学习的位置大数据统计划分结构预测方法和差分隐私发布方法,以提高位置大数据统计划分发布数据的可用性和执行效率。首先对二维空间进行细致划... 针对传统位置大数据统计划分发布结构不合理、划分发布方法效率低下的问题,提出一种基于深度学习的位置大数据统计划分结构预测方法和差分隐私发布方法,以提高位置大数据统计划分发布数据的可用性和执行效率。首先对二维空间进行细致划分和自底向上合并,从而构建合理的空间划分结构。然后将划分结构矩阵组织为三维时空序列,借助深度学习模型提取时空特征,实现对划分发布结构的预测。最后结合预测划分发布结构进行差分隐私预算分配和Laplace噪声添加,实现位置大数据统计划分发布信息的隐私保护。通过实际位置大数据集的实验,证明了所提方法在提高发布数据查询精度和运行效率方面的优势。 展开更多
关键词 数据发布隐私保护 位置隐私 隐私空间分解 差分隐私 深度学习
下载PDF
基于深度学习与SVM的配电网工程数据预测分析模型设计 被引量:3
2
作者 赵隆乾 路长宝 +2 位作者 张强 赵健勃 朱文超 《电子设计工程》 2023年第8期90-94,共5页
为了提升配电网工程数据的精细化管控水平,文中基于人工智能技术的深度学习理论进行了工程造价预测模型的设计。将数据预测问题转化为非线性分类问题,采用支持向量机(Support Vector Machines,SVM)对该问题进行求解。在求解的过程中引... 为了提升配电网工程数据的精细化管控水平,文中基于人工智能技术的深度学习理论进行了工程造价预测模型的设计。将数据预测问题转化为非线性分类问题,采用支持向量机(Support Vector Machines,SVM)对该问题进行求解。在求解的过程中引入高斯径向基函数,改善SVM算法在多维数据空间中的分类能力。为了提升单个SVM分类器在训练过程中的过拟合和欠拟合现象,通过使用深度学习中的Boosting算法,将若干个弱SVM分类器有机结合并融合为强分类器。以某地区的配电网工程数据集为样本,对算法性能进行测试。实验结果表明,在适当的参数设置下,该算法对于配电网工程造价的预测精度可达到95.62%,相较于GA-BP神经网络提升了2.84%。 展开更多
关键词 支持向量 深度学习 BOOSTING 工程造价 配电网 数据分析
下载PDF
基于深度学习与随机森林的高维数据特征选择 被引量:16
3
作者 冯晓荣 瞿国庆 《计算机工程与设计》 北大核心 2019年第9期2494-2501,共8页
针对特征选择算法对高维大数据降维效果与稳定性差的缺点,提出一种基于深度学习与随机森林的大数据特征选择算法。设计基于随机森林的特征消除算法,对高维大数据集进行特征降维处理;采用保留的特征对受限玻尔兹曼机进行训练,确定受限玻... 针对特征选择算法对高维大数据降维效果与稳定性差的缺点,提出一种基于深度学习与随机森林的大数据特征选择算法。设计基于随机森林的特征消除算法,对高维大数据集进行特征降维处理;采用保留的特征对受限玻尔兹曼机进行训练,确定受限玻尔兹曼机的模型结构与权重;使用训练受限玻尔兹曼机的学习参数初始化一个多层神经网络,通过标准的后向传播方法训练多层神经网络。基于多组数据集的实验结果表明,该算法提高了高维数据集特征选择的化简效果,保持了较高的稳定性与鲁棒性。 展开更多
关键词 特征选择 数据 高维数据 深度学习 森林 受限玻尔兹曼
下载PDF
基于改进麻雀算法优化深度极限学习机的缺失数据预测 被引量:7
4
作者 张文帅 王占刚 《电子测量技术》 北大核心 2022年第15期63-67,共5页
数据缺失降低了数据的可利用性,因此如何预测缺失数据变得尤为重要。针对缺失数据问题,提出一种改进麻雀搜索算法优化深度极限学习机的预测算法。首先,将Singer混沌映射、柯西-高斯变异策略和余弦权重因子与麻雀搜索算法结合;其次利用... 数据缺失降低了数据的可利用性,因此如何预测缺失数据变得尤为重要。针对缺失数据问题,提出一种改进麻雀搜索算法优化深度极限学习机的预测算法。首先,将Singer混沌映射、柯西-高斯变异策略和余弦权重因子与麻雀搜索算法结合;其次利用改进后的麻雀搜索算法优化深度极限学习机中的各极限学习机中自动编码器的输入权重与偏置,进行缺失数据预测。实验表明,在小数据量,低缺失率下时,改进麻雀搜索算法优化深度极限学习机相较于麻雀搜索算法优化深度极限学习机、粒子群优化深度极限学习机、深度极限学习机,其稳定性强,预测精度最高;在均方根误差、平均绝对误差等评价指标上改进麻雀搜索算法优化深度极限学习机优于对比算法。 展开更多
关键词 缺失数据预测 深度极限学习 麻雀搜索算法 混沌映射 变异策略
下载PDF
基于深度自回归模型的电网异常流量检测算法 被引量:1
5
作者 李勇 韩俊飞 +2 位作者 李秀芬 王鹏 王蓓 《沈阳工业大学学报》 CAS 北大核心 2024年第1期24-28,共5页
针对电网中行为种类复杂多样且数量众多的问题,提出了一种基于自回归模型的电网异常流量检测算法。该算法利用深度自编码网络自动提取网络流量数据的特征,降低异常流量检测的分析周期,并自动挖掘数据的层次关系。通过支持向量机对提取... 针对电网中行为种类复杂多样且数量众多的问题,提出了一种基于自回归模型的电网异常流量检测算法。该算法利用深度自编码网络自动提取网络流量数据的特征,降低异常流量检测的分析周期,并自动挖掘数据的层次关系。通过支持向量机对提取的特征进行分类,实现对异常流量的检测。仿真实验结果表明,所提算法可以分析不同攻击向量,避免噪声数据的干扰,进而提高电网异常流量检测的精度,对于流量数据处理具有重要意义。 展开更多
关键词 自回归模型 深度学习 异常检测 海量数据 分析周期 支持向量
下载PDF
基于深度学习的不完整大数据填充算法 被引量:12
6
作者 卜范玉 陈志奎 张清辰 《微电子学与计算机》 CSCD 北大核心 2014年第12期173-176,共4页
提出一种基于深度学习的不完整大数据填充算法.算法首先以自动编码机为基础建立填充自动编码机.在此基础上,构建深度填充网络模型,分析不完整大数据的深度特征并根据逐层训练思想和反向传播算法计算网络参数.最后利用深度填充网络来还... 提出一种基于深度学习的不完整大数据填充算法.算法首先以自动编码机为基础建立填充自动编码机.在此基础上,构建深度填充网络模型,分析不完整大数据的深度特征并根据逐层训练思想和反向传播算法计算网络参数.最后利用深度填充网络来还原不完整大数据,对缺失值进行填充.实验表明,提出的算法能够有效提高不完整大数据的填充精度. 展开更多
关键词 深度学习 缺失数据填充 自动编码 数据
下载PDF
基于数据驱动的配电网无功优化 被引量:4
7
作者 蔡昌春 程增茂 +2 位作者 张关应 李源佳 储云迪 《电网技术》 EI CSCD 北大核心 2024年第1期373-382,共10页
传统无功电压控制由于分布式电源、储能以及柔性负荷的接入面临计算速度和精度上的挑战。该文提出了一种基于数据驱动的配电网无功电压优化方法,通过跟踪实际系统的运行参数,实现无功电压的主动控制。在极限学习机中引入自动编码器构建... 传统无功电压控制由于分布式电源、储能以及柔性负荷的接入面临计算速度和精度上的挑战。该文提出了一种基于数据驱动的配电网无功电压优化方法,通过跟踪实际系统的运行参数,实现无功电压的主动控制。在极限学习机中引入自动编码器构建深度学习机制,利用自动编码器建立极限学习机输入-输出的直接耦合关系,实现无监督学习和有监督学习有机结合,缩短训练模型的迭代过程;利用蒙特卡洛法基于分布式电源、负荷预测信息构建配电网运行场景,利用深度极限学习机挖掘运行场景优化运行与无功调压设备状态间的内在联系,建立电网运行场景与系统无功调压策略的映射关系。该文提出的基于数据驱动的无功优化方法不依赖实际系统潮流计算,能够实现配电网运行状态的跟踪和无功调节设备的优化调度,为配电网无功电压的主动控制打下基础。 展开更多
关键词 数据驱动 无功优化 深度极限学习 自动编码器 主动控制
下载PDF
高等教育大数据背景下学生成绩分析研究现状
8
作者 王劲 彭君晟 +2 位作者 龙江 郭阳明 郑波 《中国教育技术装备》 2024年第14期32-36,共5页
教育大数据现已成为促进教育变革与创新的技术力量和思维方式,也成为当前教育技术领域研究的热点问题。在高等教育大数据中,学生成绩分析是核心问题,受到众多研究者与研究机构的关注。从教育数据挖掘的角度对学生成绩分析进行系统性综述... 教育大数据现已成为促进教育变革与创新的技术力量和思维方式,也成为当前教育技术领域研究的热点问题。在高等教育大数据中,学生成绩分析是核心问题,受到众多研究者与研究机构的关注。从教育数据挖掘的角度对学生成绩分析进行系统性综述,将学生成绩分析划分为三个步骤,即教育大数据的获取与预处理、学生成绩分析方法和数据分析结果可视化及应用,详细介绍学生成绩分析的各类方法以及应用,依据学生成绩分析研究进行总结,并对未来研究方向进行展望。 展开更多
关键词 高等教育 教育大数据 教育数据挖掘 学生成绩分析 集成学习 深度学习 支持向量
下载PDF
基于深度强化学习的自适应虚拟机整合方法 被引量:9
9
作者 余显 李振宇 +3 位作者 孙胜 张广兴 刁祖龙 谢高岗 《计算机研究与发展》 EI CSCD 北大核心 2021年第12期2783-2797,共15页
能耗限制的服务质量优化问题一直以来都是数据中心虚拟机资源管理所面临的巨大挑战之一.尽管现有的工作通过虚拟机整合技术一定程度上降低了能耗和提升了系统服务质量,但这些方法通常难以实现长期最优的管理目标,并且容易受到业务场景... 能耗限制的服务质量优化问题一直以来都是数据中心虚拟机资源管理所面临的巨大挑战之一.尽管现有的工作通过虚拟机整合技术一定程度上降低了能耗和提升了系统服务质量,但这些方法通常难以实现长期最优的管理目标,并且容易受到业务场景变化的影响,面临变更困难以及管理成本高等难题.针对数据中心虚拟机资源管理存在的能耗和服务质量长期最优难保证以及策略调整灵活性差的问题,提出了一种基于深度强化学习的自适应虚拟机整合方法(deep reinforcement learning-based adaptive virtual machine consolidation method,RA-VMC).该方法利用张量化状态表示、确定性动作输出、卷积神经网络和加权奖赏机制构建了从数据中心系统状态到虚拟机迁移策略的端到端决策模型;设计自动化状态生成机制和反向梯度限定机制以改进深度确定性策略梯度算法,加快虚拟机迁移决策模型的收敛速度并且保证近似最优的管理性能.基于真实虚拟机负载数据的仿真实验结果表明:与开源云平台中流行的虚拟机整合方法相比,该方法能够有效地降低能耗和提高系统的服务质量. 展开更多
关键词 数据中心 虚拟资源管理 虚拟整合 强化学习 深度确定性策略梯度
下载PDF
TOF相机深度数据测量中的空间配准方法研究 被引量:2
10
作者 王世程 于微波 杨宏韬 《组合机床与自动化加工技术》 北大核心 2020年第7期55-59,64,共6页
针对TOF深度相机获取的原始深度数据存在多种误差,导致成像出现畸变的问题。提出建立改进小波序贯极限学习机(CFWNN-OSELM)空间配准模型的方法,对TOF相机深度数据测量过程中非系统性和系统性误差的叠加导致的深度数据偏移进行统一校正... 针对TOF深度相机获取的原始深度数据存在多种误差,导致成像出现畸变的问题。提出建立改进小波序贯极限学习机(CFWNN-OSELM)空间配准模型的方法,对TOF相机深度数据测量过程中非系统性和系统性误差的叠加导致的深度数据偏移进行统一校正。并与基于ELM算法和BP算法分别建立的空间配准模型以及基于小孔成像原理校正的结果进行比较。经实验分析,采用CFWNN-OSELM所建立的空间配准模型大幅减小了TOF相机测量深度数据的误差,泛化能力强,能够实现在线增量式快速学习。为TOF相机测量深度数据的校正方法提供了一种新的思路方法。 展开更多
关键词 TOF深度 序贯极限学习 空间配准模型 数据校正
下载PDF
基于深度学习的电力大数据融合与异常检测方法 被引量:37
11
作者 刘冬兰 马雷 +2 位作者 刘新 李冬 常英贤 《计算机应用与软件》 北大核心 2018年第4期61-64,136,共5页
为了充分利用电力大数据中的异构数据源挖掘出电网中存在的安全威胁,采用深度受限玻尔兹曼机将不同格式的异构数据映射到统一的嵌入式向量空间,实现了异构数据的融合。采用循环神经网络对得到的嵌入式向量数据建立画像,实现了数据中异... 为了充分利用电力大数据中的异构数据源挖掘出电网中存在的安全威胁,采用深度受限玻尔兹曼机将不同格式的异构数据映射到统一的嵌入式向量空间,实现了异构数据的融合。采用循环神经网络对得到的嵌入式向量数据建立画像,实现了数据中异常事件的检测。实验结果表明,提出的异常检测方法在提出的互信息量度量指标中具有很高的互信息量。此外提出的方法在准确率、误报率和漏报率中的结果也优于其他异常检测方法。 展开更多
关键词 电力大数据 受限玻尔兹曼 循环神经网络 异常检测 深度学习 数据融合
下载PDF
基于极限学习机与旋转森林相结合的栈式深度学习分类方法 被引量:4
12
作者 杜晓明 汤立 +1 位作者 蔡李花 周塔 《江苏科技大学学报(自然科学版)》 CAS 2019年第6期82-87,共6页
大数据时代的到来导致简单机器学习所建立起来的单一模型往往不能充分挖掘大样本数据所承载的丰富信息,同时在学习能力上也略显不足.在此背景下,文中将旋转森林算法(rotation-forest,ROF)与极限学习机(extreme learning machine,ELM)相... 大数据时代的到来导致简单机器学习所建立起来的单一模型往往不能充分挖掘大样本数据所承载的丰富信息,同时在学习能力上也略显不足.在此背景下,文中将旋转森林算法(rotation-forest,ROF)与极限学习机(extreme learning machine,ELM)相结合,构建一个基础神经元单元,然后通过栈式泛化原理进行逐层构建,形成一种快速保持源域空间特征的深度学习模型(D-R-ELM).D-R-ELM由多个基础神经元构成,这些基础神经元通过一种特殊的栈式构造方式,既保证了较好的学习能力,同时也减少了训练成本.实验结果表明:D-R-ELM的深层结构模型,在大样本数据上相比于Adaboosting、Bagging、ELM、ROF和Rotboost传统分类器表现出更好的分类性能、稳定性与泛化性能. 展开更多
关键词 旋转森林 极限学习 深度学习 栈式泛化原理 大样本数据
下载PDF
结合数据增强及组合算法的短期光伏功率预测
13
作者 毛嘉铭 刘光宇 罗凯元 《电力系统及其自动化学报》 CSCD 北大核心 2024年第8期133-141,共9页
针对光伏发电数据完备性低、预测精度低的问题,提出结合数据增强及组合算法的短期光伏功率预测模型。首先,利用K-means++聚类算法对光伏数据进行天气分型;其次,利用条件生成对抗网络对光伏数据的分布规律进行学习,生成高质量样本;然后,... 针对光伏发电数据完备性低、预测精度低的问题,提出结合数据增强及组合算法的短期光伏功率预测模型。首先,利用K-means++聚类算法对光伏数据进行天气分型;其次,利用条件生成对抗网络对光伏数据的分布规律进行学习,生成高质量样本;然后,优化变分模态分解的分解数和惩罚因子,进一步降低子序列的模糊熵值;最后,通过正余弦算法对深度极限学习机的输入权重和偏置进行优化,分别对各子序列进行建立预测模型。实验结果表明,所提模型具有一定的优越性。 展开更多
关键词 光伏功率预测 数据增强 变分模态分解 深度极限学习 正余弦算法
下载PDF
基于机器学习的电网威胁检测算法模型和大数据平台设计 被引量:3
14
作者 陈益芳 宣羿 +4 位作者 樊立波 孙智卿 屠永伟 张亦涵 蔡乾晨 《电力大数据》 2022年第4期34-41,共8页
近年来,电力企业高价值数据和重要业务面临的网络攻击风险越来越严重,新型网络攻击技术、APT组织与攻击手段等对电力企业安全生产造成了严重威胁。针对各类型攻击形式,通用的威胁检测模型难以匹配电力生产实际网络和业务环境,存在检出... 近年来,电力企业高价值数据和重要业务面临的网络攻击风险越来越严重,新型网络攻击技术、APT组织与攻击手段等对电力企业安全生产造成了严重威胁。针对各类型攻击形式,通用的威胁检测模型难以匹配电力生产实际网络和业务环境,存在检出率低、误报率高、难部署使用等不足。本文通过构建网络安全大数据平台,对电力企业生产运行和管理办公环境的网络安全相关数据进行统一采集、处理、分析和存储,进一步使用支持向量机、深度神经网络等机器学习算法对数据进行聚合、关联,生成细粒度攻击链条并匹配各类型攻防维基库,实现攻击行为的准确定位和攻击者画像的描绘。本文提出的基于电力企业网络安全大数据平台和威胁检测算法,构建匹配电力行业业务特点的网络安全威胁分析和处置中心,提升电力企业整体网络安全能力。 展开更多
关键词 网络安全 学习 支持向量 深度神经网络 数据分析 攻击者画像描绘
下载PDF
关于点击率大数据的高阶深度分解机预测仿真
15
作者 张换梅 董云云 《计算机仿真》 北大核心 2021年第3期456-460,共5页
互联网大数据具有典型的高维、高阶,以及非线性特征,现有点击率数据预测方法往往难以有效处理数据特征的复杂耦合、以及稀疏与类别的不均衡问题,为解决上述问题,提出了一种高阶深度分解机预测方法。在高阶分解机设计中,考虑到点击率的... 互联网大数据具有典型的高维、高阶,以及非线性特征,现有点击率数据预测方法往往难以有效处理数据特征的复杂耦合、以及稀疏与类别的不均衡问题,为解决上述问题,提出了一种高阶深度分解机预测方法。在高阶分解机设计中,考虑到点击率的二分类特性,采用函数把输入数据映射至输出结果的二值类上,并利用损失函数求偏导对模型变量进行梯度更新。为了优化模型的复杂度及其多阶性能,对映射二次项采取转换,并推广至三阶映射模型。最后,设计了单层与多层构成的深度网络,根据的对称性与偏置训练样本集,利用弥补的无监督学习。并在梯度计算时引入对比散度用以优化网络训练速度,在神经网络层采用机制用以避免网络发生过拟合。仿真结果表明,高阶深度分解机预测方法具有良好的和指标性能,能够有效提高高阶点击率大数据的预测准确度与预测速度。 展开更多
关键词 点击率大数据 高阶分解模型 梯度计算 损失函数 深度网络学习
下载PDF
基于支持向量机的风电并网短期负荷预测方法
16
作者 赵焱斌 《电气时代》 2024年第9期32-34,共3页
在对风电并网短期负荷进行预测时,由于历史负荷数据、风速数据和时间数据等特征具有多维度属性,导致预测结果的准确性难以得到保障。为此,提出基于支持向量机的风电并网短期负荷预测方法研究。通过构建风电并网支持向量机,将负荷预测问... 在对风电并网短期负荷进行预测时,由于历史负荷数据、风速数据和时间数据等特征具有多维度属性,导致预测结果的准确性难以得到保障。为此,提出基于支持向量机的风电并网短期负荷预测方法研究。通过构建风电并网支持向量机,将负荷预测问题转化为二次规划问题,将历史负荷数据、风速数据和时间数据等作为特征,以高斯核函数为基础,构建风电并网数据的特征空间,并为其建立的映射也同样为非线性映射机制。在短期负荷预测阶段,利用风电并网向量机特征的深度学习结果对映射进行校正,代入具体的运行数据,即可得到对应的预测结果。 展开更多
关键词 深度学习 支持向量 时间数据 高斯核函数 非线性映射 特征空间 短期负荷 负荷数据
下载PDF
基于深度学习的短时热网负荷预测 被引量:7
17
作者 孙海蓉 田瑶 谢碧霞 《计算机仿真》 北大核心 2019年第2期79-82,301,共5页
针对现有的预测方法无法实现热网负荷数据本质特征的挖掘,提出了一种基于深度学习的短时热网负荷预测方法。方法将深度信念网络模型(DBN)与支撑向量机回归模型(SVR)进行结合,利用深度信念网络进行数据本质特征的学习,同时作为网络顶层... 针对现有的预测方法无法实现热网负荷数据本质特征的挖掘,提出了一种基于深度学习的短时热网负荷预测方法。方法将深度信念网络模型(DBN)与支撑向量机回归模型(SVR)进行结合,利用深度信念网络进行数据本质特征的学习,同时作为网络顶层支撑向量机模型的输入来实现负荷预测。实际数据测试结果表明,与传统预测模型相比,上述模型不仅能够提高数据预测的准确性,对于大量数据的预测更具有优越性,是一种有效的负荷预测方法。 展开更多
关键词 数据挖掘 深度学习 支撑向量回归 深度信念网络
下载PDF
基于深度学习与运动信息的动作识别算法 被引量:4
18
作者 吴志攀 郑中韦 《计算机工程与设计》 北大核心 2018年第8期2668-2674,共7页
为提高视频中人体小幅度动作识别的准确率以及对大规模数据集的计算效率,提出一种基于双层核极限学习机与深度学习技术的动作识别算法。在双层核极限学习机的第一层,采用线性核极限学习机学习密集轨迹特征与深度学习特征;在第二层,将密... 为提高视频中人体小幅度动作识别的准确率以及对大规模数据集的计算效率,提出一种基于双层核极限学习机与深度学习技术的动作识别算法。在双层核极限学习机的第一层,采用线性核极限学习机学习密集轨迹特征与深度学习特征;在第二层,将密集轨迹特征与深度学习特征进行融合。在深度学习特征中,将深度视频特征与视频RGB三色特征融合作为深度学习的特征。基于大规模真实数据集与小幅度手势数据集进行仿真实验,实验结果表明,该算法对大规模数据集与小幅度的手势动作具有较高的识别准确率。 展开更多
关键词 极限学习 密集轨迹 深度学习 卷积神经网络 运动信息 人体动作识别 大规模数据
下载PDF
基于深度学习和ROS的垃圾分拣系统 被引量:1
19
作者 钟诗豪 褚伊哲 +2 位作者 孙晟 诸伟 岳敏 《工业控制计算机》 2022年第8期59-60,共2页
随着人们环保意识的提高和政策的推行,对垃圾进行分类处理已经成为了居民日常生活中的一部分,此时一款能够将垃圾分拣自动化的智能垃圾桶将为人们提供许多便利。观察到现有的智能分拣垃圾桶大多不能处理同时投放的多个不同分类的垃圾,... 随着人们环保意识的提高和政策的推行,对垃圾进行分类处理已经成为了居民日常生活中的一部分,此时一款能够将垃圾分拣自动化的智能垃圾桶将为人们提供许多便利。观察到现有的智能分拣垃圾桶大多不能处理同时投放的多个不同分类的垃圾,故设计了一款能够应对该情况的垃圾分拣系统。其应用了ROS和深度学习技术,控制模块包括一块树莓派4B和一块STM32F103C8T6,分别负责图像处理、机械臂路径规划和电机的控制,具有一定的创新性和实用价值。 展开更多
关键词 ROS 嵌入式 械臂 垃圾分拣 单片 深度学习上位机发布的数据 帧格式包括固定的帧头帧尾、数据校验位和
下载PDF
基于深度LightGBM集成学习模型的谷歌商店顾客购买力预测 被引量:14
20
作者 叶志宇 冯爱民 高航 《计算机应用》 CSCD 北大核心 2019年第12期3434-3439,共6页
针对轻量化梯度促进机(LightGBM)等集成学习模型只对数据信息进行一次挖掘,无法自动地细化数据挖掘粒度或通过深入挖掘得到更多的数据中潜在内部关联信息的问题,提出了深度LightGBM集成学习模型,该模型由滑动窗口和加深两部分组成。首先... 针对轻量化梯度促进机(LightGBM)等集成学习模型只对数据信息进行一次挖掘,无法自动地细化数据挖掘粒度或通过深入挖掘得到更多的数据中潜在内部关联信息的问题,提出了深度LightGBM集成学习模型,该模型由滑动窗口和加深两部分组成。首先,通过滑动窗口使得集成学习模型能够自动地细化数据挖掘粒度,从而更加深入地挖掘数据中潜在的内部关联信息,同时赋予模型一定的表示学习能力。然后,基于滑动窗口,用加深步骤进一步地提升模型的表示学习能力。最后,结合特征工程对数据集进行处理。在谷歌商店数据集上进行的实验结果表明,所提深度集成学习模型相较原始集成学习模型的预测精度高出6.16个百分点。所提方法能够自动地细化数据挖掘粒度,从而获取更多数据集中的潜在信息,并且深度LightGBM集成学习模型与传统深度神经网络相比是非神经网络的深度模型,参数更少,可解释性更强。 展开更多
关键词 学习 轻量化梯度促进 数据挖掘 深度模型 集成学习 特征工程
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部