期刊文献+
共找到937,155篇文章
< 1 2 250 >
每页显示 20 50 100
基于CEEMDAN-VMD-TCN-lightGBM模型的水质预测研究
1
作者 项新建 张颖超 +3 位作者 许宏辉 厉阳 王世乾 郑永平 《中国农村水利水电》 北大核心 2024年第3期86-95,共10页
针对目前水质预测模型中因为数据本身的复杂性、在信号处理过程中存在的噪声干扰以及分解深度不够导致单一分解难以全面捕捉信号非线性特征的问题,提出了一种基于二次分解的水质预测模型。该模型采用完全自适应噪声集合经验模态分解(CEE... 针对目前水质预测模型中因为数据本身的复杂性、在信号处理过程中存在的噪声干扰以及分解深度不够导致单一分解难以全面捕捉信号非线性特征的问题,提出了一种基于二次分解的水质预测模型。该模型采用完全自适应噪声集合经验模态分解(CEEMDAN)对原始数据进行分解,再利用变分模态分解(VMD)对熵值最高的模态分量进行二次分解,最终将处理后的时间序列输入到TCN-lightGBM多特征预测模型中。同时,采用麻雀算法(SSA)对预测模型进行优化。以山东省玉符河水质为例,本模型的均方根误差(RMSE)是0.1053,平均绝对误差(MAE)是0.0815,决定系数(R2)是0.9471,与GRU、LSTM、LightGBM、TCN等当下较为流行的模型的预测指标进行比较。结果显示,在R2上本模型提升了53.04%、70.41%、66.07%、65.20%等,在RMSE上减少了62.76%、65.50%、64.93%、64.80%等,在MAE上降低了62.76%、66.24%、63.80%、65.24%等。由此可知,基于CEEMDAN-VMD-TCN-lightGBM的模型具有更好的预测性能、泛化能力和捕捉信号非线性特征的能力。 展开更多
关键词 二次分解 TCN lightgbm 多特征预测 水质预测 麻雀算法
下载PDF
基于LightGBM模型的中国成人吸烟行为研究
2
作者 刘忠华 卢鑫 +4 位作者 梅文强 赵旻 胡彬彬 张轲 殷红慧 《现代信息科技》 2024年第7期128-135,140,共9页
采用2018年世界卫生组织在中国开展的成人烟草调查数据,对成人吸烟行为影响因素进行探究。首先对原始数据做数据清洗,包括剔除无关变量、组合新变量等步骤。其次结合卡方检验、方差分析以及最大互信息数对处理后的数据集进行特征选择。... 采用2018年世界卫生组织在中国开展的成人烟草调查数据,对成人吸烟行为影响因素进行探究。首先对原始数据做数据清洗,包括剔除无关变量、组合新变量等步骤。其次结合卡方检验、方差分析以及最大互信息数对处理后的数据集进行特征选择。再次基于XGBoost、LightGBM算法进行建模,对影响成人吸烟行为的因素进行排序和分析。最后基于表现较好的LightGBM模型进行变量组合建模,进一步挖掘吸烟者特征。经建模分析,识别得出成人性别、烟草环境、增税态度、低焦油烟认知、学历、年龄重要性由强至弱对吸烟行为产生影响。 展开更多
关键词 lightgbm XGBoost 吸烟行为
下载PDF
基于LightGBM模型的甘肃省临夏县滑坡易发性评价
3
作者 何哲 石玉玲 +2 位作者 李富春 贾卓龙 晏长根 《水资源与水工程学报》 CSCD 北大核心 2024年第1期197-205,216,共10页
甘肃省临夏县地质环境复杂,滑坡灾害发育,对当地居民生产生活造成严重威胁,亦对工程建设的开展造成一定阻碍,因此,选取高效准确的机器学习方法对临夏县进行滑坡易发性评价具有重大意义。首先依据遥感影像和野外勘察资料,选取了1718处滑... 甘肃省临夏县地质环境复杂,滑坡灾害发育,对当地居民生产生活造成严重威胁,亦对工程建设的开展造成一定阻碍,因此,选取高效准确的机器学习方法对临夏县进行滑坡易发性评价具有重大意义。首先依据遥感影像和野外勘察资料,选取了1718处滑坡样本,遴选了滑坡灾变的16种影响因子并建立滑坡影响因子评价体系;再结合预测精度和运行时间等指标对比了轻量级梯度提升机(LightGBM)模型与主流机器学习模型的性能;最后利用混淆矩阵分级方法进行了基于LightGBM模型的临夏县滑坡易发性评价。结果表明:临夏县重要滑坡影响因子为地表植被和地形地貌因子,其中土地覆盖为最主要影响因子;LightGBM模型预测精度高达0.931,且运行速度仅为11.7 s,既能保证高精度又极大提升了运行效率;在抽稀后的数据集上,LightGBM模型的预测表现、校准程度和分级结果均优于随机森林(RF)模型;混淆矩阵分级法的较高和高易发区内滑坡分布更为集中,在14.94%的区域内分布着86.86%的滑坡灾害点。滑坡易发性评价结果较好地反映了研究区内滑坡分布发育情况,可为当地工程建设及防灾减灾工作提供一定指导。 展开更多
关键词 滑坡 易发性评价 轻量级梯度提升机 机器学习 甘肃省临夏县
下载PDF
基于BS_Bagging-cLightGBM模型的电动汽车故障预测方法
4
作者 田晟 张津铭 +1 位作者 李成伟 李嘉 《广西师范大学学报(自然科学版)》 CAS 北大核心 2023年第3期9-19,共11页
针对因电动汽车故障数据样本类别不平衡引起的机器模型分类性能欠佳、故障查全率低的问题,本文提出一种以LightGBM为基学习器改进的Bagging集成电动汽车故障预测模型:在Bagging集成学习中使用Borderline_SMOTE方法对训练集重新采样,改... 针对因电动汽车故障数据样本类别不平衡引起的机器模型分类性能欠佳、故障查全率低的问题,本文提出一种以LightGBM为基学习器改进的Bagging集成电动汽车故障预测模型:在Bagging集成学习中使用Borderline_SMOTE方法对训练集重新采样,改善训练子集的数据不平衡程度,避免小类样本信息缺失;将权重系数和正则化项嵌入LightGBM基学习器的损失函数中,提高训练中小类样本的错分类代价。实验结果表明,该模型可有效提高故障查全率、宏平均和AUC值,其中AUC值达到0.898 4,故障样本的查全率为0.808 3,在电动汽车不平衡数据集上的故障分类性能显著优于传统单一模型和其他对比算法。 展开更多
关键词 故障诊断 lightgbm模型 Bagging集成学习 不平衡数据 Borderline_SMOTE
下载PDF
基于XGBoost和LightGBM模型的房屋租赁价格研究
5
作者 胡国华 《中国市场》 2023年第10期143-146,共4页
坚持“房住不炒”原则,建立“租购并举”的住房制度,是保持房地产市场平稳健康发展的重要举措。文章利用LightGBM模型和XGBoost模型对月租金进行预测,结果显示LightGBM模型的建模效果最好,并且预测后系统会自动计算得分,可靠性更高。同... 坚持“房住不炒”原则,建立“租购并举”的住房制度,是保持房地产市场平稳健康发展的重要举措。文章利用LightGBM模型和XGBoost模型对月租金进行预测,结果显示LightGBM模型的建模效果最好,并且预测后系统会自动计算得分,可靠性更高。同时发现影响住房月租金的关键因素主要包括房屋面积、小区所在商圈位置、房屋距离地铁的距离、房屋所在建筑的总楼层数和小区房屋出租数量等。 展开更多
关键词 XGBoost模型 lightgbm模型 住房租金
下载PDF
基于LightGBM模型的离散制造业产品物料需求智能预测
6
作者 李婷婷 黄欣迪 +1 位作者 曹萌萌 李剑锋 《智能计算机与应用》 2023年第9期59-66,共8页
离散制造业产品的物料需求受多种因素影响,传统物料需求预测算法对数据要求高,企业需要进行大量运算,且预测提前期短、精准度低,不能及时满足企业的生产计划。为提高制造业物料需求预测精度,本研究采用美的集团离散型物料需求数据进行... 离散制造业产品的物料需求受多种因素影响,传统物料需求预测算法对数据要求高,企业需要进行大量运算,且预测提前期短、精准度低,不能及时满足企业的生产计划。为提高制造业物料需求预测精度,本研究采用美的集团离散型物料需求数据进行建模分析。首先进行数据预处理及特征工程,利用统计学中的统计量构建出滑动和滞后特征,然后构建并拟合LightGBM模型对物料需求量进行预测,并与传统时间序列SARIMA模型进行对比,引入平均绝对误差MAE评估模型的预测精准度,针对模型时间复杂度和预测精准度进行对比分析。结果表明,以月为时间粒度的情况下,LightGBM机器学习模型对离散制造业物料需求预测的效率和准确率更高,更有利于提高离散制造企业的生产效率。 展开更多
关键词 lightgbm模型 物料需求预测 机器学习 SARIMA模型 对比分析
下载PDF
基于KMeans和LightGBM模型的大学生公益人群画像分析
7
作者 王宏平 马雪静 +1 位作者 彭玉蛟 蒋剑军 《电脑知识与技术》 2023年第19期39-42,共4页
大学生公益是国家公益事业的重要组成部分。高校如何设计公益活动以吸纳更多大学生加入公益队伍已成为一个严峻的问题。文章通过调查问卷获得的数据沿着如下路线来构建大学生公益人群画像体系:首先引入KMeans聚类模型对大学生公益人群... 大学生公益是国家公益事业的重要组成部分。高校如何设计公益活动以吸纳更多大学生加入公益队伍已成为一个严峻的问题。文章通过调查问卷获得的数据沿着如下路线来构建大学生公益人群画像体系:首先引入KMeans聚类模型对大学生公益人群进行分类,然后利用t-SNE降维算法可视化分类效果,最后应用LightGBM模型提取特征的重要性,以将某类和其他类区别开来,凸显本类的特征,通过描述各类的特征对人群画像。得出结论:大学生公益人群划可分为三类,根据各类特征可画像为观望型人群、积极型人群及消极型人群。 展开更多
关键词 大学生公益 人群画像 KMeans聚类 t-SNE可视化 lightgbm模型
下载PDF
基于SVR-LightGBM模型的高速公路拥堵预测方法研究
8
作者 李文勇 田润泽 +1 位作者 廉冠 陈天贵 《交通节能与环保》 2023年第5期91-95,103,共6页
由于传统的高速公路拥堵预测方法大多构建的是单一的预测模型,模型的预测精度不高,并且大多以交通流的时间特征为基础,缺少对交通流空间特征的深度挖掘,往往导致预测结果不理想。本文提出了一种基于SVR与LightGBM组合的高速公路拥堵预... 由于传统的高速公路拥堵预测方法大多构建的是单一的预测模型,模型的预测精度不高,并且大多以交通流的时间特征为基础,缺少对交通流空间特征的深度挖掘,往往导致预测结果不理想。本文提出了一种基于SVR与LightGBM组合的高速公路拥堵预测模型,由于高速公路上中下游路段具有时空相关性,因此首先运用SVR模型实现上下游路段对中游目标路段流量、速度和占有率的预测,进而将预测值与目标路段真实的拥堵阈值输入到LightGBM模型进行训练来预测拥堵。为验证组合模型的有效性,选用平均绝对误差(MAE)、均方根误差(RMSE)和均等系数(EC)三项评价指标对不同种预测模型进行对比结果分析。实验表明所提出的SVR-LightGBM拥堵预测模型能显著减少预测误差,预测精度更高,是一种高效快捷的拥堵预测模型。 展开更多
关键词 运输规划与管理 拥堵预测 SVR-lightgbm 高速公路 时空关联
下载PDF
基于LightGBM模型的糖尿病预测模型的研究 被引量:1
9
作者 吴晖南 陈淑娇 +4 位作者 陈展峰 杨叶楠 曾程浩 吴莎莎 苏雪云 《中国卫生标准管理》 2023年第24期64-67,共4页
目的设计及验证基于轻量级梯度提升术(Light gradient boosting machine,LightGBM)模型的糖尿病预测模型。方法采用LightGBM糖尿病预测模型作为基础模型。提取石狮市某社区卫生服务中心2016年1月—2021年12月的数据库进行分析,将数据集... 目的设计及验证基于轻量级梯度提升术(Light gradient boosting machine,LightGBM)模型的糖尿病预测模型。方法采用LightGBM糖尿病预测模型作为基础模型。提取石狮市某社区卫生服务中心2016年1月—2021年12月的数据库进行分析,将数据集分为训练集和测试集。基础模型中使用数据库中的训练集通过交叉验证法进行训练,超参数调整。训练出的模型在测试集上进行模型验证。验证后使用K最近邻算法(K-nearest-neighbour,KNN)、合成少数类过采样技术(synthetic minority oversampling technique,SMOTE)和通过保留具有代表性的多数类别样本来减少样本数量(NearMiss)技术下采样等方法进行数据校正。最后,本研究基于机器学习算法和群体数据构建了一种高效的糖尿病预测模型。结果基于LightGBM模型的糖尿病预测模型优于传统Logistic模型,综合准确率为97%。结论基于LightGBM模型的糖尿病预测模型临床符合度高,可为糖尿病早期诊疗提供临床决策参考。 展开更多
关键词 糖尿病 机器学习 数学模型 lightgbm 模型预测 LOGISTIC回归
下载PDF
基于LightGBM模型的产品订单需求量预测
10
作者 赵玉骁 陈思予 +2 位作者 叶凯圳 施锋伟 金秀玲 《应用数学进展》 2023年第11期4708-4716,共9页
产品订单需求量预测是管理企业供应链的关键环节。准确预测客户对产品的需求量是很有必要的。为了解决不同产品的需求量问题,本文充分利用厂商数据,采用基于LightGBM的集成算法建立产品订单量预测模型。用网格探索进行参数调优,用3折目... 产品订单需求量预测是管理企业供应链的关键环节。准确预测客户对产品的需求量是很有必要的。为了解决不同产品的需求量问题,本文充分利用厂商数据,采用基于LightGBM的集成算法建立产品订单量预测模型。用网格探索进行参数调优,用3折目标编码,最终测试集上的MAPE为0.3541%;拟合效果良好且泛化能力强。最后用LightGBM模型预测后三个月的各个地区、各个品类的月度订单需求量。有助于企业资源有效配置,提高企业的收益效率,具有较大的现实意义和参考价值。 展开更多
关键词 订单需求预测 机器学习 lightgbm
下载PDF
基于改进LightGBM模型的汽车故障预测方法研究 被引量:14
11
作者 颜诗旋 朱平 刘钊 《汽车工程》 EI CSCD 北大核心 2020年第6期815-819,825,共6页
针对机器学习技术在汽车行业的应用中存在的汽车故障数据规模大和类别不平衡引起的模型训练速度慢、故障查全率低的问题,对LightGBM模型进行两方面的改进:模型训练时,设置类别权重和L1正则化项修正模型的损失函数,并通过贝叶斯优化获得... 针对机器学习技术在汽车行业的应用中存在的汽车故障数据规模大和类别不平衡引起的模型训练速度慢、故障查全率低的问题,对LightGBM模型进行两方面的改进:模型训练时,设置类别权重和L1正则化项修正模型的损失函数,并通过贝叶斯优化获得修正项系数的取值;模型预测时,使用阈值移动法降低模型的分类阈值。在斯堪尼亚货车故障数据集上进行验证。结果表明,本文中所提出的改进LightGBM模型训练速度快,故障查全率高,具备工程应用价值。 展开更多
关键词 机器学习 汽车故障预测 lightgbm模型 类别不平衡
下载PDF
基于LightGBM模型的鱼类异常行为检测 被引量:5
12
作者 袁红春 王丹 +2 位作者 陈冠奇 张天蛟 吴若有 《渔业现代化》 CSCD 2020年第1期47-55,共9页
针对传统理化方法分析水质污染情况耗时耗力等问题,提出一种基于鱼类异常行为识别的水质监测方法。以红色斑马鱼(red zebrafish)为研究对象,利用计算机视觉技术,首先对斑马鱼图像进行预处理,利用灰度共生矩阵获取鱼群纹理特征;然后通过L... 针对传统理化方法分析水质污染情况耗时耗力等问题,提出一种基于鱼类异常行为识别的水质监测方法。以红色斑马鱼(red zebrafish)为研究对象,利用计算机视觉技术,首先对斑马鱼图像进行预处理,利用灰度共生矩阵获取鱼群纹理特征;然后通过Lucas-Kanade光流法计算鱼群的运动信息熵,并对获取的纹理特征和信息熵进行归一化处理;最后采用轻量化梯度促进机(LightGBM)对鱼类异常行为进行检测,与深度神经网络(DNN)和支持向量机(SVM)检测效果对比。结果显示:利用LightGBM对鱼类异常行为进行检测,准确率为98.5%,与其他模型对比分别提高0.5%和25.3%。研究表明,基于LightGBM模型的鱼类异常行为检测方法相比其他模型能更准确地识别鱼类非正常游动。该模型适用于自动水质监测。 展开更多
关键词 水质监测 鱼类异常行为 lightgbm
下载PDF
GA-LightGBM模型及其在车辆保险需求预测中应用
13
作者 庄维嘉 谭文安 +1 位作者 林瑞钦 郝宵 《上海第二工业大学学报》 2022年第4期339-346,共8页
为了提高LightGBM模型在车辆保险需求预测的准确率,引入遗传算法来优化LightGBM模型的参数,提出了一个GA-LightGBM模型。该模型主要分为3步:(1)对数据集进行预处理,包括特征描述性分析、去除无效值、分类特征数值化以及数值特征标准化;... 为了提高LightGBM模型在车辆保险需求预测的准确率,引入遗传算法来优化LightGBM模型的参数,提出了一个GA-LightGBM模型。该模型主要分为3步:(1)对数据集进行预处理,包括特征描述性分析、去除无效值、分类特征数值化以及数值特征标准化;(2)使用遗传算法快速随机的全局搜索能力优化LightGBM模型参数;(3)根据最优参数组合训练LightGBM模型,并将最优模型应用于车辆保险需求预测中。实验结果表明在车辆保险需求预测方面,采用GA-LightGBM模型在均方根误差、召回率、F1值和AUC值相较于网格搜索法以及贝叶斯搜索法均有提升,模型性能均优于随机森林、GBDT、Bagging和Adaboost,可为保险公司商业决策提供参考。 展开更多
关键词 lightgbm模型 遗传算法 车辆保险 机器学习
下载PDF
APSO_LightGBM模型在高血压风险预测中的应用
14
作者 郑列 胡逾航 《湖北工业大学学报》 2021年第4期95-99,110,共6页
APSO_LightGBM高血压风险预测模型将LightGBM算法与自适应粒子群优化算法相结合,弥补了LightGBM自身收敛速度慢的缺陷。实验表明,基于该模型的预测精度高于线性回归、决策树、SVM和LightGBM模型,参数寻优时间也远小于网格搜索与随机搜索... APSO_LightGBM高血压风险预测模型将LightGBM算法与自适应粒子群优化算法相结合,弥补了LightGBM自身收敛速度慢的缺陷。实验表明,基于该模型的预测精度高于线性回归、决策树、SVM和LightGBM模型,参数寻优时间也远小于网格搜索与随机搜索,说明该模型可以更准确、高效地预测高血压风险,实现对疾病的早期筛查与干预。 展开更多
关键词 机器学习 高血压预测 粒子群优化算法 APSO_lightgbm模型
下载PDF
基于改进交叉验证LightGBM模型的卷烟销售数据预测
15
作者 何家林 《中文科技期刊数据库(全文版)经济管理》 2022年第8期0165-0168,共4页
我国烟草行业作为传统国营垄断行业,烟草产量、销量均长期居于世界首位,为国家财政税收做出巨大贡献。“十四五”以来,国务院印发《十四五数字经济发展规划》,引导传统产业结构数字化转型,推动行业高质量发展。烟草行业数字应用场景丰富... 我国烟草行业作为传统国营垄断行业,烟草产量、销量均长期居于世界首位,为国家财政税收做出巨大贡献。“十四五”以来,国务院印发《十四五数字经济发展规划》,引导传统产业结构数字化转型,推动行业高质量发展。烟草行业数字应用场景丰富,具备数字经济高质量发展的基础条件,本文通过分析滁州市2019-2022月度卷烟销售明细数据,通过地域、烟草类别,分别对内部销售数据进行分层,与外部宏观经济数据如GDP、CPI等相结合,基于LightGBM机器学习模型预测,聚合分层结果作为滁州市烟草销售数据预测结果。模型在训练过程中,改进交叉验证方法进行模型优化,对卷烟销售数据两种数据分层预测结果,进行交叉验证,有效降低预测误差。 展开更多
关键词 数字经济 lightgbm模型 交叉验证 卷烟销售预测
下载PDF
基于DE-lightGBM模型的上市公司高送转预测实证研究 被引量:1
16
作者 岑健铭 封全喜 +1 位作者 张丽丽 佟锐超 《计算机科学》 CSCD 北大核心 2022年第S02期137-143,共7页
“高送转”现象指上市公司转增较大比例的股票。针对上市公司实施“高送转”现象的预测问题,文中提出了一种基于差分进化算法超参数优化的lightGBM模型(简记为DE-lightGBM)。该模型主要包括两个方面:首先,利用差分进化算法调整lightGBM... “高送转”现象指上市公司转增较大比例的股票。针对上市公司实施“高送转”现象的预测问题,文中提出了一种基于差分进化算法超参数优化的lightGBM模型(简记为DE-lightGBM)。该模型主要包括两个方面:首先,利用差分进化算法调整lightGBM模型的损失函数中少数类别的权重以及正则项系数,以处理数据类别不平衡的问题;其次,以F1和AUC作为评价指标,再次利用差分进化算法优化li-ghtGBM模型的重要超参数变量,找到一组预测效果最优的参数组合。数值结果显示,DElightGBM模型取得了较好的效果,F1和AUC值分别为0.5368和0.8734。提出的DE-lightGBM模型能够有效识别下一年将会实施“高送转”的上市公司。 展开更多
关键词 高送转 差分进化算法 lightgbm 不平衡数据处理 机器学习
下载PDF
基于LightGBM模型的二手房房价预测研究 被引量:2
17
作者 慕钢 张宏烈 +1 位作者 党佳俊 李广峰 《高师理科学刊》 2020年第12期27-31,共5页
房价预测是典型的机器学习问题,可以选择多元线性回归方法进行分析.基于LightGBM算法,以二手房房价数据作为研究依据,建立房价预测模型进行统计推断.以拟合优度R2作为评判依据,该模型与其它常用机器学习模型进行预测结果比较.程序运行... 房价预测是典型的机器学习问题,可以选择多元线性回归方法进行分析.基于LightGBM算法,以二手房房价数据作为研究依据,建立房价预测模型进行统计推断.以拟合优度R2作为评判依据,该模型与其它常用机器学习模型进行预测结果比较.程序运行结果表明,此房价预测模型具有更准确的预测效果. 展开更多
关键词 房价预测 机器学习 数据分析 lightgbm 预测对比
下载PDF
基于CNN-LightGBM模型的高速公路交通量预测 被引量:5
18
作者 张振 曾献辉 《信息技术与网络安全》 2020年第2期34-39,共6页
有效的交通流量预测对人们出行和交管部门监管都有着重要的意义。传统的交通量预测模型主要基于交通流的时间特性,未结合交通流的时间和空间特性进行深入挖掘,因此预测效果有时不佳。提出了一种基于CNN与LightGBM结合的交通流预测模型,... 有效的交通流量预测对人们出行和交管部门监管都有着重要的意义。传统的交通量预测模型主要基于交通流的时间特性,未结合交通流的时间和空间特性进行深入挖掘,因此预测效果有时不佳。提出了一种基于CNN与LightGBM结合的交通流预测模型,首先利用CNN模型挖掘出高速公路相邻路段监测点和出入口的时间和空间关联性,实现对交通流数据的时空特征提取,然后将CNN提取到的特征向量输入到LightGBM模型中进行预测。为了验证模型的有效性,实验中使用了多种预测模型进行对比,实验结果表明,所提出的考虑到时空特性的CNN-LightGBM组合的模型可以明显降低预测误差,是一种有效快速的交通流预测模型。 展开更多
关键词 交通流预测 CNN-lightgbm 时空关联性 高速公路
下载PDF
基于LightGBM模型的公交线路串车状态识别方法 被引量:1
19
作者 刘倩 肖梅 +2 位作者 黄洪滔 明秀玲 边浩毅 《交通信息与安全》 CSCD 北大核心 2022年第5期102-111,共10页
同1条线路上相邻公交车辆由于受到道路等因素的影响,其实际车头时距与发车间隔相比显著缩短,导致相邻车辆在较短的时间内到达同1个公交站点即引发公交线路“串车运行”问题(即相邻公交车辆在实际运行中的车头时距与发车间隔相比显著缩... 同1条线路上相邻公交车辆由于受到道路等因素的影响,其实际车头时距与发车间隔相比显著缩短,导致相邻车辆在较短的时间内到达同1个公交站点即引发公交线路“串车运行”问题(即相邻公交车辆在实际运行中的车头时距与发车间隔相比显著缩短的现象)。辨识线路的串车状态(串车运行和非串车运行)是进一步提升城市公交车辆运营的稳定性的关键。提出了基于贝叶斯参数优化的LightGBM模型,并将其用以识别公交线路串车状态。从站点、运行、乘客、时间和天气这5个角度初步选取20个影响线路串车状态的关键因素,并采用Spearman相关性检验和方差膨胀因子诊断多重共线性。建立二元Logit模型进行影响因素分析。提取显著的影响因子,构建LightGBM模型用以识别线路串车状态,并分别采用贝叶斯优化与随机搜索优化对模型中用以确定模型属性和训练过程的超参数进行寻优。以西安市公交车辆行车数据为例进行模型的应用验证,对比2种参数寻优方法(贝叶斯优化与随机搜索优化)的效率,并将提出的LightGBM模型与XGBoost、随机森林(RF)、决策树模型(DT)和AdaBoost模型的识别精度进行对比。研究表明:上车乘客数、信号灯数量、近距商业区数量、近距内主路上行驶的距离(即车辆在近距离范围内在主道路上行驶过的距离)和拥堵延时指数对线路串车状态有显著影响。LightGBM模型的参数采用贝叶斯优化比采用随机搜索优化的准确率提高了1.31%。采用贝叶斯算法优化参数的LightGBM模型比采用随机搜索算法优化的准确率提高了1.31%。所提出的经贝叶斯优化的LightGBM模型正确识别公交线路串车状态(包括串车运行和非串车运行)的比率为82.89%,识别性能优于对比模型。 展开更多
关键词 城市交通 公交运营稳定性 线路串车状态识别 轻量级梯度提升机 影响因素 贝叶斯参数优化
下载PDF
基于LightGBM模型的文本分类研究 被引量:4
20
作者 邢红梅 陈欣 王慧 《内蒙古工业大学学报(自然科学版)》 2020年第1期52-59,共8页
随着互联网用户的增加,由其产生的文本数据也在爆炸式增长,如何有效地对这些海量数据进行分类管理并提高分类精度,成为自然语言处理中的热门研究课题.使用LightGBM算法作为文本分类模型,对最大深度和叶子节点数量等参数进行调优,从而提... 随着互联网用户的增加,由其产生的文本数据也在爆炸式增长,如何有效地对这些海量数据进行分类管理并提高分类精度,成为自然语言处理中的热门研究课题.使用LightGBM算法作为文本分类模型,对最大深度和叶子节点数量等参数进行调优,从而提高算法的性能.针对NLPCC 2014数据集进行实验,对比NLPCC 2014会议结果报告,本文使用调优后的LightGBM算法在精确率、召回率和F1值都有较好的结果. 展开更多
关键词 文本分类 lightgbm 特征选择 参数调优
下载PDF
上一页 1 2 250 下一页 到第
使用帮助 返回顶部