期刊文献+
共找到2,953篇文章
< 1 2 148 >
每页显示 20 50 100
基于机器学习算法的在线推荐系统设计与性能优化研究 被引量:2
1
作者 魏芬 《信息与电脑》 2024年第3期89-91,共3页
传统运营方式已经难以应对日益复杂的业务场景。特别是电商领域,采用个性化推荐系统对于改善用户体验、促进商品销售、提高广告点击率具有重要意义。文章以电商场景为例,设计了基于机器学习算法的在线推荐系统,并对该系统进行了性能优化。
关键词 机器学习算法 在线推荐系统 性能优化
下载PDF
混合增强型机器学习算法在稀土供应链金融中评价中小企业信用风险的研究
2
作者 徐中辉 饶振远 +2 位作者 黄晓东 姜馨圳 马艳丽 《稀有金属与硬质合金》 CAS CSCD 北大核心 2024年第4期94-102,共9页
稀土是支撑高端技术创新和新能源产业发展的关键原材料之一,研究解决稀土供应链中小企业融资困难的问题,做强我国稀土产业链,更好地维护国家战略利益是当务之急。供应链金融作为创新型融资方式成为实现中小企业融资授信的一种主要手段,... 稀土是支撑高端技术创新和新能源产业发展的关键原材料之一,研究解决稀土供应链中小企业融资困难的问题,做强我国稀土产业链,更好地维护国家战略利益是当务之急。供应链金融作为创新型融资方式成为实现中小企业融资授信的一种主要手段,但其中信用风险问题成为融资决策中需解决的最关键问题之一。本文提出了一种混合增强型机器学习算法,首先采用动态透镜成像反向学习改进的海洋捕食者算法(IMPA)对支持向量机算法(SVM)进行优化,再采用AdaBoost算法对优化后的SVM进行集成,建立AdaBoost-IMPA-SVM模型。采用该模型对供应链金融风险进行评价,重新建立供应链金融风险体系指标,通过相关性分析进行特效选取,并从计算机通信及其他制造业选取52家中国上市中小企业2019—2021年期间140个样本作为特征变量输入模型。仿真实验结果验证了该模型相较于其他信用风险评价模型具有更好的分类识别性能。 展开更多
关键词 稀土产业链 供应链金融 中小企业 信用风险评价 混合增强型机器学习算法 海洋捕食者算法 支持向量机算法 AdaBoost算法
下载PDF
基于大数据流水线系统的算法模型整合方法研究——以基于机器学习方法的LiDAR数据树木生物量反演为例
3
作者 郭学兵 朱小杰 +3 位作者 唐新斋 杨刚 侯艳飞 何洪林 《数据与计算发展前沿(中英文)》 CSCD 2024年第4期96-105,共10页
【背景】激光雷达(LiDAR)数据在森林资源分析利用方面有着广泛应用,科研人员研制了很多涉及大数据管理和人工智能的专业算法模型,这些算法模型目前多数散落在研究人员手里,尚缺乏新型信息化平台对其进行整合。【方法】大数据流水线系统... 【背景】激光雷达(LiDAR)数据在森林资源分析利用方面有着广泛应用,科研人员研制了很多涉及大数据管理和人工智能的专业算法模型,这些算法模型目前多数散落在研究人员手里,尚缺乏新型信息化平台对其进行整合。【方法】大数据流水线系统πFlow软件具有大数据管理能力和大数据算法集成能力,并可以所见即所得方式构建流水线并调度运行流水线,适合于LiDAR数据复杂算法模型的整合,且流水线可定制、可复用。【内容】本文介绍了πFlow的特点和功能,并以基于LiDAR冠层高度模型(CHM)数据的树冠解析及利用机器学习方法估测树木生物量为例,介绍了将算法整合到πFlow并构建LiDAR数据分析处理流水线的方法和技术,且对流水线进行了测试运行。【结果】利用πFlow构建的可重复信息化平台可支撑野外站观测网络的LiDAR数据生物量快速反演,为数据密集型的专业数据处理算法模型的整合提供了创新方法技术。 展开更多
关键词 大数据流水线 算法模型集成 激光雷达 机器学习 随机森林 πFlow
下载PDF
基于人工智能机器学习决策树算法的上海某社区中老年群体衰弱表型分析
4
作者 张自妍 张顺顺 +2 位作者 马娟 陈晨 黄一沁 《老年医学与保健》 CAS 2024年第5期1230-1238,共9页
目的旨在利用人工智能技术分析上海某社区中老年群体的衰弱表型特征,并评估各特征对衰弱状态的贡献度,以期为老年人衰弱健康管理提供量化依据。方法研究选取2023年7月30日—9月30日在上海市某社区卫生服务中心就诊的55岁及以上人群为研... 目的旨在利用人工智能技术分析上海某社区中老年群体的衰弱表型特征,并评估各特征对衰弱状态的贡献度,以期为老年人衰弱健康管理提供量化依据。方法研究选取2023年7月30日—9月30日在上海市某社区卫生服务中心就诊的55岁及以上人群为研究对象。采用电子化问卷收集研究对象一般健康状况和日常生活状况,采用智能手环测量日常活动数据,收集实验室检查数据,并通过Fried衰弱表型量表进行衰弱评估。利用机器学习决策树算法对数据进行预处理和模型训练,分析各项表型特征对衰弱结果的重要程度。结果共纳入556例样本,其中8.3%处于衰弱期,46.0%处于衰弱前期,45.7%无衰弱。研究发现,年龄、教育程度、婚姻状况和收入水平等因素均与衰弱的发生有显著关联。智能手环监测睡眠、步数、活动时间等日常活动数据显示衰弱组在这些指标上显著低于非衰弱组。机器学习算法的定量分析结果表明,年龄是对衰弱贡献最大的特征,其次为平均睡眠时间、丙氨酸氨基转移酶(alanine transarninase,ALT)和身体运动情况。结论本研究通过人工智能技术揭示了影响老年人衰弱状态的多种因素,并识别出年龄、睡眠时间等多种重要度较高的衰弱表型。研究结果有助于提高老年人衰弱管理的效率,并为医疗保健系统资源的合理分配提供了依据。 展开更多
关键词 中老年 衰弱 社区 人工智能 机器学习 决策树算法 重要度分析
下载PDF
基于机器学习算法的滑坡土壤含水率预测方法研究
5
作者 杨小平 段生锐 +1 位作者 蒋力 刘光辉 《水电能源科学》 北大核心 2024年第3期73-77,共5页
土壤含水率是影响坡体稳定性的决定因素之一。针对滑坡体内部土壤水分信息难以准确感知的问题,建立了一种基于机器学习算法树突神经网络的土壤含水率预测模型(DDNN),通过分析土壤水分垂向变化特征和数据相关性确定关键的影响因子后,将... 土壤含水率是影响坡体稳定性的决定因素之一。针对滑坡体内部土壤水分信息难以准确感知的问题,建立了一种基于机器学习算法树突神经网络的土壤含水率预测模型(DDNN),通过分析土壤水分垂向变化特征和数据相关性确定关键的影响因子后,将水分预测模型DDNN与GA-BP、RF、RBFNN三种算法进行对比试验。发现DDNN预测模型的拟合优度R2最高为0.998,均方根误差和平均绝对误差均最小,分别为0.091、0.059,其预测精度明显高于其他三种算法。并采用关系谱探究了相关影响因素对土壤含水率的敏感程度。结果表明,敏感度由高到低依次为气温、降水、初始水分、风速、地温,研究结果可为滑坡体稳定性分析提供技术方法支撑。 展开更多
关键词 机器学习算法 树突神经网络 滑坡体 土壤含水率预测 相关性 敏感性
下载PDF
机器学习算法在渔船数据挖掘技术中的应用
6
作者 刘敏 《黄山学院学报》 2024年第3期13-16,共4页
本文基于PCA_Word2Vec的渔船数据挖掘技术展开研究,构建了PCA_Word2Vec渔船数据挖掘模型并对渔船轨迹数据进行挖掘,在此基础之上通过将LightGBM模型与其他经典模型分类效果进行比较,以及对PCA_Word2Vec数据挖掘模型挖掘前后的数据展开对... 本文基于PCA_Word2Vec的渔船数据挖掘技术展开研究,构建了PCA_Word2Vec渔船数据挖掘模型并对渔船轨迹数据进行挖掘,在此基础之上通过将LightGBM模型与其他经典模型分类效果进行比较,以及对PCA_Word2Vec数据挖掘模型挖掘前后的数据展开对比,验证了渔船数据挖掘技术的有效性和实用性。 展开更多
关键词 机器学习算法 PCA_Word2Vec数据挖掘模型 数据挖掘 渔船识别
下载PDF
基于机器学习的煤层气产能标定智能算法及影响因素分析 被引量:2
7
作者 宋洪庆 都书一 +4 位作者 杨焦生 王玫珠 赵洋 张继东 朱经纬 《工程科学学报》 EI CSCD 北大核心 2024年第4期614-626,共13页
煤层气是我国常规天然气现实可靠的战略补充资源之一,智能化标定煤层气产能对于天然气工业的发展具有重要意义.对山西沁水盆地某煤层气区块的煤层气井进行了实际地质、生产数据的收集及数据预处理,提出了基于生产井史的煤层气单井产能... 煤层气是我国常规天然气现实可靠的战略补充资源之一,智能化标定煤层气产能对于天然气工业的发展具有重要意义.对山西沁水盆地某煤层气区块的煤层气井进行了实际地质、生产数据的收集及数据预处理,提出了基于生产井史的煤层气单井产能计算公式.利用预处理后的生产数据及储层数据,建立了基于深度神经网络、支持向量回归机、随机森林的煤层气产能标定智能算法,对煤层气单井产能进行了预测,比较了三种机器学习模型的预测结果,分析了不同排采天数的生产数据作为输入参数对模型精度的影响.基于预测效果最好的机器学习模型,进行了动态参数(排采前期的日产气、日产水和井底流压)和静态参数(煤层埋深、孔隙度、渗透率、煤层厚度和含气量)对煤层气产能标定模型的重要性程度分析.结果表明:三种机器学习模型标定煤层气单井产能的平均决定系数为0.828,其中深度神经网络模型决定系数最高,达0.923;增加生产数据前期排采天数,决定系数增长趋势明显,之后增长趋势减缓并最终趋于平稳;动态参数和静态参数对产能的影响都较强,这两类参数对于产能预测模型的贡献度分别为48%和52%. 展开更多
关键词 煤层气 沁水盆地 单井产能 智能算法 机器学习
下载PDF
机器学习中用Python模拟K近邻算法的实现与应用
8
作者 曹光忠 《电脑知识与技术》 2024年第21期36-39,共4页
本文描述了K近邻算法的实现与应用。首先,以图形的方式介绍了K近邻算法的思想;其次使用Python语言自定义类模拟了系统K近邻算法的实现,在实现的过程中要遵循系统算法API接口规范;接下来,将模拟算法与系统算法进行比较,并优化自定义算法... 本文描述了K近邻算法的实现与应用。首先,以图形的方式介绍了K近邻算法的思想;其次使用Python语言自定义类模拟了系统K近邻算法的实现,在实现的过程中要遵循系统算法API接口规范;接下来,将模拟算法与系统算法进行比较,并优化自定义算法;最后,将自定义模拟算法应用到数据集划分和寻找最优超参数中。 展开更多
关键词 模拟 K近邻算法 机器学习
下载PDF
基于认知负荷和机器学习算法的计算机教学平台设计与应用
9
作者 吕立霞 《电脑知识与技术》 2024年第8期46-48,共3页
为提升计算机教学质量,该研究基于认知负荷理论和机器学习算法进行计算机教学平台设计。平台采用分层架构设计,平台软件功能由内容管理、学习者模型、智能教学、互动与反馈及数据分析与报告等五个功能模块构成,并采用Apache JMeter模拟... 为提升计算机教学质量,该研究基于认知负荷理论和机器学习算法进行计算机教学平台设计。平台采用分层架构设计,平台软件功能由内容管理、学习者模型、智能教学、互动与反馈及数据分析与报告等五个功能模块构成,并采用Apache JMeter模拟用户行为对本平台进行性能测试。结果表明,该平台在高并发处理、响应速度和智能功能的准确性等方面均优于传统平台,充分证明平台功能有效性,可为计算机教学改革提供技术支持。 展开更多
关键词 机器学习算法 功能模块 数据处理
下载PDF
大数据技术的机器学习算法
10
作者 黄伟 《中国新通信》 2024年第11期47-49,共3页
随着互联网的发展和移动设备的普及,人们进入了一个数据量激增的时代,被称为“大数据”。为了有效应对这些大规模数据,传统数据处理方式显得力不从心,需要结合机器学习技术进行处理。基于此,本文探讨了机器学习的定义、分类以及大数据... 随着互联网的发展和移动设备的普及,人们进入了一个数据量激增的时代,被称为“大数据”。为了有效应对这些大规模数据,传统数据处理方式显得力不从心,需要结合机器学习技术进行处理。基于此,本文探讨了机器学习的定义、分类以及大数据环境下的相关算法,例如分布式决策树、深度学习、聚类算法和降维技术,并进一步探索了这些算法在金融、健康医疗、电商和交通等领域的具体应用。 展开更多
关键词 大数据技术 机器学习算法
下载PDF
机器学习算法在5G网络分流提升中的应用
11
作者 嵇静婵 《长江信息通信》 2024年第9期193-195,共3页
为探索机器学习算法在提升5G网络分流效率中的应用,本研究深度探究机器学习算法在5G网络分流提升中的应用。通过深度学习、支持向量机、随机森林和决策树等算法,实现了流量预测、网络资源优化和异常检测。研究发现,这些算法能有效预测... 为探索机器学习算法在提升5G网络分流效率中的应用,本研究深度探究机器学习算法在5G网络分流提升中的应用。通过深度学习、支持向量机、随机森林和决策树等算法,实现了流量预测、网络资源优化和异常检测。研究发现,这些算法能有效预测流量趋势,提高资源配置效率,并在异常流量检测和安全威胁分析方面表现突出。测试结果显示,机器学习算法显著提升了5G网络管理的效率和安全性。因此,进一步探索和优化机器学习算法在5G网络应用中具有重要价值。 展开更多
关键词 机器学习算法 5G网络 支持向量机
下载PDF
基于机器学习算法的胃癌淋巴结转移预测模型研究 被引量:1
12
作者 施昊旻 燕速 +1 位作者 乔梦梦 杨惠莲 《实用临床医药杂志》 CAS 2024年第1期41-47,61,共8页
目的基于4种机器学习(ML)算法构建胃癌淋巴结转移的预测模型并验证。方法回顾性收集531例胃癌根治术患者的临床资料,按3∶1比例将患者随机分为训练集399例和测试集132例。通过单因素分析筛选胃癌淋巴结转移的特征选择变量,分别建立逻辑... 目的基于4种机器学习(ML)算法构建胃癌淋巴结转移的预测模型并验证。方法回顾性收集531例胃癌根治术患者的临床资料,按3∶1比例将患者随机分为训练集399例和测试集132例。通过单因素分析筛选胃癌淋巴结转移的特征选择变量,分别建立逻辑回归、随机森林、K-邻近算法、支持向量机算法模型并进行变量重要性排序。将所有ML算法模型在测试集中进行验证,绘制受试者工作特征(ROC)曲线,基于曲线下面积(AUC)、灵敏度、特异度、准确度确定最优ML算法模型。基于最优ML算法模型的变量重要性排序构建列线图模型,通过ROC曲线、校准曲线、决策曲线评价列线图模型的区分能力、校准能力和临床适用性。结果4种ML算法模型比较结果显示,随机森林模型为最优算法模型,其在训练集中的准确度、灵敏度、特异度分别为72.7%、69.9%、75.0%,AUC为0.803,其在测试集中的准确度、灵敏度、特异度分别为64.4%、66.7%、62.5%,AUC为0.751。基于随机森林算法模型的变量构建列线图模型,ROC曲线显示列线图模型在训练集、测试集中的AUC分别为0.721、0.776,校准曲线和决策曲线显示列线图模型在训练集与测试集中均有较好的校准能力和临床适用性。结论随机森林模型是4种ML算法模型中的最优算法模型,基于随机森林模型构建的列线图模型能够较准确地预测胃癌淋巴结转移风险,从而更好地指导临床诊断和治疗决策。 展开更多
关键词 胃癌 淋巴结转移 机器学习算法 预测模型 随机森林 支持向量机算法
下载PDF
基于机器学习算法的森林生物量多源遥感估测 被引量:3
13
作者 黄天宝 欧光龙 +4 位作者 吴勇 徐熊伟 王振会 蔺如喜 徐灿 《西北林学院学报》 CSCD 北大核心 2024年第1期10-18,共9页
为进一步探索不同空间分辨率影像在10 m×10 m样地尺度下森林生物量估测性能及协同机器学习算法(RF、SVM、DT、GBM、k-NN、Stacking)的估测效果,利用光学遥感GF2(高分二号卫星)、sentinel 2A、Landsat 8 OLI、SUM(整合3种遥感数据源... 为进一步探索不同空间分辨率影像在10 m×10 m样地尺度下森林生物量估测性能及协同机器学习算法(RF、SVM、DT、GBM、k-NN、Stacking)的估测效果,利用光学遥感GF2(高分二号卫星)、sentinel 2A、Landsat 8 OLI、SUM(整合3种遥感数据源)影像及辅助变量DEM高程数据、环境因子、林分因子(森林类型、优势树种),在Boruta算法变量选择下用机器学习算法对元谋地区乔木林森林生物量(地上+地下)进行遥感估测,并比较4种影像下的估测精度。研究表明:(1)基于Boruta算法分别对3种影像及整合3种影像条件下进行变量选择,单一影像中sentinel 2A的植被指数PEIP、Landsat 8 OLI的纹理因子b2_ME_9×9、GF2的GNDVI分别为3种影像下的最高得分变量,多源融合估测森林生物量中GF2的GNDVI为最佳得分变量;(2)基于Boruta算法选择的变量构建RF、SVM、DT、GBM、k-NN算法以及对5个模型的Stacking集成算法,SUM的Stacking集成算法的估测效果最优,模型决定系数(R2)为0.73,均方根误差(RMSE)为28.46 t·hm^(-2),集成算法下的SUM的估测性能优于sentinel 2A、Landsat 8 OLI,GF2优于sentinel 2A,sentinel 2A的估测性能优于Landsat 8 OLI。研究结果说明在生物量遥感估测中高分辨率影像具有较好的估测效果,同时多源遥感协同估测、集成算法均可提高森林生物量遥感估测精度,可为森林生物量遥感估测提供参考和借鉴。 展开更多
关键词 森林生物量遥感估测 多源遥感 机器学习 算法集成 元谋
下载PDF
基于EMD与机器学习算法的近零能耗建筑负荷预测方法 被引量:1
14
作者 韩少锋 吴迪 +5 位作者 张圣原 苗睿佺 刘奥 韩中合 韩旭 郭加澄 《暖通空调》 2024年第7期82-89,97,共9页
采用皮尔逊相关系数法分析了不同特征变量与冷热负荷的相关性,确定了预测模型的输入特征变量。采用经验模态分解(EMD)对逐日冷热负荷按频分解,然后采用机器学习算法,即反向传播神经网络(BPNN)、随机森林(RF)和支持向量机(SVM),分别对不... 采用皮尔逊相关系数法分析了不同特征变量与冷热负荷的相关性,确定了预测模型的输入特征变量。采用经验模态分解(EMD)对逐日冷热负荷按频分解,然后采用机器学习算法,即反向传播神经网络(BPNN)、随机森林(RF)和支持向量机(SVM),分别对不同频率的负荷量进行了训练、验证,最后重构得到了近零能耗建筑预测负荷。基于上述方法,以北京市某近零能耗居住建筑为研究对象,比较了不同算法预测结果的精确度。结果表明:采用EMD与RF算法相结合对近零能耗建筑冷热负荷的预测精确度较高。进一步采用穷举搜索法对模型初设参数进行了优化,冷热负荷预测结果精确度提高,冷负荷预测结果的决定系数R2、平均绝对百分比误差MAPE分别为0.996、1.32%,热负荷预测结果的R2、MAPE分别为0.997、0.79%。 展开更多
关键词 近零能耗建筑 负荷预测 经验模态分解 机器学习算法 反向传播神经网络(BPNN) 随机森林(RF) 支持向量机(SVM) 穷举搜索法
下载PDF
基于SDGSAT-1 TIS的机器学习算法岩性分类
15
作者 张昭 刘磊 《地质论评》 CAS CSCD 北大核心 2024年第S01期351-352,共2页
造岩矿物在热红外(TIR)大气窗口(7~14μm)中显示出特定的光谱特征为利用TIR影像进行岩性分类提供了理论基础(代晶晶等,2020)。然而,传统TIR遥感岩性分类数据源有限,且常用的基于光谱相似性和光谱特征的方法很难对类似的岩石类型进行分类... 造岩矿物在热红外(TIR)大气窗口(7~14μm)中显示出特定的光谱特征为利用TIR影像进行岩性分类提供了理论基础(代晶晶等,2020)。然而,传统TIR遥感岩性分类数据源有限,且常用的基于光谱相似性和光谱特征的方法很难对类似的岩石类型进行分类,光谱吸收位置特征很容易受到矿物复杂化学成分的影响。2021年发射的可持续发展科学卫星1号(SDGSAT-1)在TIR区域具有3个波段. 展开更多
关键词 热红外影像 机器学习算法(mlas) 岩性分类
下载PDF
基于机器学习和遗传算法的非局部晶体塑性模型参数识别
16
作者 周瑞 熊宇凯 +3 位作者 储节磊 阚前华 康国政 张旭 《力学学报》 EI CAS CSCD 北大核心 2024年第3期751-762,共12页
非局部晶体塑性模型考虑了由非均匀变形引起的位错在空间上的重排,使得其本构模型变得复杂,可调节参数众多,因此采用常规的“试错法”难以准确确定这些参数.虽然遗传算法能够稳健地全局优化解决参数确定问题,但对于非局部晶体塑性模型,... 非局部晶体塑性模型考虑了由非均匀变形引起的位错在空间上的重排,使得其本构模型变得复杂,可调节参数众多,因此采用常规的“试错法”难以准确确定这些参数.虽然遗传算法能够稳健地全局优化解决参数确定问题,但对于非局部晶体塑性模型,其计算成本相对较高.为解决这一问题,提出了一种耦合机器学习模型的遗传算法,以有效降低计算成本.针对含有冷却孔的镍基高温合金的拉伸响应问题,以单拉应力-应变曲线为目标,基于屈服应力和最终应力建立评价公式,使得优化结果与实验尽可能接近.在这一方法中,机器学习模型能够通过非局部晶体塑性模型的参数来预测相应的应力值,从而替代了遗传算法中原本需要的有限元计算过程.为了分析本构模型参数对单拉力学响应的影响,研究采用SHAP框架,并通过有限元结果进行验证.结果表明,通过该方法可以有效获取非局部晶体塑性模型参数,使得参数计算得到的应力-应变响应与实验结果吻合较好.此外, SHAP框架能够提供本构模型参数的重要程度分析,以及对屈服应力和最终应力的影响. 展开更多
关键词 晶体塑性 机器学习 参数确定 遗传算法
下载PDF
机器学习算法在食品气味表征中的应用
17
作者 李帅 柴春祥 刘建福 《中国食品学报》 EI CAS CSCD 北大核心 2024年第8期486-501,共16页
食品气味的客观表征对于食品生产工艺优化及品质评价具有重要意义。然而,食品气味形成机理复杂、成分繁杂,加之气味的评价过程易受环境、心理及感知方式等多种因素的影响,使得在表征食品气味时需要处理大量高维复杂的信息,这要求借助具... 食品气味的客观表征对于食品生产工艺优化及品质评价具有重要意义。然而,食品气味形成机理复杂、成分繁杂,加之气味的评价过程易受环境、心理及感知方式等多种因素的影响,使得在表征食品气味时需要处理大量高维复杂的信息,这要求借助具有强大数据处理能力的工具。伴随人工智能、计算机科学以及大数据技术的快速发展,机器学习具备了强大数据处理能力。因此,使用机器学习表征食品气味已成为可能,此过程的实现主要依赖机器学习算法。本文概述各类机器学习算法在食品气味客观表征中的应用情况,总结使用机器学习算法对食品气味进行表征的优势和待解决的问题,并展望机器学习算法应用于食品气味表征的未来发展方向。 展开更多
关键词 食品 气味表征 机器学习 算法
下载PDF
基于机器学习算法和能量闭合理论的高标准稻田蒸散估算
18
作者 邰久 王伟 +7 位作者 徐敏 胡凝 陈上 徐敬争 胡小旭 吕恒 祝子涵 赖宇婧 《中国农业气象》 CSCD 2024年第10期1109-1122,共14页
为选出模拟长江中下游高标准稻田各生育期实际蒸散(ETa)的最优机器学习模型,并探究能量闭合对机器学习模型模拟ETa的影响,基于南通市2020年高标准水稻田小气候、土壤和通量观测数据,分析各生育期稻田ETa及相关因子的时间变化特征,利用B... 为选出模拟长江中下游高标准稻田各生育期实际蒸散(ETa)的最优机器学习模型,并探究能量闭合对机器学习模型模拟ETa的影响,基于南通市2020年高标准水稻田小气候、土壤和通量观测数据,分析各生育期稻田ETa及相关因子的时间变化特征,利用BP神经网络和随机森林两种算法估算各生育期ETa,评估基于波文比的强迫能量闭合对机器学习模型模拟ETa精度的影响。结果表明:(1)在不同生育期,气象和土壤因子对稻田ETa的重要性不同,入射短波辐射(K↓)始终是稻田ETa的主控因子。(2)加入K↓可显著提高机器学习模型对ETa的模拟精度,相关系数提高了14.9%,RMSE降低51.1%。5种变量组合中,包含饱和水汽压差(VPD)、风速(U)、气温(Ta)、相对湿度(RH)和入射短波辐射(K↓)的BP1模型是模拟分蘖期前稻田ETa的最佳模型,包含Ta、RH和K↓的BP3模型更适于模拟分蘖期后的稻田ETa。(3)强迫能量闭合能改善BP神经网络模型对ETa的模拟效果,在分蘖期前更为明显,5种变量组合中,BP2模型(U、Ta、RH和K↓)在能量闭合后的模拟效果提升最明显,相关系数提高了3.5%,RMSE降低25.7%。 展开更多
关键词 蒸散 机器学习算法 能量闭合 水稻 生育期
下载PDF
基于SMOTE算法和机器学习模型建立原发性肝癌术后的预后预测模型
19
作者 潘比 余靖华 +2 位作者 黄译贤 伍亚舟 李芳 《陆军军医大学学报》 CAS CSCD 北大核心 2024年第19期2236-2240,共5页
目的基于合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)算法和机器学习模型构建原发性肝癌术后的预后预测模型。方法选取美国国立癌症研究所的监测、流行病学及最终结果(Surveillance,Epidemiology,and End ... 目的基于合成少数类过采样技术(synthetic minority over-sampling technique,SMOTE)算法和机器学习模型构建原发性肝癌术后的预后预测模型。方法选取美国国立癌症研究所的监测、流行病学及最终结果(Surveillance,Epidemiology,and End Results,SEER)数据库中4297例患者进行回顾性队列研究,通过独热编码和平均值插补法进行数据预处理,利用SMOTE算法解决数据类别不平衡问题,将临床变量纳入机器学习模型,基于决策树(decision tree,DT)、随机森林(random forest,RF)、梯度提升决策树(gradient boosting decision tree,GBDT)、极限梯度提升算法(eXtreme Gradient Boosting,XGBoost)方法构建预后预测模型(SMOTE+DT/RF/GBDT/XGBoost),通过比较多种模型的性能,筛选出最佳的预测模型。结果组合模型SMOTE+RF展示出最优的预测性能,受试者工作特征曲线(receiver operating characteristic curve,ROC)下的面积(area under the curve,AUC)、准确率和精确率均高于其他模型,分别为0.895、0.811、0.806。结论基于SMOTE+RF算法的原发性肝癌的预后预测模型可有效预测原发性肝癌患者的生存结局。 展开更多
关键词 原发性肝癌 少数类过采样技术算法 机器学习 预测模型
下载PDF
结合无人机多光谱数据和机器学习算法的春小麦叶面积指数反演
20
作者 刘琦 屈忠义 +5 位作者 白燕英 杨威 方海燕 白巧燕 杨旖璇 张如鑫 《灌溉排水学报》 CAS CSCD 2024年第11期63-73,共11页
【目的】探究基于无人机多光谱数据反演大田春小麦叶面积指数(LAI)的最优机器学习建模方法。【方法】以内蒙古沿黄流域的土默川平原春小麦为对象,利用大疆P4M无人机采集了3个关键生育时期(拔节期、孕穗期、灌浆期)多光谱影像数据,提取... 【目的】探究基于无人机多光谱数据反演大田春小麦叶面积指数(LAI)的最优机器学习建模方法。【方法】以内蒙古沿黄流域的土默川平原春小麦为对象,利用大疆P4M无人机采集了3个关键生育时期(拔节期、孕穗期、灌浆期)多光谱影像数据,提取植被指数同实测LAI进行相关性分析,用以植被指数的筛选,筛选后的植被指数进行主成分分析(PCA),将新主成分因子作为模型输入变量结合多元线性回归(MLR)、决策树回归(DTR)、BP神经网络回归(BPNN)、梯度提升树回归(GBDT)、支持向量机回归(SVR)和随机森林回归(RFR)6种建模方法,分别构建不同生育时期LAI估算模型,经精度验证,确定LAI的最优估算模型。【结果】归一化植被指数(NDVI)、改进的简单比值植被指数(MSR)、比值植被指数(RVI)、差值植被指数(DVI)、土壤调节植被指数(SAVI)和归一化差异红边指数(NDRE)与LAI均存在显著相关性,但重归一化植被指数(RDVI)在孕穗期和灌浆期与LAI的相关系数仅为0.23和0.21。在反演模型方面,拔节期的BPNN模型表现最优,验证集R^(2)为0.822,RMSE为0.305,MAE为0.257。而在孕穗期、灌浆期以及整个生育期内,RFR模型表现最佳,验证集R^(2)分别为0.613、0.811和0.834,对应的RMSE分别为0.189、0.150和0.174,MAE分别为0.126、0.121和0.133,且以多生育时期数据建立的RFR模型精度大于单生育时期模型。【结论】利用无人机多光谱数据计算的植被指数结合机器学习算法可以较好反映春小麦各生育时期LAI分布情况,其中,使用多生育时期数据建立的模型估算精度大于单生育时期模型,单生育时期中,拔节期的预测精度最高,其次是灌浆期和孕穗期。在算法方面,BPNN算法构建的LAI估算模型在拔节期的反演精度最高RFR算法构建的LAI估算模型是准确估算春小麦中后期LAI表型参数的优选方法,相比之下GBDT模型在各生育时期的反演精度均较低,不推荐作为春小麦LAI反演模型。 展开更多
关键词 无人机 多光谱 春小麦 叶面积指数 机器学习算法 植被指数
下载PDF
上一页 1 2 148 下一页 到第
使用帮助 返回顶部