期刊文献+
共找到168篇文章
< 1 2 9 >
每页显示 20 50 100
Basic Tenets of Classification Algorithms K-Nearest-Neighbor, Support Vector Machine, Random Forest and Neural Network: A Review 被引量:1
1
作者 Ernest Yeboah Boateng Joseph Otoo Daniel A. Abaye 《Journal of Data Analysis and Information Processing》 2020年第4期341-357,共17页
In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (... In this paper, sixty-eight research articles published between 2000 and 2017 as well as textbooks which employed four classification algorithms: K-Nearest-Neighbor (KNN), Support Vector Machines (SVM), Random Forest (RF) and Neural Network (NN) as the main statistical tools were reviewed. The aim was to examine and compare these nonparametric classification methods on the following attributes: robustness to training data, sensitivity to changes, data fitting, stability, ability to handle large data sizes, sensitivity to noise, time invested in parameter tuning, and accuracy. The performances, strengths and shortcomings of each of the algorithms were examined, and finally, a conclusion was arrived at on which one has higher performance. It was evident from the literature reviewed that RF is too sensitive to small changes in the training dataset and is occasionally unstable and tends to overfit in the model. KNN is easy to implement and understand but has a major drawback of becoming significantly slow as the size of the data in use grows, while the ideal value of K for the KNN classifier is difficult to set. SVM and RF are insensitive to noise or overtraining, which shows their ability in dealing with unbalanced data. Larger input datasets will lengthen classification times for NN and KNN more than for SVM and RF. Among these nonparametric classification methods, NN has the potential to become a more widely used classification algorithm, but because of their time-consuming parameter tuning procedure, high level of complexity in computational processing, the numerous types of NN architectures to choose from and the high number of algorithms used for training, most researchers recommend SVM and RF as easier and wieldy used methods which repeatedly achieve results with high accuracies and are often faster to implement. 展开更多
关键词 classification algorithms NON-PARAMETRIC K-Nearest-Neighbor Neural Networks random Forest Support Vector Machines
下载PDF
基于改进的Random Subspace 的客户投诉分类方法 被引量:3
2
作者 杨颖 王珺 王刚 《计算机工程与应用》 CSCD 北大核心 2020年第13期230-235,共6页
电信业的客户投诉不断增多而又亟待高效处理。针对电信客户投诉数据的特点,提出了一种面向高维数据的改进的集成学习分类方法。该方法综合考虑客户投诉中的文本信息及客户通讯状态信息,基于Random Subspace方法,以支持向量机(Support Ve... 电信业的客户投诉不断增多而又亟待高效处理。针对电信客户投诉数据的特点,提出了一种面向高维数据的改进的集成学习分类方法。该方法综合考虑客户投诉中的文本信息及客户通讯状态信息,基于Random Subspace方法,以支持向量机(Support Vector Machine,SVM)为基分类器,采用证据推理(Evidential Reasoning,ER)规则为一种新的集成策略,构造分类模型对电信客户投诉进行分类。所提模型和方法在某电信公司客户投诉数据上进行了验证,实验结果显示该方法能够显著提高客户投诉分类的准确率和投诉处理效率。 展开更多
关键词 客户投诉分类 random subspace方法 支持向量机 证据推理规则
下载PDF
Random Forest Based Very Fast Decision Tree Algorithm for Data Stream
3
作者 DONG Zhenjiang LUO Shengmei +2 位作者 WEN Tao ZHANG Fayang LI Lingjuan 《ZTE Communications》 2017年第B12期52-57,共6页
The Very Fast Decision Tree(VFDT)algorithm is a classification algorithm for data streams.When processing large amounts of data,VFDT requires less time than traditional decision tree algorithms.However,when training s... The Very Fast Decision Tree(VFDT)algorithm is a classification algorithm for data streams.When processing large amounts of data,VFDT requires less time than traditional decision tree algorithms.However,when training samples become fewer,the label values of VFDT leaf nodes will have more errors,and the classification ability of single VFDT decision tree is limited.The Random Forest algorithm is a combinational classifier with high prediction accuracy and noise-tol-erant ability.It is constituted by multiple decision trees and can make up for the shortage of single decision tree.In this paper,in order to improve the classification accuracy on data streams,the Random Forest algorithm is integrated into the process of tree building of the VFDT algorithm,and a new Random Forest Based Very Fast Decision Tree algorithm named RFVFDT is designed.The RFVFDT algorithm adopts the decision tree building criterion of a Random Forest classifier,and improves Random Forest algorithm with sliding window to meet the unboundedness of data streams and avoid process delay and data loss.Experimental results of the classification of KDD CUP data sets show that the classification accuracy of RFVFDT algorithm is higher than that of VFDT.The less the samples are,the more obvious the advantage is.RFVFDT is fast when running in the multithread mode. 展开更多
关键词 DATA STREAM DATA classification random FOREST algorithm VFDT algorithm
下载PDF
一种随机森林增强的车载容迟网络路由算法
4
作者 吴家皋 芮琦 刘林峰 《小型微型计算机系统》 CSCD 北大核心 2024年第5期1188-1195,共8页
针对车载容迟网络(Vehicular Delay Tolerant Network,VDTN)中车辆节点高速移动造成的通信链路不稳定性问题,利用车辆节点的移动模式,提出了一种随机森林增强的VDTN路由算法.首先,引入与车辆节点运动相联系的属性并利用动态相遇奖励机... 针对车载容迟网络(Vehicular Delay Tolerant Network,VDTN)中车辆节点高速移动造成的通信链路不稳定性问题,利用车辆节点的移动模式,提出了一种随机森林增强的VDTN路由算法.首先,引入与车辆节点运动相联系的属性并利用动态相遇奖励机制对车辆节点进行分类,以此构建初始随机森林模型.接着,从决策树的分类性能和多样性两个方面优化模型,选择分类性能好、多样性高的决策树构造改进的随机森林模型,其中,决策树的分类性能和多样性分别根据每棵树分类错误率及相应的惩罚权重和由不合度量定义的决策树之间的相似度来衡量.最后,根据改进的随机森林模型提出新的VDTN路由算法.仿真实验证明,所提出的路由算法能显著提高消息的投递率,降低消息的投递时延,从而验证了其有效性. 展开更多
关键词 车载容迟网络 随机森林 路由算法 分类性能 多样性
下载PDF
随机多属性子空间的ReliefF加权邻域粗糙集与属性约简
5
作者 王莉 《计算机工程与应用》 CSCD 北大核心 2024年第8期69-77,共9页
属性约简是一种重要的数据降维预处理方法,然而现有的属性约简方法大多没有考虑信息系统中属性权重的信息。ReliefF算法是一种实现简单且运算效率高的属性权重评估方法,提出一种随机多属性子空间的ReliefF加权邻域粗糙集和属性约简算法... 属性约简是一种重要的数据降维预处理方法,然而现有的属性约简方法大多没有考虑信息系统中属性权重的信息。ReliefF算法是一种实现简单且运算效率高的属性权重评估方法,提出一种随机多属性子空间的ReliefF加权邻域粗糙集和属性约简算法。该方法生成了多组具有相同大小随机子空间的属性集划分,并对每组划分的随机子空间利用ReliefF算法计算得到属性的局部权重,将所有组得到的属性局部权重求取平均值,得到了信息系统每个属性最终的全局权重;基于属性权重的结果,提出一种新的加权邻域粗糙集模型,并证明了相关理论和性质;在该模型的基础上通过加权邻域依赖度提出一种信息系统的属性约简算法。在公开数据集上的属性约简实验结果表明,所提出的属性约简算法比已有的同类型算法整体上具有更优的约简性能。 展开更多
关键词 属性约简 RELIEFF算法 随机子空间 加权邻域 邻域粗糙集模型
下载PDF
基于正负地形的喀斯特地貌分类研究——以贵州喀斯特区为例
6
作者 罗娅 张荣星 +3 位作者 薛习习 刘茂 王娇娇 娄晶智 《贵州师范大学学报(自然科学版)》 CAS 北大核心 2024年第5期9-19,共11页
地形因子具有直观性、可视性,常被作为喀斯特地貌分类的主要依据。已有关于喀斯特地貌分类研究所用的地形因子较多且复杂,分类特征不易被公众学习和理解,导致成果的应用和推广难度较大。因此以贵州喀斯特区为研究对象,运用地形开度法和... 地形因子具有直观性、可视性,常被作为喀斯特地貌分类的主要依据。已有关于喀斯特地貌分类研究所用的地形因子较多且复杂,分类特征不易被公众学习和理解,导致成果的应用和推广难度较大。因此以贵州喀斯特区为研究对象,运用地形开度法和随机森林模型,筛选重要性正负地形指标,探讨喀斯特地貌分类方法。结果表明:1)贵州喀斯特区的蚕食度均值为1.35,深切度均值为215.36 m,平均粗糙度比均值为1.01,负地形面积大于正地形面积,正负地形不规则且破碎度较大,正地形被沟谷深切明显,地貌的异质性强烈。2)蚕食度和深切度2个指标的重要性指数分别为0.93和1.16,能较好地反映喀斯特地貌的差异性。3)根据蚕食度和深切度贵州喀斯特地貌分为23类,分类精度优良达93.33%。在不同的喀斯特地貌区,因为蚕食度和深切度不同,导致水、土、光、热资源丰度不同,因而它们的土地利用方式各异。研究简化了分类判别喀斯特地貌的地形指标,降低了公众对喀斯特地貌的认识和理解难度,并为数字地形技术在喀斯特地貌分类中的推广应用提供参考。 展开更多
关键词 正负地形 喀斯特地貌分类 蚕食度 深切度 随机森林模型
下载PDF
基于GEE和Sentinel-2影像的杭州城市湿地精细化分类研究
7
作者 潘宸 侯浩 +3 位作者 唐伟 蒋卫国 王品 胡潭高 《北京师范大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期447-458,共12页
基于Google Earth Engine(GEE)云平台,使用Sentinel-2卫星影像数据,采用随机森林算法面向杭州城市湿地类型进行遥感分类研究.研究结果表明:在进行湿地类型精细化分类时,相比于使用单一特征信息分类,多特征信息的组合可以显著提高分类精... 基于Google Earth Engine(GEE)云平台,使用Sentinel-2卫星影像数据,采用随机森林算法面向杭州城市湿地类型进行遥感分类研究.研究结果表明:在进行湿地类型精细化分类时,相比于使用单一特征信息分类,多特征信息的组合可以显著提高分类精度,最优特征组合包括传统光谱特征、红边光谱特征、变换特征、纹理特征和地形特征,其总体精度为81.2%,Kappa系数为0.75;不同特征信息对于不同湿地类型的提取具有重要作用,传统光谱特征对于滩地和养殖池的识别非常有利,而红边光谱特征和变换特征分别对草本沼泽和湖泊的识别更为有效.此外,红边光谱特征和纹理特征的组合有利于运河/水渠的识别.通过特征对比实验可为湿地精细化分类的案例研究提供参考,湿地分类结果可为杭州城市湿地信息的遥感识别提供数据支撑. 展开更多
关键词 Google Earth Engine(GEE)云平台 Sentinel-2影像 随机森林算法 湿地精细化分类
下载PDF
基于随机森林模型的城市非法营运车辆识别
8
作者 黄子璇 李桥兴 《电子科技》 2024年第1期66-71,共6页
区域经济社会的快速发展与交通出行的需求发展不匹配,在一定程度上为非法营运车辆提供了市场契机。城市高速公路的ETC(Electronic Toll Collection)数据可有效稽查高速公路的非法营运车辆,从而优化运行秩序并提升管理水平。文中提取ETC... 区域经济社会的快速发展与交通出行的需求发展不匹配,在一定程度上为非法营运车辆提供了市场契机。城市高速公路的ETC(Electronic Toll Collection)数据可有效稽查高速公路的非法营运车辆,从而优化运行秩序并提升管理水平。文中提取ETC数据的有效字段,采用随机森林算法建立非法营运车辆识别分类器,加入CART(Classification and Regression Tree)分类树模型分类器和二元逻辑回归模型分类器与之对比,并以西南某市高速公路自2022年2月6日~2022年3月8日的ETC指标数据进行实证分析。结果表明,随机森林模型分类器比CART分类树模型分类器和二元逻辑回归模型分类器预测效果更好,其准确性高达98.75%。 展开更多
关键词 非法营运车辆 随机森林模型 CART分类树模型 二元逻辑回归模型 分类算法 机器学习 深度学习 识别算法
下载PDF
基于机器学习分类算法解析EIS数据的有机涂层性能评价方法
9
作者 纪皓迪 马小兵 《装备环境工程》 CAS 2024年第5期142-149,共8页
目的基于机器学习分类算法快速评估有机涂层的防腐性能。方法通过实验室加速试验模拟涂层真实的退化过程,并根据测得的电化学数据,分析不同退化阶段的等效电路元件参数。随后,采用随机抽样方法获取大量数据,用于机器学习模型训练。通过... 目的基于机器学习分类算法快速评估有机涂层的防腐性能。方法通过实验室加速试验模拟涂层真实的退化过程,并根据测得的电化学数据,分析不同退化阶段的等效电路元件参数。随后,采用随机抽样方法获取大量数据,用于机器学习模型训练。通过对比支持向量机(SVM)、k最近邻(k-NN)和随机森林(RF)3种不同的机器学习算法,以及多种输入特征集训练的涂层性能分类器模型的准确率,分析最适合用于涂层性能快速评估的机器学习算法和电化学特征。结果根据不同输入特征训练的k-NN和RF模型均表现出良好的预测效果,而SVM模型的预测效果相对较差。根据不同频率范围训练的分类器模型中,在低频区表现最佳,而在高频区表现较差。结论基于阻抗虚部、虚部+实部和阻抗模值3种输入特征训练的RF分类器模型的预测效果最准确。不同频率区间内,低频区的阻抗特征更能准确表征涂层性能。 展开更多
关键词 有机涂层 分类算法 机器学习 电化学阻抗谱 支持向量机 k最近邻 随机森林
下载PDF
随机梯度下降优化的量子多分类支持向量机 被引量:2
10
作者 韩兴 《福建电脑》 2024年第2期1-6,共6页
为改善大规模数据在经典机器学习多分类任务中的计算负担,本文提出了一种基于随机梯度下降优化的量子多分类支持向量机(SGD-MQSVM)算法。通过采用量子随机梯度下降法获得训练参数,并采用全对多分类支持向量机的量子方法进行多分类。算... 为改善大规模数据在经典机器学习多分类任务中的计算负担,本文提出了一种基于随机梯度下降优化的量子多分类支持向量机(SGD-MQSVM)算法。通过采用量子随机梯度下降法获得训练参数,并采用全对多分类支持向量机的量子方法进行多分类。算法的时间复杂性可将单次迭代的时间复杂度从经典多项式级降低到对数级。 展开更多
关键词 随机梯度下降 量子支持向量机 多分类算法
下载PDF
基于随机森林的电网GIS数据分布式存储方法
11
作者 杨秋勇 王建欣 +1 位作者 符飞虎 罗政 《电子设计工程》 2024年第17期27-30,35,共5页
内部电网地理信息系统(Geographic Information Systern,GIS)数据体量增加,对电网数据存储性能造成了极大的困难,为此,提出一种基于随机森林的电网GIS数据分布式存储方法。以跨域资源共享(Cross-Origin Resource Sharing,CORS)技术在电... 内部电网地理信息系统(Geographic Information Systern,GIS)数据体量增加,对电网数据存储性能造成了极大的困难,为此,提出一种基于随机森林的电网GIS数据分布式存储方法。以跨域资源共享(Cross-Origin Resource Sharing,CORS)技术在电网GIS空间信息服务平台中获取的电网GIS数据为基础,根据类区分度数值选择电网GIS数据特征,引入随机森林算法分类处理电网GIS数据,将其合理分发给不同的服务器,采用并行处理手段存储分类数据,从而实现了电网GIS数据的分布式存储。实验数据显示:应用所提方法后,电网GIS数据分类精度达到了96.8%,电网GIS数据分布式存储时间最小值为5.2 s,充分证实了所提方法数据存储性能更佳。 展开更多
关键词 数据分类 电网GIS数据 并行处理 分布式存储 随机森林算法 类区分度
下载PDF
A Tunable Resolution MUSIC Algorithm for Interharmonics Analysis
12
作者 Ming Zhang Xiang Zhang +1 位作者 Heng Yao Shunfan He 《Journal of Power and Energy Engineering》 2017年第9期1-13,共13页
The harmonic and interharmonic analysis recommendations are contained in the latest IEC standards on power quality. Measurement and analysis experiences have shown that great difficulties arise in the interharmonic de... The harmonic and interharmonic analysis recommendations are contained in the latest IEC standards on power quality. Measurement and analysis experiences have shown that great difficulties arise in the interharmonic detection and measurement with acceptable levels of accuracy. In order to improve the resolution of spectrum analysis, the traditional method (e.g. discrete Fourier transform) is to take more sampling cycles, e.g. 10 sampling cycles corresponding to the spectrum interval of 5 Hz while the fundamental frequency is 50 Hz. However, this method is not suitable to the interharmonic measurement, because the frequencies of interharmonic components are non-integer multiples of the fundamental frequency, which makes the measurement additionally difficult. In this paper, the tunable resolution multiple signal classification (TRMUSIC) algorithm is presented, which the spectrum can be tuned to exhibit high resolution in targeted regions. Some simulation examples show that the resolution for two adjacent frequency components is usually sufficient to measure interharmonics in power systems with acceptable computation time. The proposed method is also suited to analyze interharmonics when there exists an undesirable asynchronous deviation and additive white noise. 展开更多
关键词 INTERHARMONICS ANALYSIS TUNABLE RESOLUTION Multiple Signal classification (TRMUSIC) algorithm subspace DECOMPOSITION Spectral ANALYSIS
下载PDF
不确定数据分类的模糊随机森林算法 被引量:3
13
作者 丁恒兵 叶飞跃 《计算机工程与设计》 北大核心 2023年第11期3373-3379,共7页
实际应用中不确定数据的分类问题越来越受到人们的重视,不确定数据不但属性值是不确定的,类标签也可能不确定。提出的不确定离散化算法,使模糊决策树能够处理区间数据,统一了属性值不确定与类标签不确定的差异。由此提出的由模糊决策树... 实际应用中不确定数据的分类问题越来越受到人们的重视,不确定数据不但属性值是不确定的,类标签也可能不确定。提出的不确定离散化算法,使模糊决策树能够处理区间数据,统一了属性值不确定与类标签不确定的差异。由此提出的由模糊决策树构造模糊随机森林的模糊分类算法,既继承了模糊决策树对不确定数据分类的灵活性,又继承了随机森林的集成性、鲁棒性和随机性的优点。实验结果表明,对于不确定性数据分类问题,该算法性能优于现有的一些算法。 展开更多
关键词 不确定数据分类 模糊决策树 模糊随机森林 不确定离散化算法 区间数据 类标签 概率分布函数
下载PDF
基于DBSCAN聚类分解和过采样的随机森林不平衡数据分类算法 被引量:1
14
作者 赵小强 姚青磊 《兰州理工大学学报》 CAS 北大核心 2023年第6期80-89,共10页
针对传统方法在不平衡数据分类时易导致生成假样本数量多或数据丢失等问题,提出了一种基于DBSCAN聚类分解和过采样的随机森林不平衡数据分类算法.首先,将基于密度的DBSCAN聚类分解算法应用于不平衡数据集的多数类,在没有数据丢失的情况... 针对传统方法在不平衡数据分类时易导致生成假样本数量多或数据丢失等问题,提出了一种基于DBSCAN聚类分解和过采样的随机森林不平衡数据分类算法.首先,将基于密度的DBSCAN聚类分解算法应用于不平衡数据集的多数类,在没有数据丢失的情况下降低了多数类样本的优势;其次,通过Borderline-SMOTE算法对少数类进行过采样,增加了少数类样本的数量,从而得到更加平衡的数据集,有效地解决了过采样时生成过多假样本而导致过拟合的问题,同时避免了欠采样方法造成数据丢失的问题;最后,在聚类分解和过采样算法的前提下,验证了随机森林比SVM、Adaboost、Bagging、XGBoost有更好的效果.在KEEL公用数据集上与其他流行算法进行实验比较,结果显示该算法有效地提高了不平衡数据的分类性能. 展开更多
关键词 不平衡数据 分类算法 DBSCAN 随机森林
下载PDF
基于分类算法的汽轮机故障诊断 被引量:3
15
作者 杨荣利 曹军 +1 位作者 张延启 周东阳 《电子设计工程》 2023年第9期68-72,共5页
汽轮机系统设备是火电厂的主力运行设备之一,对汽轮机系统进行有效的故障诊断及预测有助于保障火电机组的安全、稳定运行。基于随机森林算法对汽轮机数据进行处理,完成对汽轮机设备原始数据信息的降维与特征筛选。同时采用6种分类算法... 汽轮机系统设备是火电厂的主力运行设备之一,对汽轮机系统进行有效的故障诊断及预测有助于保障火电机组的安全、稳定运行。基于随机森林算法对汽轮机数据进行处理,完成对汽轮机设备原始数据信息的降维与特征筛选。同时采用6种分类算法建立汽轮机正常和故障的算法模型,实现汽轮机设备状态正常、异常的故障诊断。在汽轮机含有故障的真实运行数据集上进行的实验结果表明,预测准确率较高的模型依次为梯度提升决策树、随机森林、决策树以及K近邻分类算法,且准确率最高可达99.98%;而预测用时较短的模型为K近邻和决策树分类算法,对20 000余条样本训练进行预测,最快可在0.034 s内完成。 展开更多
关键词 汽轮机 故障诊断 分类算法 随机森林 K近邻
下载PDF
基于随机森林算法的数据中心运维异常告警方法 被引量:7
16
作者 周杨 王春林 郭锐 《现代电子技术》 2023年第8期143-148,共6页
已有的数据中心运维异常告警方法由于数据分类结果模糊,无法在运维中心筛选异常数据,导致告警效果欠佳。为解决上述问题,文中提出一种基于随机森林算法的数据中心运维异常告警方法。通过滑窗方法构造数据样本,设定控制参数,以确定数据... 已有的数据中心运维异常告警方法由于数据分类结果模糊,无法在运维中心筛选异常数据,导致告警效果欠佳。为解决上述问题,文中提出一种基于随机森林算法的数据中心运维异常告警方法。通过滑窗方法构造数据样本,设定控制参数,以确定数据样本总数,集成数据集,实现数据预处理;然后建立包含多个决策方法的数据分类器,分别计算数据的平均值、极差和标准差,判断样本线性函数,确定特征集合,实现异常特征提取;最后,根据随机森林算法训练计算子集,建立数据决策树,通过数据的流动次数和分类结果实现异常告警。实验结果表明,基于随机森林算法的数据中心运维异常告警方法通过数据分类器能够在短时间内处理异常数据,并判断异常特征,对于异常数据的识别精准度高于90%,与其他识别方法相比,具有很好的识别效果。 展开更多
关键词 随机森林算法 数据中心 异常告警 异常识别 特征分类 决策树
下载PDF
基于BTS数据集的航班延误分类和预测算法 被引量:1
17
作者 郭海州 杨晶晶 +2 位作者 吴季达 张彬 黄铭 《科学技术与工程》 北大核心 2023年第12期5304-5311,共8页
针对神经网络分类模型对美国联邦运输统计局(Bureau of Transportation Statistics,BTS)航班数据集中的不均衡数据预测误差较大的问题,采用自适应合成采样算法(adaptive synthetic sampling approach,ADASYN)和合成少数类过采样算法(syn... 针对神经网络分类模型对美国联邦运输统计局(Bureau of Transportation Statistics,BTS)航班数据集中的不均衡数据预测误差较大的问题,采用自适应合成采样算法(adaptive synthetic sampling approach,ADASYN)和合成少数类过采样算法(synthetic minority over-sampling technique,SMOTE)对航班延误类别进行平衡处理,并用随机森林(random forest,RF)模型进行训练和贝叶斯调参。结果表明:与不经过平衡采样的方法比较,该方法在权重平均下的精确率、召回率和F 1评分分别提高了19%、8%和16%;分类预测准确率提升8.03%,模型拟合指数AUC(area under curve)提升5.4%。同时,采用多特征相融合的图神经网络模型Graph WaveNet对航班平均延误时间进行预测。实验结果表明:与单特征模型比较,该模型平均绝对误差和均方根误差分别降低了16%和12.45%。这些方法和结果对研究航班延误分类和预测算法研究具有参考价值。 展开更多
关键词 不平衡分类数据 平衡采样算法 随机森林(RF)模型 图神经网络 特征融合
下载PDF
基于GEE和多维特征集的锡林浩特露天矿区近30 a土地利用分类 被引量:2
18
作者 张来红 秦婷婷 +4 位作者 泽仁卓格 张海涛 佘长超 李军 张成业 《金属矿山》 CAS 北大核心 2023年第3期234-241,共8页
随着矿产资源的不断开采,矿区地表土地利用会发生频繁的变化,快速获取矿区开采过程中长时间序列连续的土地利用分类结果对于矿区土地治理与生态重建具有重要意义。基于Google Earth Engine(GEE)遥感云平台,对Sentinel-2和Landsat数据从... 随着矿产资源的不断开采,矿区地表土地利用会发生频繁的变化,快速获取矿区开采过程中长时间序列连续的土地利用分类结果对于矿区土地治理与生态重建具有重要意义。基于Google Earth Engine(GEE)遥感云平台,对Sentinel-2和Landsat数据从光谱特征、纹理特征、地形特征3个方面构建多维特征集,采用随机森林算法分别建立了不同特征模型并测试精度以筛选出适合矿区场景的最优分类模型。以锡林浩特市露天矿区为研究区,开展了近30 a(1991—2020年)长时序土地利用分类研究。结果表明:①基于GEE遥感云平台,能够高效、快速、准确地提取研究区1991—2020年近30 a的土地利用分类结果;②光谱特征对分类精度具有决定性作用,融入纹理特征和地形特征能够有效提高矿区土地利用分类模型精度;③Sentinel-2数据特有的红边波段对植被具有较高的敏感性,能有效提高分类精度。长时间连续的监测结果能够有效了解锡林浩特市露天矿区土地利用的变化情况及规律,为进一步分析人类生产生活和环境变化对土地利用的影响提供了坚实的数据支撑。 展开更多
关键词 土地利用分类 GEE 随时森林算法 长时间序列 多维特征
下载PDF
基于大容量棉花检测仪检测结果的进口锯齿棉品级分类
19
作者 董绍伟 徐静 +1 位作者 刘俊 刘冬志 《毛纺科技》 CAS 北大核心 2023年第4期82-86,共5页
为了消除进口棉花品级分类中由于检测人员主观性引起的观察偏倚,以及其与预警信息化和及时性不相符等矛盾,文章基于大容量棉花检测仪(HVI)的检测结果,提出运用随机森林算法来预测进口锯齿棉品级分类的方法。对HVI检测获得的原始数据进... 为了消除进口棉花品级分类中由于检测人员主观性引起的观察偏倚,以及其与预警信息化和及时性不相符等矛盾,文章基于大容量棉花检测仪(HVI)的检测结果,提出运用随机森林算法来预测进口锯齿棉品级分类的方法。对HVI检测获得的原始数据进行标准化处理,并运用主成分分析降低指标维度,采用随机森林算法构建分类模型,将测试样本带入训练好的分类模型,可自动判别出测试锯齿棉的品级。实验结果表明该方法的分类效果较好,可有效实现锯齿棉品级的自动分类。 展开更多
关键词 HVI检测 锯齿棉 随机森林算法 品级分类
下载PDF
改进骆驼算法辅助随机森林模型预测TBM油温 被引量:1
20
作者 任建吉 赵润秋 +2 位作者 王镇希 刘雨明 原永亮 《机械强度》 CAS CSCD 北大核心 2023年第4期862-870,共9页
为获取对盾构机(Tunnel Boring Machine,TBM)油温的分类预测性能,基于自然天气现象,提出一种骆驼行走阻力与行走耐力策略改进骆驼算法优化随机森林的预测模型。首先,采用提出的策略对传统骆驼算法进行改进,结果表明,改进后的骆驼算法具... 为获取对盾构机(Tunnel Boring Machine,TBM)油温的分类预测性能,基于自然天气现象,提出一种骆驼行走阻力与行走耐力策略改进骆驼算法优化随机森林的预测模型。首先,采用提出的策略对传统骆驼算法进行改进,结果表明,改进后的骆驼算法具有良好的收敛速度和收敛精度;其次,利用改进骆驼算法对随机森林建立的盾构机油温预测模型进行参数优化,获得最优模型;最后,在此基础上,对测试数据集进行分类预测研究分析。实验结果表明,提出的模型预测准确率达到97.71%,相比于传统随机森林模型在准确率上提升了6.38%,可以达到避免油温过高引起盾构机故障的目的,为未来的整机材料-结构-控制多学科协同优化设计和性能预测提供基础。 展开更多
关键词 改进骆驼算法 随机森林分类 参数优化 TBM 油温预测
下载PDF
上一页 1 2 9 下一页 到第
使用帮助 返回顶部