期刊文献+
共找到89篇文章
< 1 2 5 >
每页显示 20 50 100
A Statistical Analysis of Textual E-Commerce Reviews Using Tree-Based Methods
1
作者 Jessica Kubrusly Ana Luiza Neves Thamires Louzada Marques 《Open Journal of Statistics》 2022年第3期357-372,共16页
With the increasing interest in e-commerce shopping, customer reviews have become one of the most important elements that determine customer satisfaction regarding products. This demonstrates the importance of working... With the increasing interest in e-commerce shopping, customer reviews have become one of the most important elements that determine customer satisfaction regarding products. This demonstrates the importance of working with Text Mining. This study is based on The Women’s Clothing E-Commerce Reviews database, which consists of reviews written by real customers. The aim of this paper is to conduct a Text Mining approach on a set of customer reviews. Each review was classified as either a positive or negative review by employing a classification method. Four tree-based methods were applied to solve the classification problem, namely Classification Tree, Random Forest, Gradient Boosting and XGBoost. The dataset was categorized into training and test sets. The results indicate that the Random Forest method displays an overfitting, XGBoost displays an overfitting if the number of trees is too high, Classification Tree is good at detecting negative reviews and bad at detecting positive reviews and the Gradient Boosting shows stable values and quality measures above 77% for the test dataset. A consensus between the applied methods is noted for important classification terms. 展开更多
关键词 Text Mining Supervised classification tree-Based methods classification trees Random Forest Gradient Boosting XGBoost
下载PDF
基于无人机影像的连云港云台山林场樱桃树种植面积提取
2
作者 常瑶 费鲜芸 +3 位作者 王圳 高亚军 杨民书 文陈昊 《江苏海洋大学学报(自然科学版)》 CAS 2024年第2期89-96,共8页
利用植被物候特征进行植被信息提取是植被遥感分类的重要研究内容。连云港云台山林场的樱桃花期与其他植被类型的花期存在明显差异,该差异使得樱桃花在盛开和凋落过程中,其影像光谱特征显著且独特。尤其是樱桃花盛开时,其光谱特征的变... 利用植被物候特征进行植被信息提取是植被遥感分类的重要研究内容。连云港云台山林场的樱桃花期与其他植被类型的花期存在明显差异,该差异使得樱桃花在盛开和凋落过程中,其影像光谱特征显著且独特。尤其是樱桃花盛开时,其光谱特征的变化为利用遥感技术进行植被面积提取提供了较好的技术手段。选择2020年3月樱桃花期无人机RGB高分辨率影像为数据源,利用最邻近法(nearest neighbour method,NNM)、随机森林法(random forest,RF)、支持向量机法(support vector machine,SVM)对云台山林场樱桃种植面积进行分类提取。针对樱桃树特定植被类型,探索了其在开花时节的遥感影像提取方法。结果表明:结合樱桃树遥感影像的特征,采用不同分类方法显著提升了樱桃树的分类精度,最高提取精度达到98%。对分类提取后的影像进行精度评价分析:随机森林法在添加了植被指数、光谱特征和纹理特征后樱桃花提取质量最好,其次是最邻近法添加植被指数、光谱特征和纹理特征。该研究不仅填补了樱桃树物候特征提取的研究空白,也为其他具有独特物候特征的植被类型提供了可借鉴的分类方法。 展开更多
关键词 樱桃树提取 物候特征 分类方法对比 添加多特征
下载PDF
基于Landsat8影像喀斯特石漠化调查研究
3
作者 苏成杰 施宇军 范亚军 《河南科学》 2024年第4期522-528,共7页
喀斯特石漠化是一种常见的土地退化基岩裸露的现象,主要分布在我国西南喀斯特地区,具有分布范围广且有进一步恶化的趋势.利用Landsat8影像,基于决策树分类方法提取凤山县石漠化信息.以NDVI值、植被覆盖度和凤山县坡度分析为分类条件,运... 喀斯特石漠化是一种常见的土地退化基岩裸露的现象,主要分布在我国西南喀斯特地区,具有分布范围广且有进一步恶化的趋势.利用Landsat8影像,基于决策树分类方法提取凤山县石漠化信息.以NDVI值、植被覆盖度和凤山县坡度分析为分类条件,运用决策树提取凤山县石漠化信息,利用GoogleEarth对最初的分类结果存在错分和漏分的情况纠正,最后得到2021年凤山县不同等级石漠化面积及空间分布情况.结果表明:2021年凤山县石漠化面积约为197.3071 km^(2),占全县土地面积的11.32%,总体分类精度为87.4%,Kappa系数为0.8651.从精度评定结果可知,该方法提取石漠化信息精度可靠,同时也提出了凤山县具有石漠化较为严重的现象. 展开更多
关键词 石漠化 Landsat8 决策树分类法 凤山县
下载PDF
基于P-trees kNN算法的毒物分类方法
4
作者 曾志浩 胡积平 《软件》 2012年第4期105-107,111,共4页
中毒是一种发生机率较大、对人体危害大的病症,而及时明确诊断,正确、规范的治疗既是抢救成功的关键,又是至今没有很好解决的难题。毒物层出不穷,基层急救医生的毒物知识和中毒抢救知识又明显不足,因此临床急需一种辅助系统以帮助各级... 中毒是一种发生机率较大、对人体危害大的病症,而及时明确诊断,正确、规范的治疗既是抢救成功的关键,又是至今没有很好解决的难题。毒物层出不穷,基层急救医生的毒物知识和中毒抢救知识又明显不足,因此临床急需一种辅助系统以帮助各级急救医生提高中毒诊治水平及中毒抢救成功率。利用不同中毒表现对应不同毒物的权值向量构成"中毒表现加权向量表",并将它作为训练数据集的属性值。构建中毒表现加权向量表的P树,并选择HOBBit距离作为距离度量标准,运用P-trees kNN分类算法进行毒物分类。将该方法应用到毒物分类系统中,运行效果良好。 展开更多
关键词 K近邻算法 中毒分析系统 中毒表现加权向量表 P-树
下载PDF
基于决策树算法的测绘遥感图像信息分类方法研究
5
作者 田昕 《长江信息通信》 2024年第1期13-16,共4页
当前的测绘遥感图像信息分类节点的布设形式一般为独立的,分类识别范围较小,导致遥感图像信息漏分误差增加,为此提出了一种基于决策树算法的测绘遥感图像信息分类方法。根据当前的信息分类需求及标准,进行遥感图像信息预处理,采用多目... 当前的测绘遥感图像信息分类节点的布设形式一般为独立的,分类识别范围较小,导致遥感图像信息漏分误差增加,为此提出了一种基于决策树算法的测绘遥感图像信息分类方法。根据当前的信息分类需求及标准,进行遥感图像信息预处理,采用多目标的形式,以此来扩大分类识别范围,部署多目标分类识别的节点,建立测绘遥感图像信息分类矩阵,以此为基础,构建决策树测算遥感图像信息分类模型,采用多元修正处理实现信息分类。测试结果表明:对比于测试组,该文方法的遥感图像信息漏分误差比被较好地控制在2.5以下,说明在决策树的辅助与支持下,当前对于遥感图形信息的分类效率更高,误差可控,将其应用到遥感图像自动分类中,具有很好的弹性和鲁棒性,且分类结构简单明了,达到了更好的分类效果,定义了一种特殊的数据结构,实现了该分类系统。实践表明,该系统具有很好的稳定性和交互性,实用性较强。 展开更多
关键词 决策树算法 测绘遥感 遥感图像 信息分类方法 遥感识别
下载PDF
基于多维不完全分类树的教学资源推荐方法 被引量:1
6
作者 李松 袁登科 +1 位作者 张丽平 田新雨 《廊坊师范学院学报(自然科学版)》 2023年第4期39-42,65,共5页
针对教学资源的海量性、动态性和不完全性等特点,为提升教学效果,对基于不完全分类树的教学资源推荐方法和系统进行了研究与设计。针对教学资源的动态变化性和维度数据信息的缺失性,提出了不完全带权分类树和分类方法。为了提升传统推... 针对教学资源的海量性、动态性和不完全性等特点,为提升教学效果,对基于不完全分类树的教学资源推荐方法和系统进行了研究与设计。针对教学资源的动态变化性和维度数据信息的缺失性,提出了不完全带权分类树和分类方法。为了提升传统推荐系统中所用的协同过滤算法在相似度计算和近邻查询方面的效率,对密度峰聚类方法进行了优化,进一步将分类方法和优化的密度峰聚类方法用到推荐方法中。基于所提分类树的分类方法和优化的推荐方法,分析和设计了教学资源推荐系统,提升了教学资源的推荐效率和准确率。 展开更多
关键词 分类树 推荐系统 教学资源 聚类方法
下载PDF
基于Web网页的DOM树链接预分类、信息抽取方法研究
7
作者 罗莎 《长江信息通信》 2023年第11期133-135,共3页
为满足Web网页的数据记录、自动抽取需求,提出依托DOM树特征的网页信息链接预分类、领域本体的Web信息抽取方法,根据HTML、XML网页文档结构设置DOM对象节点树,标记网页页码导航节点、前导符节点、数据特征节点,用DOM根节点到目标节点的... 为满足Web网页的数据记录、自动抽取需求,提出依托DOM树特征的网页信息链接预分类、领域本体的Web信息抽取方法,根据HTML、XML网页文档结构设置DOM对象节点树,标记网页页码导航节点、前导符节点、数据特征节点,用DOM根节点到目标节点的标签序列计算树路径,根据各网页链接的XPATH树路径进行分组,DOM树特征预分类模块完成站点信息链接预分类,采用SVM分类器、支持向量机SVM算法,将网页的数据记录样本作出数据信息抽取、属性特征提取计算,从而抽取出满足用户需求的数据文本、数据记录信息。 展开更多
关键词 WEB网页 DOM树特征 信息链接预分类 信息抽取方法
下载PDF
基于CART-熵权法的管道腐蚀状态评估及其应用 被引量:1
8
作者 闻亚星 吕坦 +3 位作者 国滨 王锋 陈金忠 马义来 《腐蚀与防护》 CAS CSCD 北大核心 2023年第9期16-21,100,共7页
管道腐蚀状态评估是管道完整性管理的重要部分,为了评估管道腐蚀状态,根据长输管道腐蚀特点,采用两轮内检测数据计算管道的局部腐蚀速率。以局部腐蚀速率为依据,采用分类与回归树(CART)将管道划分为若干单元,利用熵权法建立腐蚀状态评... 管道腐蚀状态评估是管道完整性管理的重要部分,为了评估管道腐蚀状态,根据长输管道腐蚀特点,采用两轮内检测数据计算管道的局部腐蚀速率。以局部腐蚀速率为依据,采用分类与回归树(CART)将管道划分为若干单元,利用熵权法建立腐蚀状态评估模型,并结合工程实例分析了管道腐蚀状态的相对等级。结果表明:平均预估维修比(ERF)对该管道腐蚀状态的影响最大,该模型确定了腐蚀最严重的管段为44、38、45、37单元,便于业主对这些管段进行重点监测和维修;基于CART-熵权法的腐蚀状态评估模型能够很好地用于管道腐蚀状态评估工作,为业主制定检维修策略提供科学合理的依据。 展开更多
关键词 分类与回归树(CART) 熵权法 管道单元划分 腐蚀状态评估
下载PDF
基于随机森林模型的不平衡大数据分类算法 被引量:1
9
作者 魏亚明 孟媛 《吉林大学学报(信息科学版)》 CAS 2023年第6期1079-1085,共7页
针对目前不平衡大数据分类算法分类效果较差的问题,提出基于随机森林模型的不平衡大数据分类算法。首先采用SVM(Support Vector Machine)支持向量机算法对不平衡大数据进行信息过滤,然后利用反k近邻法检测并消除离群点,通过增量主成分... 针对目前不平衡大数据分类算法分类效果较差的问题,提出基于随机森林模型的不平衡大数据分类算法。首先采用SVM(Support Vector Machine)支持向量机算法对不平衡大数据进行信息过滤,然后利用反k近邻法检测并消除离群点,通过增量主成分分析法去掉不平衡大数据中协方差矩阵存在的奇异性,并依据熵值法对其展开权重解析,进而提取不平衡大数据特征信息。将CART(Classification and Regression Trees)决策树当作不平衡大数据的基分类器,进而构建随机森林决策树分类器,最后将提取的不平衡大数据特征信息输入分类器中,实现不平衡大数据分类。实验结果表明,该算法对不平衡大数据的采样效果较好,并且分类精准度、稳定性和性能都较高。 展开更多
关键词 随机森林模型 不平衡大数据分类 SVM支持向量机 反k近邻法 CART决策树
下载PDF
基于分类回归树方法的遥感信息快速提取研究 被引量:2
10
作者 高剑 孙辉 +1 位作者 潘之腾 李建梅 《现代电子技术》 2023年第11期33-37,共5页
遥感信息具有一定的连续变化性,这将会在一定程度上使得遥感信息快速提取存在偏差,其提取的时间也随之增加,容错率下降,为此文中提出基于分类回归树的遥感信息快速提取方法。通过噪声调整的主成分分析法(NAPCA)提取遥感信息的特征,利用... 遥感信息具有一定的连续变化性,这将会在一定程度上使得遥感信息快速提取存在偏差,其提取的时间也随之增加,容错率下降,为此文中提出基于分类回归树的遥感信息快速提取方法。通过噪声调整的主成分分析法(NAPCA)提取遥感信息的特征,利用复小波变换法对图像进行去噪处理,同时结合邻域值函数完成小波系数收缩。通过分类回归树方法进行样本训练,连续不间断获取遥感信息,结合Bayes判别准则完成遥感信息快速提取。实验结果表明,所提方法能够有效提升容错率,降低遥感信息快速提取偏差和时间。 展开更多
关键词 遥感信息提取 分类回归树方法 图像去噪 小波系数收缩 偏差降低 实验测试 城市绿化
下载PDF
基于机器视觉的轴承表面微小缺陷检测技术 被引量:1
11
作者 唐艺明 《佳木斯大学学报(自然科学版)》 CAS 2023年第4期102-105,共4页
轴承表面缺陷检测要求准确率较高,因此研究基于机器视觉的轴承表面微小缺陷检测技术。使用CMOS工业相机采集轴承表面图像,利用线性拉伸法与中值滤波方法预处理轴承表面图形,提升图像的亮度并消除干扰信息,使用八连通区域标记法标记处理... 轴承表面缺陷检测要求准确率较高,因此研究基于机器视觉的轴承表面微小缺陷检测技术。使用CMOS工业相机采集轴承表面图像,利用线性拉伸法与中值滤波方法预处理轴承表面图形,提升图像的亮度并消除干扰信息,使用八连通区域标记法标记处理后的轴承表面图像,获得连通区域数量,使用该数量计算得出缺陷特征的面积、长宽比、周长等几何特征,将这些特征作为剪枝分类决策树的输入,经过训练后,输出轴承表面微小缺陷分类结果,实现轴承表面微小缺陷检测。试验结果显示,该方法预处理后,图像质量较高,能够检测出轴承表面多种微小缺陷,并且检测结果准确率较高。 展开更多
关键词 机器视觉 轴承表面 微小缺陷 线性拉伸法 特征提取 剪枝分类决策树
下载PDF
基于分类回归树的企业会计信息失真识别方法
12
作者 郑朝亮 《信息与电脑》 2023年第12期99-104,共6页
常规的企业会计信息失真识别方法主要使用svmtrain惩罚参数进行识别交叉验证,易受核函数参数影响,导致平均识别错误率较高,因此急需基于分类回归树设计一种全新的企业会计信息失真识别方法。文章通过定量分析法选取了会计信息失真识别变... 常规的企业会计信息失真识别方法主要使用svmtrain惩罚参数进行识别交叉验证,易受核函数参数影响,导致平均识别错误率较高,因此急需基于分类回归树设计一种全新的企业会计信息失真识别方法。文章通过定量分析法选取了会计信息失真识别变量,利用分类回归树构建企业会计信息失真识别模型,设计企业会计信息失真识别算法,从而实现了企业会计信息失真识别。实验结果表明,设计的基于分类回归树的企业会计信息失真识别方法在不同会计失真识别变量下的平均识别错误率均较低,证明设计的企业会计信息失真分类回归树识别方法的识别效果较好,具有较高的准确性,有一定的应用价值。 展开更多
关键词 分类回归树 企业 会计信息失真 识别方法
下载PDF
1993-2010年洞庭湖湿地动态变化 被引量:30
13
作者 邓帆 王学雷 +4 位作者 厉恩华 蔡晓斌 黄进良 胡砚霞 姜刘志 《湖泊科学》 CAS CSCD 北大核心 2012年第4期571-576,共6页
利用不同时相遥感影像,结合实地调查,采用决策树分类方法提取洞庭湖湿地信息,完成洞庭湖四期湿地类型分布图;同时分析洞庭湖湿地植被群落动态变化特征、驱动因素以及湿地变化的影响.结果表明,17 a来洞庭湖滩地植被分布和面积发生了明显... 利用不同时相遥感影像,结合实地调查,采用决策树分类方法提取洞庭湖湿地信息,完成洞庭湖四期湿地类型分布图;同时分析洞庭湖湿地植被群落动态变化特征、驱动因素以及湿地变化的影响.结果表明,17 a来洞庭湖滩地植被分布和面积发生了明显变化,林滩地面积净增367.88 km2,变化比例为1127.51%,分布范围向洲滩主体扩展,成为主要滩地类型;芦苇滩地面积减少44.09 km2,草滩地面积增加2.99 km2,变化比例分别为-5.80%和0.40%.洞庭湖湿地的变化一方面受洞庭湖泥沙淤积和滩地植被演替的影响,另一方面也受到人类活动干扰的影响.天然湿地植被的破坏,特别是人工种植芦苇和滩地造林在一定程度上改变了洞庭湖湿地生态系统原有的结构和功能.为有效保护洞庭湖湿地,要合理开发洲滩资源,保护天然湿地植被,合理规划和控制滩地造林. 展开更多
关键词 遥感 湿地变化 驱动因素 洞庭湖 决策树分类方法
下载PDF
基于高分辨率遥感影像的城市典型乔木树种分类研究 被引量:22
14
作者 李丹 柯樱海 +2 位作者 宫辉力 李小娟 邓曾 《地理与地理信息科学》 CSCD 北大核心 2016年第1期84-89,F0003,共7页
为探索高分辨率遥感影像对城市复杂环境优势乔木树种分类的有效性,采用面向对象分类方法,基于WorldView-2影像对首都师范大学及周边地区(CNU)、北京师范大学及周边地区(BNU)两个研究区进行优势乔木树种(泡桐、法国梧桐、杨树、国槐、银... 为探索高分辨率遥感影像对城市复杂环境优势乔木树种分类的有效性,采用面向对象分类方法,基于WorldView-2影像对首都师范大学及周边地区(CNU)、北京师范大学及周边地区(BNU)两个研究区进行优势乔木树种(泡桐、法国梧桐、杨树、国槐、银杏)分类。首先对WorldView-2影像进行分割,获得树冠区域及其49个属性特征,包括31个光谱属性和18个纹理属性;随后利用随机森林RF与支持向量机SVM两种分类算法对树冠区域进行分类。CNU研究区SVM与RF总体分类精度分别为86.5%、75.8%,Kappa系数为0.801、0.648;BNU研究区SVM与RF总体分类精度分别为66.9%、65.3%,Kappa系数为0.541、0.520。实验表明WorldView-2影像能有效实现城市非阴影区域优势乔木树种分类,但异质性较高、树种分布分散的区域分类精度低于异质性较小、树种分布密集的区域;WorldView-2影像的4个新增波段尤其是红边波段的派生属性在分类过程中所占权重值较高。 展开更多
关键词 WorldView-2影像 面向对象 树种分类 随机森林 支持向量机
下载PDF
基于CART决策树与最大似然比法的植被分类方法研究 被引量:28
15
作者 张晓娟 杨英健 +2 位作者 盖利亚 李亮 王宇 《遥感信息》 CSCD 2010年第2期88-92,共5页
结合阿坝若尔盖县大骨节病典型病区植被分布特点,选用不同时相SPOT4及ETM遥感数据,提出了将较易实现的CART决策树算法与最大似然比分类法有机结合在一起进行植被分类的方法。决策树算法能很好地区分植被大类,分类精度达到96%,但是无法... 结合阿坝若尔盖县大骨节病典型病区植被分布特点,选用不同时相SPOT4及ETM遥感数据,提出了将较易实现的CART决策树算法与最大似然比分类法有机结合在一起进行植被分类的方法。决策树算法能很好地区分植被大类,分类精度达到96%,但是无法确定区分乔木亚类的阈值;最大似然比法整体分类精度不高,仅为84%,但是针对乔木亚类的分类精度能达到94%,将两种算法综合利用,最终总分类精度达到95.05%,Kappa系数达到0.9016。良好的分类结果不但为研究该区植被覆盖状况与发病率关系提供了很好的一手资料,并且分类算法较易实现,尤其对于新入门者较为实用和快捷。 展开更多
关键词 植被分类 决策树算法 最大似然比法
下载PDF
基于多特征的个性化图书推荐算法 被引量:26
16
作者 李克潮 梁正友 《计算机工程》 CAS CSCD 2012年第11期34-37,共4页
现有推荐算法计算读者之间或图书之间的相似性不准确、推荐精确度不高。为此,提出一种基于多特征的个性化图书推荐算法。根据中图分类法及图书的特征向量计算图书的相似性,依据读者的特征向量及借阅记录计算读者的相似性。在此基础上产... 现有推荐算法计算读者之间或图书之间的相似性不准确、推荐精确度不高。为此,提出一种基于多特征的个性化图书推荐算法。根据中图分类法及图书的特征向量计算图书的相似性,依据读者的特征向量及借阅记录计算读者的相似性。在此基础上产生2种预测结果并对其进行加权,产生最终推荐。实验结果表明,该算法具有较高的图书推荐精确度。 展开更多
关键词 中图分类法 图书特征向量 读者特征向量 相似性 推荐算法 中图分类树 专业分类树
下载PDF
一种基于分类-回归决策树的烤烟产区识别模型 被引量:3
17
作者 张毅 李强 +2 位作者 王政 张一扬 周冀衡 《中国烟草学报》 EI CAS CSCD 北大核心 2014年第6期28-33,共6页
为建立不同产区及风格烤烟烟叶与化学指标之间的关系,对2005~2009年湖南省、河南省、福建省和云南省等4省份共计1040份烟叶样品的21种化学成分进行检测,并利用Mining Tree模型进行分类-回归决策树(C&RT analysis)数据分析。结果表明... 为建立不同产区及风格烤烟烟叶与化学指标之间的关系,对2005~2009年湖南省、河南省、福建省和云南省等4省份共计1040份烟叶样品的21种化学成分进行检测,并利用Mining Tree模型进行分类-回归决策树(C&RT analysis)数据分析。结果表明:(1)从21个烟叶化学成分中,共筛选出14个特征化学指标,其中钾和硝酸根为4省烟叶共有特征化学指标;(2)湖南、河南、福建和云南4省份识别概率最高的特征化学指标分段组合(Segment)分别为:还原糖(≤24.93%)、钾(〉1.98%)、p H值(≤5.37)(p=0.658);钾(≤1.98%)、灰分(〉11.03%)、水溶性灰份碱度(≤0.49)、硝酸根(≤0.06%)(p=0.776);还原糖(〉24.93%)、钾(〉1.98%)、硝酸根(≤0.06%)、蛋白质(〉5.01%)(p=0.914);钾(≤1.98%)、灰分(≤11.03%)、水溶性总糖(〉28.94%)、硫酸根(≤1.43%)(p=0.957)。分类-回归决策树方法在建立烤烟化学成分识别模型中具有重要的应用价值。 展开更多
关键词 烤烟 产区 化学指标 识别 分类-回归决策树分析 MINING tree模型
下载PDF
一年一季农作物遥感分类的时效性分析 被引量:7
18
作者 刘焕军 于胜男 +2 位作者 张新乐 郭栋 殷继先 《中国农业科学》 CAS CSCD 北大核心 2017年第5期830-839,共10页
【目的】基于遥感影像的作物分类研究是提取作物种植面积和长势分析及产量估测的基础,也是推动现代化农业快速发展的动力。研究结果可为农业等相关部门掌握农情,进行宏观调控提供依据。目前,农业遥感研究主要集中于中低分辨率遥感影像,... 【目的】基于遥感影像的作物分类研究是提取作物种植面积和长势分析及产量估测的基础,也是推动现代化农业快速发展的动力。研究结果可为农业等相关部门掌握农情,进行宏观调控提供依据。目前,农业遥感研究主要集中于中低分辨率遥感影像,影响植被信息提取的精度,应用高分辨率多时相遥感影像和选择最优分类方法可以提高植被信息提取精度。明确农作物遥感分类的时效性与最优分类方法,为快速、准确地获取作物空间分布数据和农情定量遥感监测提供依据。【方法】基于黑龙江省虎林市2014年5—10月覆盖完整生长期的20幅遥感影像,构建16 m分辨率NDVI时间序列曲线,建立决策树分类模型,通过分类影像进行系列阈值分割,并结合辅助背景数据及专家知识,成功提取虎林市土地利用覆被信息;利用20幅影像依次波段合成的方式进行作物分类,明确最优时相;将提取的耕地范围作为作物分类规则,并与未提取耕地范围的作物分类结果进行比较;同时通过最大似然法、马氏距离法、神经网络法、最小距离法、支持向量机、波谱角分类法、主成分分析法多种分类方法进行作物分类;利用农业保险投保地块数据进行精度验证。【结果】(1)7月初、7月末到8月初、9月末是研究区一年一季作物遥感分类的3个关键时相;(2)决策树分类方法在提取土地利用覆被信息的结果中精度最高,总体精度90.24%,Kappa系数0.87;(3)6月初与7月初2幅影像结合采用最大似然法对作物进行分类的总体精度高达94.01%,Kappa系数为0.79,6月初与7月初的影像结合,可以解决作物分类的时效性;(4)结合9月21日的影像,总体精度进一步提高,大豆分类精度明显提高,最终确定最大似然法为最优作物分类方法。【结论】通过遥感数据能实现在7月上旬对作物进行精准分类,拓展了遥感数据在农业领域的应用价值,对一年一季地区作物快速分类与农情定量遥感监测有重要意义。 展开更多
关键词 时间序列遥感影像 作物分类 时效性 决策树 最大似然法
下载PDF
用于分类的随机森林和Bagging分类树比较 被引量:17
19
作者 马景义 谢邦昌 《统计与信息论坛》 CSSCI 2010年第10期18-22,共5页
借助试验数据,从两种理论分析角度解释随机森林算法优于Bagging分类树算法的原因。将两种算法表述在两种不同的框架下,消除了这两种算法分析中的一些模糊之处。尤其在第二种分析框架下,更能清楚的看出,之所以随机森林算法优于Bagging分... 借助试验数据,从两种理论分析角度解释随机森林算法优于Bagging分类树算法的原因。将两种算法表述在两种不同的框架下,消除了这两种算法分析中的一些模糊之处。尤其在第二种分析框架下,更能清楚的看出,之所以随机森林算法优于Bagging分类树算法,是因为随机森林算法对应更小的偏差。 展开更多
关键词 组合方法 随机森林 Bagging分类树
下载PDF
基于Lasso和Xgboost的油价预测研究 被引量:12
20
作者 施国良 景志刚 范丽伟 《工业技术经济》 CSSCI 北大核心 2018年第7期31-37,共7页
鉴于国际原油价格波动的频繁性和对国民经济的重要性,油价的预测和油价的影响因素研究一直是国内外的研究热点。为了提高油价预测的准确性,本文在总结前人提出的油价影响因素的基础上,运用Lasso方法筛选出美国原油生产成本、WTI原油期... 鉴于国际原油价格波动的频繁性和对国民经济的重要性,油价的预测和油价的影响因素研究一直是国内外的研究热点。为了提高油价预测的准确性,本文在总结前人提出的油价影响因素的基础上,运用Lasso方法筛选出美国原油生产成本、WTI原油期货价格、中国原油产量等11个主要影响因素,之后使用Xgboost方法对油价进行预测。数值试验结果表明,相比较其它预测方法,本文构建的Lasso-Xgboost组合方法预测精度更高,泛化能力更强。最后本文应用已有模型对2018~2019年WTI原油价格进行趋势预测。 展开更多
关键词 Lasso方法 Xgboost方法 Lasso-Xgboost方法 WTI现货价格预测 模型误差 分类与回归树
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部