期刊导航
期刊开放获取
河南省图书馆
退出
期刊文献
+
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
任意字段
题名或关键词
题名
关键词
文摘
作者
第一作者
机构
刊名
分类号
参考文献
作者简介
基金资助
栏目信息
检索
高级检索
期刊导航
共找到
1
篇文章
<
1
>
每页显示
20
50
100
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
显示方式:
文摘
详细
列表
相关度排序
被引量排序
时效性排序
基于随机森林特征重要性和区间偏最小二乘法的近红外光谱波长筛选方法
被引量:
2
1
作者
陈蕊
王雪
+4 位作者
王子文
曲浩
马铁民
陈争光
高睿
《光谱学与光谱分析》
SCIE
EI
CAS
CSCD
北大核心
2023年第4期1043-1050,共8页
为建立快速近红外光谱定量分析模型,特征波长筛选是提高定量分析预测精度较为有效的方法之一。它能够筛选出有效波长信息,减少数据冗余、提高数据有效性。随机森林(RF)作为一种集成算法,可根据计算特征重要性进行特征筛选。RF将基于袋...
为建立快速近红外光谱定量分析模型,特征波长筛选是提高定量分析预测精度较为有效的方法之一。它能够筛选出有效波长信息,减少数据冗余、提高数据有效性。随机森林(RF)作为一种集成算法,可根据计算特征重要性进行特征筛选。RF将基于袋外数据(OOB)的平均精度下降(MDA)方法计算均方误差平均值作为特征重要性结果,通过设置特征重要性阈值筛选特征变量构成特征波长子集,但该阈值范围的设定无理论依据,因此需要对特征重要性阈值范围进行探究。另一方面,由于RF的随机特性,特征波长子集中可能包含无效甚至是干扰变量,并不能保证所选变量的有效性。故而进一步提出RF-iPLS波长筛选方法。区间偏最小二乘法(iPLS)筛选出的特征波长多为连续特征波段的特性,对特征波长子集划分区间,弥补RF因自身随机性造成的无效变量问题;同时,RF筛选的离散特征波长解决了iPLS筛选的连续波段中含冗余信息的问题。为了说明RF-iPLS算法的合理性,特征子集经过蒙特卡洛(MC)方法500次样本特征采样后,构建RF-MC-iPLS算法。虽然RF-iPLS与RF-MC-iPLS算法结构接近,但运行时间缩短了11.12%,结果说明RF-iPLS算法在预测模型中的特征波长筛选是有效的,且具有较低的时间复杂度。为了进一步验证改进的RF-iPLS算法的有效性,应用一组公开谷物蛋白质近红外光谱数据,建立PLSR模型,并与全谱的PLSR模型以及基于不同波长筛选方法的PLSR模型进行比较。实验结果表明,相比于全谱的117个波长,RF-iPLS优选出12个特征波长,建模集的RMSEC从2.61降到0.64,预测精度提升了约75.5%,预测集的RMSEP从2.63降到0.69,预测精度提升了73.8%,极大地提高了预测精度且预测结果最优,说明RF-iPLS是一种有效的特征波长筛选方法,可以简化近红外光谱定量分析模型的复杂度并实现高效降维。
展开更多
关键词
波长筛选
特征重要性计算
谷物蛋白质含量
定量分析
下载PDF
职称材料
题名
基于随机森林特征重要性和区间偏最小二乘法的近红外光谱波长筛选方法
被引量:
2
1
作者
陈蕊
王雪
王子文
曲浩
马铁民
陈争光
高睿
机构
黑龙江八一农垦大学信息与电气工程学院
农业农村部农产品及加工品质量监督检验测试中心(大庆)
东北农业大学电气与信息学院
出处
《光谱学与光谱分析》
SCIE
EI
CAS
CSCD
北大核心
2023年第4期1043-1050,共8页
基金
黑龙江省“百千万”工程科技重大专项(2019ZX14A0401)
中央支持地方高校改革发展资金项目(2020GSP15)
+2 种基金
黑龙江省博士后面上项目(LBH-Z19217)
黑龙江八一农垦大学三横三纵支持计划项目(ZRCQC201907)
黑龙江八一农垦大学学成人才科研启动基金项目(XDB202004)资助。
文摘
为建立快速近红外光谱定量分析模型,特征波长筛选是提高定量分析预测精度较为有效的方法之一。它能够筛选出有效波长信息,减少数据冗余、提高数据有效性。随机森林(RF)作为一种集成算法,可根据计算特征重要性进行特征筛选。RF将基于袋外数据(OOB)的平均精度下降(MDA)方法计算均方误差平均值作为特征重要性结果,通过设置特征重要性阈值筛选特征变量构成特征波长子集,但该阈值范围的设定无理论依据,因此需要对特征重要性阈值范围进行探究。另一方面,由于RF的随机特性,特征波长子集中可能包含无效甚至是干扰变量,并不能保证所选变量的有效性。故而进一步提出RF-iPLS波长筛选方法。区间偏最小二乘法(iPLS)筛选出的特征波长多为连续特征波段的特性,对特征波长子集划分区间,弥补RF因自身随机性造成的无效变量问题;同时,RF筛选的离散特征波长解决了iPLS筛选的连续波段中含冗余信息的问题。为了说明RF-iPLS算法的合理性,特征子集经过蒙特卡洛(MC)方法500次样本特征采样后,构建RF-MC-iPLS算法。虽然RF-iPLS与RF-MC-iPLS算法结构接近,但运行时间缩短了11.12%,结果说明RF-iPLS算法在预测模型中的特征波长筛选是有效的,且具有较低的时间复杂度。为了进一步验证改进的RF-iPLS算法的有效性,应用一组公开谷物蛋白质近红外光谱数据,建立PLSR模型,并与全谱的PLSR模型以及基于不同波长筛选方法的PLSR模型进行比较。实验结果表明,相比于全谱的117个波长,RF-iPLS优选出12个特征波长,建模集的RMSEC从2.61降到0.64,预测精度提升了约75.5%,预测集的RMSEP从2.63降到0.69,预测精度提升了73.8%,极大地提高了预测精度且预测结果最优,说明RF-iPLS是一种有效的特征波长筛选方法,可以简化近红外光谱定量分析模型的复杂度并实现高效降维。
关键词
波长筛选
特征重要性计算
谷物蛋白质含量
定量分析
Keywords
Wavelength selection
Feature importance calculation
Grain protein content
Quantitative analysis
分类号
O433.4 [机械工程—光学工程]
下载PDF
职称材料
题名
作者
出处
发文年
被引量
操作
1
基于随机森林特征重要性和区间偏最小二乘法的近红外光谱波长筛选方法
陈蕊
王雪
王子文
曲浩
马铁民
陈争光
高睿
《光谱学与光谱分析》
SCIE
EI
CAS
CSCD
北大核心
2023
2
下载PDF
职称材料
已选择
0
条
导出题录
引用分析
参考文献
引证文献
统计分析
检索结果
已选文献
上一页
1
下一页
到第
页
确定
用户登录
登录
IP登录
使用帮助
返回顶部