-
题名基于回归算法与决策树思想的秦艽产地划分
被引量:1
- 1
-
-
作者
杨友
包彩银
丁跃武
李四海
-
机构
甘肃中医药大学信息工程学院
-
出处
《亚太传统医药》
2023年第2期41-45,共5页
-
基金
甘肃省科技计划(21JR1RA272)。
-
文摘
目的:药材产地对药材品质优劣影响很大,不同产地秦艽品质差异较大,使用秦艽样本近红外光谱数据构建模型,实现秦艽样本产地划分。方法:将多元线性回归算法(MLR)、偏最小二乘回归算法(PLS)、支持向量回归算法(SVR)和岭回归算法(RR)与决策树思想相结合对样本进行分类。结果:秦艽数据集包含207个样本,其中107个样本来自甘肃玛曲县,100个秦艽样本来自甘肃临洮县,模型的误判率在0.3%左右。结论:将回归算法与决策树思想相结合的方法可以提高模型的性能,使得算法既拥有回归算法强大的拟合能力,又拥有决策树的分类能力。在秦艽样本数据上得到了很好的分类效果。
-
关键词
秦艽
产地
多元线性回归
偏最小二乘回归
支持向量机回归
岭回归
决策树近红外光谱
-
Keywords
Gentiana Macrophylla
Origin
Multiple Linear Regression
Partial Least Squares Regression
Support Vector Regression
Ridge Regression
Decision Tree
Near Infrared Spectroscopy
-
分类号
R282
[医药卫生—中药学]
-
-
题名小麦近红外光谱数据预处理
- 2
-
-
作者
杨友
丁跃武
包彩银
李四海
-
机构
甘肃中医药大学信息工程学院
-
出处
《科学与信息化》
2022年第24期45-47,共3页
-
基金
甘肃省科技计划项目,项目名称:近红外光谱的正则化特征选择算法研究,项目编号:21JR1RA272。
-
文摘
本文目的是针对光谱数据可能存在的基线漂移、散射、噪声以及数据量纲等问题,可使用数学方法对光谱数据进行校正。方法是在Wheat kernels数据集上,使用导数法和SNV对数据进行预处理,对比预处理前后数据集上构建模型的效果。得出的结论是使用多元线性回归、偏最小二乘回归、岭回归、支持向量回归方法在预处理后的数据集上构建的模型效果明显比原始数据集上构建的模型效果好。
-
关键词
数据预处理
小麦光谱数据
基线漂移
去噪
导数法
标准正态变量变换
-
Keywords
data preprocessing
wheat spectral data
baseline drift
denoising
derivative method
standard normal variable transformation
-
分类号
TP3
[自动化与计算机技术—计算机科学与技术]
-