文摘牛奶中的蛋白质含量会影响牛奶的品质,利用高光谱图像的光谱特征信息研究对牛奶蛋白质含量预测的可行性。本文提出一种基于竞争性自适应重加权算法(competitive adaptive reweighted sampling, CARS)和连续投影算法(successive projections algorithm, SPA)结合多层前馈神经网络(back propagation, BP)的预测建模方法,实验以含有不同浓度蛋白质的牛奶为对象,利用可见光/近红外高光谱成像系统共采集到5种牛奶共计250组高光谱数据,通过实验对比选择采用标准化方法对获取到的吸收光谱预处理,然后采用CARS结合SPA筛选特征波长,得到18个特征波长,建立CARS-SPA-BP模型,经过试验,CARS-SPA-BP模型的训练集决定系数和测试集决定系数R;和R;分别达到0.971和0.968,训练集均方根误差(root mean square error of calibration,RMSEC)和测试集均方根误差(root mean square error of prediction,RMSEP)达到了0.033和0.034。研究发现,采用CARS结合SPA筛选的牛奶特征波长建立的多层前馈神经网络模型,其模型预测结果与全波长建模相比并没有明显降低,因此将CARS结合SPA用于波长筛选并且结合BP神经网络基本可以完成对牛奶蛋白质含量的预测。为验证CARS-SPA-BP模型的预测能力,在相同数据环境下,使用较为传统的偏最小二乘回归(partial least squares regression, PLSR)进行建模,实验结果表明,CARS-SPA-BP相较于PLSR,R;和RMSEP均有明显提升。研究表明,CARS-SPA-BP可充分利用牛奶光谱特征信息实现较高精度的牛奶蛋白质含量检测。