基于自然语言处理的山楂果实品种近红外无损鉴别方法被引量：1

Nondestructive Near-infrared Identification of Hawthorn Fruit Cultivars Based on Natural Language Processing

下载PDF

导出

摘要不同品种的山楂果实在营养组成、感官品质等方面存在差异,在工业生产中适用不同的加工方式。传统的检测方法耗时长、具有破坏性以及成本高,为适应规模化生产山楂果实制品的需要,需对山楂果实品种进行无损鉴别。研究共收集了4个品种240个山楂果实样本的近红外光谱数据,采用不同的预处理算法处理光谱数据后,使用自然语言处理(Natural Language Processing,NLP)模型进行分析,以实现山楂果实品种的无损鉴别。结果表明,长短期记忆网络(Long Short-Term Memory,LSTM)以及门控循环单元(Gated Recurrent Unit,GRU)神经网络模型对主成分分析法(Principal Component Analysis,PCA)预处理后的光谱的鉴别准确率高,验证集的准确率均为99.46%±0.00%,测试集的准确率均为100%±0.00%。逻辑回归模型对山楂果实光谱鉴别能力优异,除对二阶差分(Difference Of Second Order,D2)预处理的光谱鉴别能力较差外(验证集准确率96.65%,测试集准确率89.58%),其他预处理方式验证集、测试集的准确率均达到或极接近100%。朴素贝叶斯模型对经PCA处理后的光谱的鉴别效果较优,验证集准确率为95.65%,测试集准确率为95.83%。本研究证实了NLP运用于山楂果实近红外无损鉴别是可行的。 Hawthorn fruits of different varieties have varied nutritional composition,sensory properties etc.,thus required for different processing for product development.Due to the limitations of traditional analytical methods of time-consuming,destructive sample preparation,and high cost ect.,non-destructive techniques for variety identification are needed which would benefit for large scale production of foods with hawthorn fruits.In this study,a total of 240 hawthorn fruit samples from four different varieties were subjected for near-infrared spectroscopy analysis and the collected spectral data were pre-processed by different algorithms.In order to achieve non-destructive identification of hawthorn varieties,natural language processing(NLP)model was applied for data analysis,including long short-term memory(LSTM),gated recurrent unit(GRU)neural network,logistic regression,native Bayes,decision trees,and k-nearest neighbors.The results showed that the two deep learning models both had the best discrimination effect on the spectral preprocessed by principal component analysis(PCA)with the accuracy of the validation set and test set reached 99.46%±0.00%and 100%±0.00%.While,the logistic regression model showed excellent discrimination ability for hawthorn fruit spectra but poor discrimination ability for the difference of second order(D2)pretreatment spectra(accuracy of 96.65%in the validation set and 89.58%in the test set).The naive Bayes model also showed excellent discrimination effect on the spectra processed by PCA,and the accuracy of the validation set was 95.65%,and the accuracy of the test set was 95.83%.Results gained in this study confirmed the feasibility of applying NLP to the near-infrared non-destructive identification of hawthorn fruits.

作者邓志扬廖强邵淑娟刘军 DENG Zhiyang;LIAO Qiang;SHAO Shujuan;LIU Jun(College of Food Science and Nutritional Engineering,China Agricultural University,Beijing 100083,China;Heze City of Food and Drug Inspection and Testing Institute,Heze 274000,China)

机构地区中国农业大学食品科学与营养工程学院菏泽市食品药品检验检测研究院

出处《食品工业科技》 CAS 北大核心 2023年第22期249-256,共8页 Science and Technology of Food Industry

关键词自然语言处理机器学习山楂果实近红外无损检测 natural language processing machine learning hawthorn fruit near infrared spectroscopy nondestructive identification

分类号 TS207.3 [轻工技术与工程—食品科学]

引文网络
相关文献

参考文献17

1李丽,袁建琴,王文斌.山楂果肉中多酚闪式提取工艺的研究[J].中国酿造,2020,39(5):179-182. 被引量：6
2李长滨,牛畅炜,苏丽,吴圣江,孙宪秋.不同产地山药的近红外鉴别和差异分析[J].食品研究与开发,2022,43(15):175-181. 被引量：8
3杨海龙,臧恒昌,胡甜,聂磊,曾英姿.近红外漫反射光谱法对不同产地山楂的定性鉴别和定量分析[J].药物分析杂志,2014,34(3):396-401. 被引量：24
4张静,徐阳,姜彦武,郑成宇,周军,韩长杰.近红外光谱技术在葡萄及其制品品质检测中的应用研究进展[J].光谱学与光谱分析,2021,41(12):3653-3659. 被引量：11
5高荣强,范世福,等.现代近红外光谱分析技术的原理及应用[J].分析仪器,2002(3):9-12. 被引量：151
6安鹏,曹丹平,赵宝银,杨晓利,张明.基于LSTM循环神经网络的储层物性参数预测方法研究[J].地球物理学进展,2019,34(5):1849-1858. 被引量：61
7陈勇,吴彩娥,熊智新.基于衰减消去蜻蜓算法的小麦粉蛋白质近红外特征波长优选[J].食品科学,2022,43(14):219-225. 被引量：6
8李超凡,马凯.基于注意力机制结合CNN-BiLSTM模型的电子病历文本分类[J].科学技术与工程,2022,22(6):2363-2370. 被引量：20
9王鹏新,王婕,田惠仁,张树誉,刘峻明,李红梅.基于遥感多参数和门控循环单元网络的冬小麦单产估测[J].农业机械学报,2022,53(9):207-216. 被引量：7
10覃礼堂,刘树深,肖乾芬,吴庆生.QSAR模型内部和外部验证方法综述[J].环境化学,2013,32(7):1205-1211. 被引量：46

二级参考文献196

1王天添,刘悦,赵远,王艳双,李明成,孙丽媛.鉴定动物奶源的多重RCR方法建立及应用[J].中国农业大学学报,2020(11):74-81. 被引量：4
2李海军,王钲旋,王利民,苑森淼.基于主成分分析提升朴素贝叶斯[J].仪器仪表学报,2004,25(z3):384-386. 被引量：7
3Anna Palou,Jordi Cruz,Marcelo Blanco,Jaume Tomàs,Joaquín de los Ríos,Manel Alcalà.Determination of drug,excipients and coating distribution in pharmaceutical tablets using NIR-CI[J].Journal of Pharmaceutical Analysis,2012,2(2):90-97. 被引量：4
4刘家兰,徐晓玉.山楂的药理作用研究进展[J].中草药,2009,40(S1):63-66. 被引量：75
5吴炳方,张峰,刘成林,张磊,罗治敏.农作物长势综合遥感监测方法[J].遥感学报,2004,8(6):498-514. 被引量：125
6郑咏梅,王芳荣,张军,陈星旦,申铉国.近红外光谱定量分析小麦粉蛋白质含量[J].吉林大学学报（信息科学版）,2002,20(3):4-7. 被引量：6
7高光跃,冯毓秀.德国产山楂与国产山楂的鉴别和质量比较[J].中国药学杂志,1995,30(10):589-592. 被引量：3
8张俐伟,付玉梅,廖群,徐国良.不同产地山楂指纹图谱的比较研究[J].江西中医学院学报,2005,17(6):49-50. 被引量：6
9孙威,王鹏新,韩丽娟,颜凯,张树誉,李星敏.条件植被温度指数干旱监测方法的完善[J].农业工程学报,2006,22(2):22-26. 被引量：65
10李化,杨滨.RP-HPLC法测定山楂中黄酮类成分的含量[J].药物分析杂志,2006,26(7):881-884. 被引量：13

共引文献418

1张跃胜,金文俊.ChatGPT的关键技术、应用场景及未来展望[J].信息技术与管理应用,2023(5):64-74. 被引量：1
2刘云玲,张天雨,姜明,李勃,宋坚利.基于机器视觉的葡萄品质无损检测方法研究进展[J].农业机械学报,2022,53(S01):299-308. 被引量：7
3张霞,杨勇,赵力.基于复数帧段特征的语音情感识别方法[J].电子器件,2022,45(2):479-482.
4丁志江,李丹,马志程,张宝龙.基于Transformer的车道线分割算法研究[J].电子测量与仪器学报,2022,36(10):227-234. 被引量：4
5郭小萍,钟道金,李元.基于AMSDAE-BLSTM的工业过程质量预测[J].电子测量技术,2023,46(4):19-24.
6梁亮,刘志霄,杨敏华,汪承华,丁宇晶,易浪波.近红外光谱技术在生物学研究中的应用[J].生命科学研究,2007,11(S1):25-28. 被引量：4
7李亮,丁武.近红外光谱技术在牛奶及其制品分析中的应用进展[J].中国奶牛,2009(3):46-48. 被引量：7
8刘欢,韩东海.基于太赫兹时域光谱技术的饼干水分定量分析[J].食品安全质量检测学报,2014,5(3):725-729. 被引量：13
9何绪生.近红外反射光谱分析在土壤学的应用及前景[J].中国农业科技导报,2004,6(4):71-76. 被引量：24
10毕卫红,李超,苗玉洁,唐予军,王文辕.利用近红外光谱技术对牛奶中蛋白质含量进行定量分析[J].计量技术,2005(8):34-36. 被引量：7

同被引文献19

1江泽慧,黄安民,王斌.木材不同切面的近红外光谱信息与密度快速预测[J].光谱学与光谱分析,2006,26(6):1034-1037. 被引量：38
2陈升侃,周长品,翁启杰,李发根,李建文,周建清,甘四明.尾叶桉×细叶桉木材密度与生长的联合选择[J].林业科学研究,2018,31(2):77-82. 被引量：8
3赵鹏,李悦.可见光/近红外光谱分析的木材树种与密度同时预测[J].光谱学与光谱分析,2019,39(11):3525-3532. 被引量：6
4于雷,陈金浩,李龙飞,李超,张怡卓.IPSO-BP木材绝干密度近红外光谱预测模型[J].光谱学与光谱分析,2020,40(9):2937-2942. 被引量：5
5宋恋环,秦芳,王军锋,苏利荣,曾成城.3种核桃木材纤维形态和气干密度的比较分析[J].广西林业科学,2020,49(3):447-450. 被引量：3
6谈爱玲,王晓斯,楚振原,赵勇.基于近红外光谱融合与深度学习的玉米成分定量建模方法[J].食品与发酵工业,2020,46(23):213-219. 被引量：8
7卢诗扬,张雷蕾,潘家荣,杨德红,眭亚南,朱诚.拉曼光谱结合LSTM长短期记忆网络的樱桃产地鉴别研究[J].光谱学与光谱分析,2021,41(4):1177-1181. 被引量：11
8冯志恒,吕欣欣,李赛楠,周晓煦,蒋开彬,黄少伟.基于5年生火炬松建立木材基本密度近红外预测模型[J].福建农林大学学报（自然科学版）,2021,50(6):767-770. 被引量：1
9王立琦,姚静,王睿莹,陈颖淑,罗淑年,王伟宁,张艳荣.基于PLS-GRNN的豆粕品质近红外光谱检测研究[J].光谱学与光谱分析,2022,42(5):1433-1438. 被引量：7
10曾韦珊,黄林旺,吕欣欣,毛积鹏,冯志恒,刘天颐,黄少伟.湿加松针叶儿茶素和表儿茶素总量近红外光谱预测模型的建立[J].中南林业科技大学学报,2022,42(4):22-29. 被引量：6

引证文献1

1彭润东,李耀翔,陈雅,张哲宇,刘晓利.基于LSTM长短期记忆网络的樟子松木材气干密度NIRS模型预测[J].中南林业科技大学学报,2024,44(3):179-188.

1彭莹琼,洪恩松,邓泓,何雯洁,赵雷.基于迁移学习和特征融合的猪肋骨种类判断研究[J].黑龙江畜牧兽医,2023(19):57-61.
2郭怡含.工程建设及政府采购招投标的规范化管理研究[J].中国经贸,2023(20):73-75.
3杨正理,吴馥云,陈海霞.深度残差收缩网络的多特征锅炉炉管声波信号故障识别[J].智能系统学报,2023,18(5):1108-1116.
4张文秀,胡智超.基于Python朴素贝叶斯分类器的营业收入审计可靠性研究[J].财会研究,2023(10):61-66.
5林金官.集体记忆视域下高校“四史”教育研究[J].哈尔滨学院学报,2023,44(10):123-127.
6梁美娜,张立宁,林振,苏来金.不同海区养殖羊栖菜组成分析及多糖的抗氧化活性研究[J].食品工业科技,2023,44(22):275-284. 被引量：1
7杨龙飞,高山,蔡新雷,余洋,李亚南.基于拉丁超立方采样的小范围分布式光伏出力时空概率分布生成方法[J].南方电网技术,2023,17(9):38-48. 被引量：1
8廖娟,殷智华,李嘉宇,杨涛.酵母发酵对米糠挥发性风味物质及营养特性的影响[J].食品工业科技,2023,44(22):266-274.
9刘孟君,任越.放牧条件下萨福克与河谷型藏绵羊杂交F1代不同部位肌肉营养品质分析[J].草业学报,2023,32(11):140-154. 被引量：1
10李彤.通用人工智能技术提供者义务的审视与优化[J].东方法学,2023(5):70-81. 被引量：7

食品工业科技

2023年第22期

浏览历史

内容加载中请稍等...

基于自然语言处理的山楂果实品种近红外无损鉴别方法被引量：1

参考文献17

二级参考文献196

共引文献418

同被引文献19

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于自然语言处理的山楂果实品种近红外无损鉴别方法 被引量：1

参考文献17

二级参考文献196

共引文献418

同被引文献19

引证文献1

相关作者

相关机构

相关主题

浏览历史

基于自然语言处理的山楂果实品种近红外无损鉴别方法被引量：1