基于BERT_Stacked LSTM的农业病虫害问句分类方法被引量：4

Question Classification Method of Agricultural Diseases and Pests Based on BERT_Stacked LSTM

下载PDF

导出

摘要为解决农业病虫害问句分类过程中存在公开数据集较少、文本较短、特征稀疏、隐含语义信息较难学习等问题,以火爆农资招商网为数据源,构建了用于农业病虫害问句分类的数据集,提出了一种用于农业病虫害问句分类的深度学习模型BERT;tacked LSTM。首先,BERT部分获取各个问句的字符级语义信息,生成了包含句子级特征信息的隐藏向量。然后,使用堆叠长短期记忆网络(Stacked LSTM)学习到隐藏的复杂语义信息。实验结果表明,与其他对比模型相比,本文模型对农业病虫害问句分类更具优势,F1值达到了95.76%,并在公开通用领域数据集上进行了测试,F1值达到了98.44%,表明了模型具有较好的的泛化性。 In order to solve the thorny problems in the process of classification of agricultural diseases and insect pests questions,such as fewer public data sets,shorter texts and sparse features,and difficult to learn implicit semantic information,using the hot agricultural investment network as the data source,a data set for the classification of agricultural pests and diseases was constructed,and a deep learning model BERT_Stacked LSTM for the classification of agricultural pests and diseases was proposed.Firstly,the BERT obtained the character-level semantic information of each question,and generated a hidden vector containing sentence-level feature information.Then,stacked long short-term memory network(Stacked LSTM)structure was used to learn the hidden complex semantic information.Experimental results showed the effectiveness of the proposed model.Compared with other comparative models,the model proposed had more advantages in classifying agricultural diseases and insect pests questions.The F1 score reached 95.76%,and it was widely used in public.Tested on the domain data set,the F1 score reached 98.44%,indicating that the generalization of the model was also very good.

作者李林刁磊唐詹柏召周晗郭旭超 LI Lin;DIAO Lei;TANG Zhan;BAI Zhao;ZHOU Han;GUO Xuchao(College of Information and Electrical Engineering,China Agricultural University,Beijing 100083,China)

机构地区中国农业大学信息与电气工程学院

出处《农业机械学报》 EI CAS CSCD 北大核心 2021年第S01期172-177,共6页 Transactions of the Chinese Society for Agricultural Machinery

基金国家重点研发计划项目(2016YFD0300710)

关键词农业病虫害问句分类 BERT Stacked LSTM agricultural diseases and pests question classification BERT Stacked LSTM

分类号 S43 [农业科学—农业昆虫与害虫防治] TP391.1 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献7

1苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：378
2陈雪天,李荣陆.使用最大熵模型进行文本分类[J].计算机工程与应用,2004,40(35):78-79. 被引量：4
3史梦飞,杨燕,贺樑,陈成才.基于Bi-LSTM和CNN并包含注意力机制的社区问答问句分类方法[J].计算机系统应用,2018,27(9):157-162. 被引量：9
4黄东晋,秦汉,郭昊.基于BERT-CNN的电影原声智能问答系统[J].计算机技术与发展,2020,30(11):158-162. 被引量：6
5赵明,董翠翠,董乔雪,陈瑛.基于BIGRU的番茄病虫害问答系统问句分类研究[J].农业机械学报,2018,49(5):271-276. 被引量：23
6金宁,赵春江,吴华瑞,缪祎晟,李思,杨宝祝.基于BiGRU_MulCNN的农业问答问句分类技术研究[J].农业机械学报,2020,51(5):199-206. 被引量：17
7杨国峰,杨勇.基于BERT的常见作物病害问答系统问句分类[J].计算机应用,2020,40(6):1580-1586. 被引量：17

二级参考文献46

1王建会,王洪伟,申展,胡运发.一种实用高效的文本分类算法[J].计算机研究与发展,2005,42(1):85-93. 被引量：20
2李荣陆,王建会,陈晓云,陶晓鹏,胡运发.使用最大熵模型进行中文文本分类[J].计算机研究与发展,2005,42(1):94-101. 被引量：95
3苏金树,张博锋,徐昕.基于机器学习的文本分类技术研究进展[J].软件学报,2006,17(9):1848-1859. 被引量：378
4Sven Martin,Hermann Ney,Jrg Zaplo. Smoothing methods in maximum entropy language modeling[C].In:IEEE International Conference on Acoustics,Speech and Signal Processing, Phoenix,AR, 1999: 545～548
5Adwait Ratnaparkhi.A simple introduction to maximum entropy models for natural language processing[R].Technical Report 97-08 ,Institute for Research in Cognitive Science,University of Pennsylvania,1997
6Yang Y.An evaluation of statistical approaches to text categorization[J].Information Retrieval, 1999; 1 ( 1 ) :76～88
7Adwait R.Maximum entropy models for natural language ambiguity resolution[D].PhD thesis. University of Pennsylvania, 1998
8Adwait Ratnaparkhi.A maximum entropy model for Part-of-Speech tagging[C].In:Proceedings of the Empirical Methods in Natural Language Processing Conference, 1996
9Adam L Berger,Stephen A Della Pietra,Vincent J Della Pietra. A maximum entropy approach to natural language processing[J].Computational Linguistics,1996;22(1) :38～73
10Kamal Nigam,John Lafferty,Andrew McCallum. Using maximum entropy for text classification[C].In:IJCAI-99 Workshop on Machine Learning for Information Filtering, 1999

共引文献436

1贾善崇,周兰江,张建安,周枫.融入多特征的汉-老双语对齐方法[J].中国水运（下半月）,2020,20(3):78-80. 被引量：2
2张博凯,李想.基于知识图谱的Android端农技智能问答系统研究[J].农业机械学报,2021,52(S01):164-171. 被引量：9
3张海瑜,陈庆龙,张斯静,张子怡,杨帆,李鑫星.基于语义知识图谱的农业知识智能检索方法[J].农业机械学报,2021,52(S01):156-163. 被引量：11
4姚学恒,张萍,闫立伟,操诚.基于机器学习的企业秘密文档自动分类方法[J].产业与科技论坛,2020,19(7):44-45.
5张小艳,李强.基于SVM的分类方法综述[J].科技信息,2008(28):344-345. 被引量：23
6王辉,左万利,袁华.一种基于质心与本体的文本分类方法[J].计算机研究与发展,2007,44(z2):6-11. 被引量：3
7徐燕,李锦涛,王斌,孙春明,张森.不均衡数据集上文本分类的特征选择研究[J].计算机研究与发展,2007,44(z2):58-62. 被引量：20
8袁志坚,贾焰.基于误差反馈的高速Web文本流快速近似分类[J].计算机研究与发展,2007,44(z3):13-17.
9贾志洋,高炜,王勇刚.结合信息检索技术的半监督文本分类方法[J].苏州大学学报（自然科学版）,2012,28(1):34-39. 被引量：1
10陈思,钱铭宇,刘昌明.文本分类技术研究进展[J].电脑编程技巧与维护,2009(S1):22-24.

同被引文献54

1王飞跃,王艳芬,陈薏竹,田永林,齐红威,王晓,张卫山,张俊,袁勇.联邦生态:从联邦数据到联邦智能[J].智能科学与技术学报,2020,2(4):305-311. 被引量：22
2康孟珍,王秀娟,华净,王浩宇,王飞跃.平行农业:迈向智慧农业的智能技术[J].智能科学与技术学报,2019,0(2):107-117. 被引量：27
3徐畅,丁俊琦,赵聃桐,乔岩,张领先.基于LightGBM和处方数据的番茄病害诊断方法[J].农业机械学报,2022,53(9):286-294. 被引量：3
4张光发,张亚,姚杰,任玉清.渔船安全技术评价系统的开发与应用[J].农业工程学报,2013,29(17):137-144. 被引量：4
5郑建丽,刘平,张祝利,张敬党.基于专家系统的舱室智能化设计在渔船上的应用[J].农业工程学报,2015,31(6):208-212. 被引量：6
6贺付亮,李新科,许愿,王曲苑.基于物联网的内河小型渔船动态信息监控系统设计[J].农业工程学报,2015,31(20):178-185. 被引量：14
7张衡,唐峰华,程家骅,张胜茂,吴祖立.我国远洋渔业现状与发展思考[J].中国渔业经济,2015,33(5):16-22. 被引量：21
8胡庆松,王曼,陈雷雷,李俊.我国远洋渔船现状及发展策略[J].渔业现代化,2016,43(4):76-80. 被引量：17
9Nan-ning ZHENG,Zi-yi LIU,Peng-ju REN,Yong-qiang MA,Shi-tao CHEN,Si-yu YU,Jian-ru XUE,Ba-dong CHEN,Fei-yue WANG.Hybrid-augmented intelligence： collaboration and cognition[J].Frontiers of Information Technology & Electronic Engineering,2017,18(2):153-179. 被引量：57
10赵明,杜会芳,董翠翠,陈长松.基于word2vec和LSTM的饮食健康文本分类研究[J].农业机械学报,2017,48(10):202-208. 被引量：42

引证文献4

1康孟珍,王秀娟,李冬,王旭伟,王浩宇,樊梦涵,许钰林,王飞跃.基于联邦学习的分布式农业组织[J].智能科学与技术学报,2022,4(2):288-297. 被引量：5
2丁俊琦,李博,乔岩,张领先.基于植物电子病历多类型数据融合的作物病害诊断方法[J].农业机械学报,2023,54(1):196-204. 被引量：2
3武壮,晁荣志,陈湘国,魏忠诚,赵继军.基于BERT-MSCNN的同行评议情感分类研究[J].软件导刊,2023,22(8):54-58. 被引量：1
4刘爽,丁哲,吕超,朱珊珊.基于文本分类和知识挖掘的远洋渔船安全问题分析[J].农业工程学报,2023,39(24):215-223.

二级引证文献8

1康孟珍,孙贺全,王秀娟,王飞跃.系统农业:结合农业社会经济属性的建模和控制[J].智能科学与技术学报,2023,5(1):41-50. 被引量：2
2张领先,韩梦瑶,丁俊琦,李凯雨.作物病害智能诊断与处方推荐技术研究进展[J].农业机械学报,2023,54(6):1-18. 被引量：4
3黄吉婷,郭可歆,齐佳音.企业数字化转型对就业规模及结构影响的实证研究[J].智能科学与技术学报,2023,5(3):352-365.
4徐畅,张领先,乔岩.基于电子病历的作物病虫害关联挖掘及智能诊断[J].智能化农业装备学报（中英文）,2023,4(4):1-10. 被引量：1
5余亚烽,刘兴红,陶胜阳,王瑰霞,张苏薇.基于情感分类与主题挖掘的MOOC课程评论研究[J].考试研究,2024,20(1):86-100.
6王飞跃.平行智能数字警察构建平行安全新格局:从平行警务到平安中国[J].智能科学与技术学报,2023,5(4):431-435. 被引量：1
7张濛濛,王秀娟,康孟珍,华净,王浩宇,王飞跃.从水稻病害识别出发探索农业数据共享新模式[J].农业大数据学报,2023,5(4):13-23.
8Mengmeng ZHANG,Xiujuan WANG,Mengzhen KANG,Jing HUA,Haoyu WANG,Feiyue WANG.A Novel Agricultural Data Sharing Mode Based on Rice Disease Identification[J].Plant Diseases and Pests,2024,15(2):9-16.

1谢甲琦,李政.基于预训练语言模型的公众健康问句分类[J].医学信息学杂志,2021,42(12):33-36. 被引量：1
2国内手办市场崛起谁将占得先机?[J].玩具世界,2021(11):13-17.
3张鹏举,贾永辉,陈文亮.基于多特征实体消歧的中文知识图谱问答[J].计算机工程,2022,48(2):47-54. 被引量：5
4徐晓巍,郭海红,李姣.面向公众健康问句分类数据挖掘算法评测研究[J].医学信息学杂志,2021,42(10):17-21. 被引量：1
5朱玉佳,许晴,赵一姣,张磊,付子旺,温奥楠,高梓翔,张昀,傅湘玲,王勇.深度学习算法辅助构建三维颜面正中矢状平面[J].北京大学学报（医学版）,2022,54(1):134-139. 被引量：6
6齐永锋,吕雪超,裴晓旭,王静.基于生成对抗网络的高光谱图像分类[J].光电子．激光,2021,32(12):1285-1292. 被引量：1
7蔡鹏.元宇宙火爆,投资需冷静[J].养生保健指南（中老年健康）,2022(2):49-50.
8王萧.冰墩墩火爆,冬奥会特许商品供不应求[J].中国黄金珠宝,2022(2):48-48.
9张飞宇,王美丽,王正超.引入 Transformer 和尺度融合的动物骨骼关键点检测模型构建[J].农业工程学报,2021,37(23):179-185. 被引量：8
10赵述评,王傲.直播卖酒套路深假酒问题如何解[J].中国食品,2022(5):56-57.

农业机械学报

2021年第S01期

浏览历史

内容加载中请稍等...

基于BERT_Stacked LSTM的农业病虫害问句分类方法被引量：4

参考文献7

二级参考文献46

共引文献436

同被引文献54

引证文献4

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于BERT_Stacked LSTM的农业病虫害问句分类方法 被引量：4

参考文献7

二级参考文献46

共引文献436

同被引文献54

引证文献4

二级引证文献8

相关作者

相关机构

相关主题

浏览历史

基于BERT_Stacked LSTM的农业病虫害问句分类方法被引量：4