基于深层神经网络的猪声音分类被引量：22

Classification of pig sounds based on deep neural network

下载PDF

导出

摘要猪的声音能够反映生猪的应激状态以及健康状况,同时声音信号也是最容易通过非接触方式采集到的生物特征之一。深层神经网络在图像分类研究中显示了巨大优势。谱图作为一种可视化声音时频特征显示方式,结合深层神经网络分类模型,可以提高声音信号分类的精度。现场采集不同状态的猪只声音,研究适用于深层神经网络结构的最优谱图生成方法,构建了猪只声音谱图的数据集,利用Mobile Net V2网络对3种状态猪只声音进行分类识别。通过分析对比不同谱图参数以及网络宽度因子和分辨率因子,得出适用于猪只声音分类的最优模型。识别精度方面,通过与支持向量机,随机森林,梯度提升决策树、极端随机树4种模型进行对比,验证了算法的有效性,异常声音分类识别精度达到97.3%。该研究表明,猪只的异常发声与其异常行为相关,因此,对猪只的声音进行识别有助于对其进行行为监测,对建设现代化猪场具有重要意思。 Pig sounds reflect the stress and health status of pigs,also it is the most easily collected biomarker through non-contact methods.To improve the classification accuracy of pig sound signals,this study used the spectrogram to visualize the time-frequency characteristics,and combined with the deep neural network classification model.Four contents were discussed as followed:1)The sound data set was constructed.According to the different sound signals,the pig's behavior could be recognized by the classification network.When the pig was in normal statuses,the pig sounds were called as grunts.If the pig was in frightened statuses,such as injected or chased,pig sounds were defined as screams.Before the feeding,when pigs see the food,pigs made long irritable sounds.The sounds were called as howls of hunger.All pig sounds were collected on-farm by the sound collection box.On the farm,a laptop was used as a host computer to display all the working parameters of the collection box.The data transmission and storage scheme adopted the Client/Server architecture.Besides,the worker labeled sounds,according to the behavior.2)Spectrograms of different sounds built up the training and test dataset of the image recognition network.The pig sound was a stationary signal in short time duration,therefore,continuously calculating the frequency spectrum of the sound signal in the vicinity of the selected instant of time gave rise to a time-frequency spectrum.The study discussed the optimal spectrogram parameters,which were suitable for the structure of the deep neural network.Experiment results showed that the segment length of the pig sounds was 256 samples and the overlap was 128 samples,the classification accuracy of the deep neural network was highest.The spectrogram optimization experiment results showed that the recognition accuracy was improved by 1.8%.3)The deep neural network was designed.The study used the MobileNetV2 network to achieve recognition,which was based on an inverted residual structure where the shortcut connections were between the thin bottleneck layers.Aiming to the portable platform in the real application,the width factor and the resolution factor were introduced to define a smaller and more efficient architecture.Also,Adam optimizer formed an adequate substitute for the underlying RMSprop optimizer,and it made the loss function convergent faster.Adam optimizer calculated the adaptive parameter-learning rate based on the mean value of the first moment,making full use of the mean value of the second moment of the gradient.The result implied the width factor was chosen as 0.5,the accuracy was highest.4)Compared experiments had been done.Support Vector Machine(SVM),Gradient Boosting Decision Tree(GBDT),Random Forest(RF),and Extra Trees(ET)algorithms were compared with the proposed pig sound recognition network.All algorithms were trained and tested on the same sound dataset.Specifically,the proposed algorithm increased the recognition accuracy of screams from 84.5%to 97.1%,and the accuracy of howls was increased from 86.1%to 97.5%.But the recognition accuracy of grunts was decreased from 100%to 97.3%.This was caused by the difference in the principle of different recognition algorithms.Furthermore,through the experiments on the width factor and resolution factor,a smaller and more efficient model was defined based on the standard MobileNetV2 model,and the running speed of the model was significantly improved to meet the needs of practical applications,however,the accuracy remained.This study showed that the abnormal pig vocalization was related to abnormal behavior,so sound recognition could help to monitor behaviors.In the future,the abnormal behaviors combined the sound recognition and video analysis would be discussed.

作者苍岩罗顺元乔玉龙 Cang Yan;Luo Shunyuan;Qiao Yulong(College of Information and Communication Engineering,Harbin Engineering University,Harbin 150001,China)

机构地区哈尔滨工程大学信息与通信工程学院

出处《农业工程学报》 EI CAS CSCD 北大核心 2020年第9期195-204,共10页 Transactions of the Chinese Society of Agricultural Engineering

基金国家自然科学基金(61871142)。

关键词信号处理声音信号识别深度学习猪只音频梅尔倒谱系数分类 signal processing acoustic signal recognition deep learning pig sounds MFCC classification

分类号 TP391.4 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献4

1张彩霞,武佩,宣传忠,刘海洋,刘艳秋.母羊声音信号处理与识别系统的设计[J].内蒙古农业大学学报（自然科学版）,2013,34(5):145-149. 被引量：5
2黎煊,赵建,高云,雷明刚,刘望宏,龚永杰.基于深度信念网络的猪咳嗽声识别[J].农业机械学报,2018,49(3):179-186. 被引量：27
3马辉栋,刘振宇.语音端点检测算法在猪咳嗽检测中的应用研究[J].山西农业大学学报（自然科学版）,2016,36(6):445-449. 被引量：9
4许乐灵,胡石.一种引导滤波自适应双阈值优化边缘检测算法[J].南京理工大学学报,2018,42(2):177-182. 被引量：9

二级参考文献41

1李永宏.内蒙古草原草场放牧退化模式研究及退化监测专家系统雏议[J].植物生态学报,1994,18(1):68-79. 被引量：94
2张仁志,崔慧娟.基于短时能量的语音端点检测算法研究[J].电声技术,2005,29(7):52-54. 被引量：45
3林玮,杨莉莉,徐柏龄.基于修正MFCC参数汉语耳语音的话者识别[J].南京大学学报（自然科学版）,2006,42(1):54-62. 被引量：23
4耿森林,尚志远.仓储粮食中害虫活动声功率谱特征研究[J].陕西师范大学学报（自然科学版）,2006,34(2):47-50. 被引量：10
5曾国军,李小昱,王为,蒋爱华.基于虚拟仪器技术的声强法识别拖拉机噪声源[J].农业工程学报,2006,22(10):117-121. 被引量：11
6Tsewang NAMGAIL.印度喜马拉雅山区西藏盘羊的警戒行为(英文)[J].动物学报,2007,53(2):195-200. 被引量：2
7吴红卫,吴镇扬,赵力.基于多窗谱的心理声学语音增强[J].声学学报,2007,32(3):275-281. 被引量：12
8Barry S J,Dane A D,Morice A H,et al.The automatic recognition and counting of cough[J].Cough,2006,2(1):1-9.
9刘振宇,赫晓燕,桑静,等.基于隐马尔可夫模型的猪咳嗽声音识别的研究[C]//中国畜牧兽医学会信息技术分会.中国畜牧兽医学会信息技术分会第十届学术研讨会论文集.中国畜牧兽医学会信息技术分会,2015:6.
10李志忠,滕光辉.基于改进MFCC的家禽发声特征提取方法[J].农业工程学报,2008,24(11):202-205. 被引量：24

共引文献42

1沈明霞,陈金鑫,丁奇安,陈佳,刘龙申,孙玉文.生猪自动化养殖装备与技术研究进展与展望[J].农业机械学报,2022,53(12):1-19. 被引量：15
2祁飞,武佩,宣传忠,马彦华,邬娟.幼年山羊和绵羊寻母叫声信号的对比分析[J].科技风,2016(11):93-96. 被引量：1
3孙钟雷,张长平,段建礼,揭若南.咀嚼脆裂声音与食品脆性的关系研究[J].食品科技,2017,42(6):95-98. 被引量：6
4董红松,刘振宇,马辉栋,闫静.语音增强在去除猪咳嗽噪声中的应用研究[J].山西农业大学学报（自然科学版）,2017,37(11):831-836. 被引量：3
5张振华,田建艳,王芳,张成.猪咳嗽声特征参数提取与识别的研究[J].黑龙江畜牧兽医,2017(12):18-22. 被引量：5
6黎煊,赵建,高云,雷明刚,刘望宏,龚永杰.基于深度信念网络的猪咳嗽声识别[J].农业机械学报,2018,49(3):179-186. 被引量：27
7邓向武,齐龙,马旭,蒋郁,陈学深,刘海云,陈伟烽.基于多特征融合和深度置信网络的稻田苗期杂草识别[J].农业工程学报,2018,34(14):165-172. 被引量：51
8杨飞云,曾雅琼,冯泽猛,刘作华,李保明.畜禽养殖环境调控与智能养殖装备技术研究进展[J].中国科学院院刊,2019,34(2):163-173. 被引量：56
9黎煊,赵建,高云,刘望宏,雷明刚,谭鹤群.基于连续语音识别技术的猪连续咳嗽声识别[J].农业工程学报,2019,35(6):174-180. 被引量：21
10刘丽霞,李宝文,王阳萍,杨景玉.改进Canny边缘检测的遥感影像分割[J].计算机工程与应用,2019,55(12):54-58. 被引量：74

同被引文献238

1左杰文,彭彦昆,李永玉,邹文龙,赵鑫龙,孙晨.基于声学特性的西瓜糖度检测与分级系统研究[J].农业机械学报,2022,53(S01):316-323. 被引量：5
2杜晓冬,滕光辉,刘慕霖,赵雨晓,周振宇,祝鹏飞.基于轻量级卷积神经网络的种鸡发声识别方法[J].农业机械学报,2022,53(10):271-276. 被引量：5
3涂淑琴,刘晓龙,梁云,张宇,黄磊,汤寅杰.基于改进DeepSORT的群养生猪行为识别与跟踪方法[J].农业机械学报,2022,53(8):345-352. 被引量：19
4李春明,逯杉婷,远松灵,王震洲.基于Faster R-CNN的除草机器人杂草识别算法[J].中国农机化学报,2019,40(12):171-176. 被引量：22
5侯天侦,李保明,滕光辉,周清,肖滢萍,祁丽荣.植物声频控制技术在设施蔬菜生产中的应用[J].农业工程学报,2009,25(2):156-160. 被引量：37
6薛俊青,陈宝春,BRISEGHELLA Bruno.脱粘钢管混凝土单圆管短柱偏压试验[J].建筑结构学报,2009,30(S2):237-241. 被引量：10
7白亮,老松杨,陈剑赟,吴玲达.基于支持向量机的音频分类与分割[J].计算机科学,2005,32(4):87-90. 被引量：13
8韩冰,高新波,姬红兵.一种基于选择性集成SVM的新闻音频自动分类方法[J].模式识别与人工智能,2006,19(5):634-639. 被引量：5
9张朝阳,赵涛,张建波.基于支持向量机的企业产品创新能力评价[J].西安电子科技大学学报（社会科学版）,2007,17(5):50-54. 被引量：3
10魏进民,李标,王伯初,唐坤,梁亦龙,舒坤贤.声波刺激对铁皮石斛过氧化物酶同工酶基因表达的影响[J].应用声学,2008,27(6):462-468. 被引量：12

引证文献22

1杜晓冬,滕光辉,刘慕霖,赵雨晓,周振宇,祝鹏飞.基于轻量级卷积神经网络的种鸡发声识别方法[J].农业机械学报,2022,53(10):271-276. 被引量：5
2钟长华,吴浩,宋弘,江俊卓,俞婧婧.基于人工智能的猪只健康监测方法[J].成组技术与生产现代化,2023,40(3):4-10.
3倪建功,李娟,邓立苗,韩仲志.基于知识蒸馏的胡萝卜外观品质等级智能检测[J].农业工程学报,2020,36(18):181-187. 被引量：12
4王婷婷,苍岩,毕晓君,何恒翔.改进的Faster R-CNN网络预测尺度参数[J].哈尔滨工程大学学报,2021,42(3):426-432. 被引量：3
5宗超,曹晏飞,曹孟冰,高锦浩,李书磊,刘慕霖,滕光辉,王朝元.笼养和栖架养殖模式下蛋鸡的发声特征[J].农业工程学报,2021,37(6):135-141. 被引量：7
6耿艳利,宋朋首,林彦伯,季燕凯,杨淑才.采用改进CNN对生猪异常状态声音识别[J].农业工程学报,2021,37(20):187-193. 被引量：10
7庞金生,胡山,张龙,孙银斌,陈伟涛,杨鹏.基于深度学习与声音识别的护林系统[J].科技与创新,2022(1):7-9.
8孙嘉燚,苍岩.基于多目标追踪方法的猪只个体识别算法[J].应用科技,2022,49(2):75-80. 被引量：2
9邵睿,彭硕,查文文,陈成鹏,辜丽川,焦俊.基于BiLSTM的生猪音频识别[J].合肥学院学报（综合版）,2022,39(2):113-119. 被引量：2
10彭硕,刘东阳,时国龙,李广博,慕京生,辜丽川,焦俊.基于深度神经网络及隐马尔科夫模型的生猪状态音频识别[J].中国农业大学学报,2022,27(6):172-181. 被引量：4

二级引证文献68

1刘双喜,刘思涛,屈慧星,王刘西航,胡宪亮,许增海.基于MS-YOLO v7的多尺度稻飞虱识别分类方法[J].农业机械学报,2023,54(S01):212-221. 被引量：1
2沈明霞,陈金鑫,丁奇安,陈佳,刘龙申,孙玉文.生猪自动化养殖装备与技术研究进展与展望[J].农业机械学报,2022,53(12):1-19. 被引量：15
3谢秋菊,周红,包军,李庆达.基于机器视觉的畜禽体质量评估研究进展[J].农业机械学报,2022,53(10):1-15. 被引量：10
4涂淑琴,刘晓龙,梁云,张宇,黄磊,汤寅杰.基于改进DeepSORT的群养生猪行为识别与跟踪方法[J].农业机械学报,2022,53(8):345-352. 被引量：19
5韩丁,新吉乐,王亮,王亚欣,李厅霞,郭瑛.声学监测技术在家畜福利化养殖中的发展应用[J].内蒙古农业大学学报（自然科学版）,2023,44(5):89-100.
6钟长华,吴浩,宋弘,江俊卓,俞婧婧.基于人工智能的猪只健康监测方法[J].成组技术与生产现代化,2023,40(3):4-10.
7杨智伦,朱铮涛,陈树雄,李博,招祖炜.改进CNN的供水管道泄漏声音识别[J].国外电子测量技术,2023,42(1):153-158. 被引量：5
8谢为俊,魏硕,郑招辉,杨光照,丁鑫,杨德勇.深度多分支模型融合网络的胡萝卜缺陷识别与分割[J].农业工程学报,2021,37(2):177-186. 被引量：7
9郭昕刚,屈诺希,杨洛.基于深度学习的实时人脸检测[J].长春工业大学学报,2021,42(2):181-185. 被引量：3
10高霁月,倪建功,杨昊岩,韩仲志.基于数据平衡和深度学习的开心果品质视觉检测方法[J].农业机械学报,2021,52(7):367-372. 被引量：6

1张伟,高岩.浅谈猪场设计阶段成本优化[J].今日养猪业,2020(2):105-107.
2秦艳,李超,张兴国.现代化猪场断奶仔猪大肠杆菌性腹泻的诊断与防控[J].中国动物保健,2020,22(6):16-16. 被引量：2
3张浩,朴燕,鲁明阳.基于改进的YOLOv3算法在目标识别与抓取中的应用[J].长春理工大学学报（自然科学版）,2020,43(2):81-88. 被引量：8
4汪检兵,李俊.基于OpenPose-slim模型的人体骨骼关键点检测方法[J].计算机应用,2019,39(12):3503-3509. 被引量：7
5孙若钒,高建瓴,陈娅先.VansNet轻量化卷积神经网络[J].贵州大学学报（自然科学版）,2020,37(2):51-56. 被引量：3
6曹洪玉,刘冬梅,付秀华,张静,岳鹏飞.基于CT图像的超分辨率重构研究[J].长春理工大学学报（自然科学版）,2020,43(1):51-57.
7李绪夫.基于深度学习的医药专利标签分类方法[J].计算机时代,2020,0(5):50-53. 被引量：2
8张云翔,饶竹一.基于LSTM神经网络的电网文本分类方法[J].现代计算机,2020,26(2):8-11. 被引量：4
9魏涛.现代化猪场应对猪巨细胞病毒感染的诊疗对策[J].中国动物保健,2020,22(6):23-23. 被引量：1
10李玉花,柳倩,韦新,程永强,李海芳.基于卷积神经网络的脑电信号分类[J].科学技术与工程,2020,20(15):6135-6140. 被引量：7

农业工程学报

2020年第9期

浏览历史

内容加载中请稍等...

基于深层神经网络的猪声音分类被引量：22

参考文献4

二级参考文献41

共引文献42

同被引文献238

引证文献22

二级引证文献68

相关作者

相关机构

相关主题

浏览历史

基于深层神经网络的猪声音分类 被引量：22

参考文献4

二级参考文献41

共引文献42

同被引文献238

引证文献22

二级引证文献68

相关作者

相关机构

相关主题

浏览历史

基于深层神经网络的猪声音分类被引量：22