基于特征迁移的多物种鸟声识别方法被引量：8

Recognition of Multiple Bird Species in Audio Recordings Based on Feature Transfer

下载PDF

导出

摘要针对多物种鸟声识别中多物种鸟声样本不足的问题,尝试采用单物种鸟声样本训练多物种鸟声识别模型,并提出一种基于特征迁移的多物种鸟声识别方法。该方法引入特征迁移学习算法,利用最大均值差异(Maximum mean discrepancy,MMD)度量鸟声样本特征分布差异,将不同分布的单物种鸟声和多物种鸟声的音频特征映射为同分布的潜在音频特征,再基于同分布的音频特征构造识别模型。使得单物种鸟声样本训练的识别模型也能够适用于多物种鸟声识别。在自然形成的多物种鸟声数据集上,算法在4项多标记评价指标上都取得了较好的识别效果;在人工构造的多物种鸟声数据集上对比试验表明,基于特征迁移的识别算法在单个物种上的正确识别率相较于对比算法最高提升了20%。 To deal with the problem of inadequate sample in multiple bird species recognition, a new rec- ognition method of multiple bird species in audio recordings is proposed based on feature transfer, which uses bird sounds of single species to train a multiple bird species recognition model. Maximum mean dis- crepancy （MMD） is used to measure the feature distributions difference of bird sounds, which maps audio feature of single-species bird sounds and multiple-species bird sounds into a new latent feature with the same distribution. Then single-species bird sounds with latent feature can be used to train a model of multiple-species bird sounds. The experimental result shows that method can achieve good regognition performance in a natural multiple-species bird sounds dataset based on four multi-label metrics. The recognition rate of proposed method increases by 20 % compared with other methods in an artificial multiplespecies bird sounds dataset.

作者刘昊天姜海燕舒欣徐彦伍艳莲郭小清

机构地区南京农业大学信息科技学院南京农业大学国家信息农业工程技术中心

出处《数据采集与处理》 CSCD 北大核心 2017年第6期1239-1247,共9页 Journal of Data Acquisition and Processing

基金国家重点研发计划(2016YFD0300607)资助项目江苏省农业科技自主创新资金(CX(16)1039)资助项目中央高校基本科研业务费(KYZ201547)资助项目

关键词鸟声识别多物种特征迁移迁移学习 bird sounds recognition multiple bird species feature transfer transfer learning

分类号 TN912.34 [电子电信—通信与信息系统]

引文网络
相关文献

参考文献3

1李燕萍,唐振民,钱博,张燕.基于PLAR特征补偿的鲁棒性说话人识别仿真研究[J].系统仿真学报,2009,21(2):409-412. 被引量：2
2魏静明,李应.利用抗噪纹理特征的快速鸟鸣声识别[J].电子学报,2015,43(1):185-190. 被引量：16
3孙斌,万鹏威,陶达,赵玉晓.基于自适应最优核时频分布的鸟类识别[J].数据采集与处理,2015,30(6):1187-1195. 被引量：7

二级参考文献33

1李亚安,王军,雷粉霞.自适应核时频分布在抑制交叉项中的应用[J].系统工程与电子技术,2004,26(11):1567-1569. 被引量：13
2张万里,刘桥.Mel频率倒谱系数提取及其在声纹识别中的作用[J].贵州大学学报（自然科学版）,2005,22(2):207-210. 被引量：20
3庄军,李弼程.一种基于灰度共生矩阵的文本图像识别方法[J].计算机工程,2006,32(3):214-216. 被引量：11
4彭圆,王晟,王科俊,李雪耀,林良骥,林正青,王建文.感知线性预测在水下目标分类中的应用研究[J].声学学报,2006,31(2):146-150. 被引量：16
5包永强,赵力,邹采荣.采用归一化补偿变换的与文本无关的说话人识别[J].声学学报,2006,31(1):55-60. 被引量：13
6薄华,马缚龙,焦李成.图像纹理的灰度共生矩阵计算问题的分析[J].电子学报,2006,34(1):155-158. 被引量：204
7陈雨红,杨长春,曹齐放,李波涛,尚永生.几种时频分析方法比较[J].地球物理学进展,2006,21(4):1180-1185. 被引量：116
8林琳,王树勋,郭纲.短语音说话人识别新方法的研究[J].系统仿真学报,2007,19(10):2272-2275. 被引量：10
9Tadj C, Gabrea M. Towards robustness in speaker verification: Enhancement and adaptation [C]// Proceedings of the 45th Midwest Symposium on Circuits and Systems, New York, USA: IEEE, 2002, 3(3): 320-323.
10David Chow, Waleed H. Abdulla. Robust speaker identification based on perceptual log area ratio and Gaussian Mixture Models [C]// Proceedings of the 2004-ICSLP, Jeju Island, South Korea. USA: IEEE, 2004: 1761-1764.

共引文献20

1吕坤朋,孙斌,赵玉晓.基于鸟鸣声及深度学习的鸟类识别方法研究[J].科技通报,2021,37(10):24-30. 被引量：5
2尹聪,白静.基于多窗频谱估计的PLAR特征提取[J].中北大学学报（自然科学版）,2014,35(1):83-87.
3岳应娟,孙钢,蔡艳平.基于小波包振动谱图的柴油机在线故障诊断方法[J].舰船科学技术,2016,38(8):128-133. 被引量：2
4宋凤义,胡太,杨明.基于外观的复合属性学习的细粒度识别[J].数据采集与处理,2016,31(6):1205-1212. 被引量：1
5张赛花,赵兆,许志勇,张怡.基于Mel子带参数化特征的自动鸟鸣识别[J].计算机应用,2017,37(4):1111-1115. 被引量：10
6袁绍锋,杨丰,刘树杰,季飞,黄靖.基于局部形状结构分类的心血管内超声图像中-外膜边界检测[J].电子学报,2018,46(7):1601-1608. 被引量：3
7黄鸿铿,李应.用Bark频谱投影识别低信噪比动物声音[J].智能系统学报,2018,13(4):610-618. 被引量：3
8李应,吴灵菲.用多频带能量分布检测低信噪比声音事件[J].电子与信息学报,2018,40(12):2905-2912. 被引量：3
9陈喆,贾春福,宗楠,郑万通.随机森林在程序分支混淆中的应用[J].电子学报,2018,46(10):2458-2466. 被引量：11
10LI Ying,HUANG Hongkeng,WU Zhibin.Animal Sound Recognition Based on Double Feature of Spectrogram[J].Chinese Journal of Electronics,2019,28(4):667-673.

同被引文献72

1韩鹏飞,陈晓.基于MFCC-IMFCC和GA-SVM的鸟声识别[J].计算机系统应用,2022,31(11):393-399. 被引量：8
2吕坤朋,孙斌,赵玉晓.基于鸟鸣声及深度学习的鸟类识别方法研究[J].科技通报,2021,37(10):24-30. 被引量：5
3Zachary AIDALA,Nicola CHONG,Michael G.ANDERSON,Mark E.HAUBER.Predicted visual sensitivity for short-wavelength light in the brood parasitic cuckoos of New Zealand[J].Chinese Birds,2012(4):295-301. 被引量：3
4王忠德,陆袆玮,陈水华,范忠勇,陈苍松.浙江舟山五峙山列岛夏季繁殖水鸟资源及其分布动态[J].四川动物,2008,27(6):965-969. 被引量：5
5王家喜.果园遥控全自动驱鸟炮[J].山西果树,2009(3):57-57. 被引量：1
6王长路,祃轮元.猎鹰机场驱鸟初探[J].河北林业科技,2010(5):76-77. 被引量：2
7胡灿实,李海洋,叶元兴,陈丽霞,张肖,赵欣如,吴文彪,丁长青.不同驱鸟情景模式对果园害鸟行为的影响[J].生态学杂志,2012,31(9):2365-2370. 被引量：9
8丁剑桥,蒋美其,彭华洲.驱鸟草技术在机场的应用探讨[J].科技创新导报,2012,9(35):240-241. 被引量：7
9颜鑫,李应.利用抗噪幂归一化倒谱系数的鸟类声音识别[J].电子学报,2013,41(2):295-300. 被引量：17
10陈莎莎,李应.结合时-频纹理特征的随机森林分类器应用于鸟声识别[J].计算机应用与软件,2014,31(1):154-157. 被引量：14

引证文献8

1冯郁茜,谢将剑,李星光.基于移动端的嵌入式鸟类识别系统设计与开发[J].电子技术与软件工程,2019(8):184-186. 被引量：1
2乔玉,钱昆,赵子平.基于机器听觉的鸟声识别的中文研究综述[J].复旦学报（自然科学版）,2020,59(3):375-380. 被引量：15
3邢照亮,吴伟银,张正晓,陈麒麟,倪东明.基于C-LSTM的鸟鸣声识别方法[J].科技创新与应用,2021,11(15):15-18. 被引量：2
4李林桦,王学渊,李小霞.融合多维时频特征的环境声识别[J].制造业自动化,2021,43(6):49-52. 被引量：1
5阙鑫华,乔倩,蒋慧,吴旭成,柴晨思,王瑞,郑红.基于改进DTW算法的海岛水鸟鸣声识别应用研究[J].农村经济与科技,2021,32(11):320-322. 被引量：2
6樊翔宇,张聪,杨柳.融合梅尔谱和循环残差的小样本音频分类模型[J].计算机仿真,2022,39(2):195-202. 被引量：2
7于强,张健,殷程凯,陈青.鸟害防治技术及其在农林中的应用展望[J].中国农机化学报,2023,44(3):64-72. 被引量：5
8申小虎,朱翔宇,史洪飞,王传之.基于机器学习鸟声识别算法研究进展[J].生物多样性,2023,31(11):164-189. 被引量：1

二级引证文献26

1许海洋.移动嵌入式课程创新性实验教学模式的探讨[J].内江科技,2020,41(3):157-158. 被引量：2
2邢照亮,吴伟银,张正晓,陈麒麟,倪东明.基于C-LSTM的鸟鸣声识别方法[J].科技创新与应用,2021,11(15):15-18. 被引量：2
3阙鑫华,乔倩,蒋慧,吴旭成,柴晨思,王瑞,郑红.基于改进DTW算法的海岛水鸟鸣声识别应用研究[J].农村经济与科技,2021,32(11):320-322. 被引量：2
4刘志华,陈文洁,陈爱斌.基于自注意力机制时频谱同源特征融合的鸟鸣声分类[J].计算机应用,2022,42(4):1260-1268. 被引量：3
5邱志斌,卢祖文,王海祥,况燕军.基于Mel频谱图和CNN的电网涉鸟故障鸟声识别[J].华南理工大学学报（自然科学版）,2022,50(2):129-136. 被引量：7
6曹飞,康旭,胡云锋,刘雨林.机场智能驱鸟系统技术发展探究[J].数字技术与应用,2022,40(7):30-31. 被引量：1
7李大鹏,周晓彦,叶如,夏煜,徐华南.基于特征选择和GWO-KELM的鸟声识别算法[J].声学技术,2022,41(5):782-788. 被引量：5
8李林丰,薛波.基于改进DTW算法的窨井盖盗损检测方法[J].电声技术,2022,46(9):111-116. 被引量：1
9欧昀,周晓彦,李大鹏.基于多特征融合和组合模型的鸟声识别方法[J].信息技术,2022,46(12):47-51. 被引量：1
10于强,张健,殷程凯,陈青.鸟害防治技术及其在农林中的应用展望[J].中国农机化学报,2023,44(3):64-72. 被引量：5

1胡海峰,郑茂,吴伟坚,王俊,吴建盛.基于多示例多标记迁移学习的蛋白质功能预测[J].中国科学：信息科学,2017,47(11):1538-1550. 被引量：3
2任俊,胡晓峰,朱丰.基于深度学习特征迁移的装备体系效能预测[J].系统工程与电子技术,2017,39(12):2745-2749. 被引量：8
3田寅申,葛冰,臧述升,张自来.实验研究不同燃烧工况对燃烧自激振荡及音频特征的影响[J].热能动力工程,2017,32(10):52-58.
4孙超,吕俊伟,刘峰,周仁来.基于迁移学习的红外图像超分辨率方法研究[J].激光与红外,2017,47(12):1559-1564. 被引量：4
5卞则康,王士同.基于相似度学习的多源迁移算法[J].控制与决策,2017,32(11):1941-1948. 被引量：10
6吴参毅.安防领域人工智能深度神经网络算法的创新突破[J].中国安防,2017,0(11):67-71. 被引量：5
7王文朋,毛文涛,何建樑,窦智.基于深度迁移学习的烟雾识别方法[J].计算机应用,2017,37(11):3176-3181. 被引量：24
8陈俊瑶,毛智慧.英汉“羊”习语的隐喻映射分析[J].安徽文学（下半月）,2017,0(11):71-72.
9高辉,赵小龙,谢诗晴.供给侧改革视角下杭州社区居家养老服务研究[J].建筑与文化,2017(12):209-211. 被引量：2
10唐建勋.由微识真——对牵连运动问题的深度分析[J].中学物理教学参考,2017,0(9):51-53. 被引量：2

数据采集与处理

2017年第6期

浏览历史

内容加载中请稍等...

基于特征迁移的多物种鸟声识别方法被引量：8

参考文献3

二级参考文献33

共引文献20

同被引文献72

引证文献8

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于特征迁移的多物种鸟声识别方法 被引量：8

参考文献3

二级参考文献33

共引文献20

同被引文献72

引证文献8

二级引证文献26

相关作者

相关机构

相关主题

浏览历史

基于特征迁移的多物种鸟声识别方法被引量：8