-
题名基于配对特征融合的声学场景分类方法
被引量:1
- 1
-
-
作者
沈昕昊
陈嘉烨
宋晓宁
-
机构
江南大学人工智能与计算机学院
-
出处
《计算机应用研究》
CSCD
北大核心
2023年第6期1771-1776,共6页
-
基金
国家社会科学基金重大资助项目(21&ZD166)
国家自然科学基金资助项目(61876072)
江苏省自然基金资助项目(BK20221535)。
-
文摘
在近些年的研究中,单设备的声音场景分类已经取得不错的效果,然而多设备声音场景分类的进展缓慢。为了解决多设备分类时样本数量差异大的问题,提出了一种配对特征融合算法。通过计算每一对配对样本在频谱图上的差异,将这些差异累加后取平均,可以获得各个设备的平均频谱特征,用于设备样本的转换。该算法在增加设备样本数量的同时有效提升了模型的泛化能力。同时,为了获取全局信息,提出了一种轻量级注意力模块,通过对输入特征在频域上压缩后进行自注意力操作,可以在减少计算量的基础上使模型专注于整个声音序列信息的训练,实验结果表明所提算法在模型大小和分类精度方面与其他方法相比具有较好的优势。
-
关键词
声学场景分类
配对特征融合
轻量级卷积神经网络
多设备
注意力机制
-
Keywords
acoustic scene classification
paired feature fusion
lightweight convolutional neural networks
multiple devices
attention mechanism
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-