期刊文献+
共找到3篇文章
< 1 >
每页显示 20 50 100
基于卷积神经网络的声音场景识别
1
作者 陈秋菊 《信息与电脑》 2018年第18期96-98,共3页
针对各种自然环境声对声音场景识别的影响,提出一种基于卷积神经网络(Convolutional Neural Networks,CNN)的声音场景识别方法。首先,采用Mel滤波器对声音场景提取Mel能量谱。接着,采用滑动窗口函数对Mel能量谱分片处理。然后,采用CNN对... 针对各种自然环境声对声音场景识别的影响,提出一种基于卷积神经网络(Convolutional Neural Networks,CNN)的声音场景识别方法。首先,采用Mel滤波器对声音场景提取Mel能量谱。接着,采用滑动窗口函数对Mel能量谱分片处理。然后,采用CNN对Mel能量谱片段进行两阶段训练,并提取CNN特征。最后,采用随机森林(Random Forests,RF)对CNN特征进行识别分类。通过运用此种方法对IEEE DCASE2016数据集进行实验,结果表明,该方法识别性能高于常规方法。 展开更多
关键词 声音场景识别 Mel能量谱 卷积神经网络 随机森林
下载PDF
智能辅听系统对改善人工耳蜗植入者听声效果的研究
2
作者 项丽阳 李娟娟 +5 位作者 韩彦 王金剑 杨典 杨婷君 银力 黄穗 《听力学及言语疾病杂志》 CAS CSCD 北大核心 2024年第1期43-48,共6页
目的了解诺尔康人工耳蜗处理器中搭载的智能辅听系统自动识别声音场景并进行智能化的声音处理策略配置及其在改善人工耳蜗植入者主客观听声效果方面的作用。方法为评估诺尔康智能辅听系统中声音场景识别模块的性能:①为评估场景识别模... 目的了解诺尔康人工耳蜗处理器中搭载的智能辅听系统自动识别声音场景并进行智能化的声音处理策略配置及其在改善人工耳蜗植入者主客观听声效果方面的作用。方法为评估诺尔康智能辅听系统中声音场景识别模块的性能:①为评估场景识别模块的性能,在隔声室环境中播放预设的语音、噪声、带噪语音、纯音乐主带人声音乐5种测试音频(每类测试音频包括6~9个5 min时长的测试文件),统计各类音频的识别准确率和场景切换次数;②为评估该系统中语音增强模块中的ABeam技术的降噪效果,招募13例诺尔康人工耳蜗植入者,分别在ABeam“ON”和“OFF”程序下,在90°、180°、270°三种噪声源角度,测试其言语识别率,并对其主观听声感受进行VAS评估。结果场景识别模块对各类声音场景的识别准确率分别为语音99%±4%,噪声96%±9%,带噪语音94%±12%,纯音乐94%±15%,带人声音乐92%±13%,预测准确度高;5 min内的场景切换次数分别为语音1.1±0.3次,噪声1.4±0.7次,带噪语音1.3±0.5次,纯音乐1.4±0.8次,带人声音乐1.3±0.5次,预测稳定性较高。当噪声来自侧后方而语音来自正前方时,自适应双麦降噪算法ABeam能够在信噪比为5 dB的噪声环境下显著提高受试者的言语识别率(P<0.001),平均言语识别率提升15.92%。尤其是当噪声来自于正后方180°,开启ABeam能够让受试者的言语识别率显著提高28.68%(P<0.01)。结论智能辅听系统能够帮助人工耳蜗植入者在不同环境下自动选择合适的声音处理策略,提升其言语可懂度和听声效果。 展开更多
关键词 人工耳蜗 智能辅听系统 声音场景识别 声音处理策略 ABeam
下载PDF
基于谱聚类的增强神经网络模型
3
作者 蒋大灿 《电脑编程技巧与维护》 2023年第7期45-47,共3页
卷积神经网络(CNN)因其容易产生过拟合而困扰着广大研究者。产生过拟合的重要原因在于模型往往局限于局部最优解。针对此问题,提出了基于谱聚类的增强神经网络模型。使用谱聚类算法对验证集进行聚类,以聚类结果为依据将单任务模型扩展... 卷积神经网络(CNN)因其容易产生过拟合而困扰着广大研究者。产生过拟合的重要原因在于模型往往局限于局部最优解。针对此问题,提出了基于谱聚类的增强神经网络模型。使用谱聚类算法对验证集进行聚类,以聚类结果为依据将单任务模型扩展为多任务学习模型。用公开的声音场景识别数据集进行实验,实验结果表明,基于谱聚类的增强神经网络模型可以有效降低过拟合风险,提升模型的测试精度。该方法适用于除声音场景识别(ASC)领域的其他领域。 展开更多
关键词 谱聚类 卷积神经网络 多任务学习 声音场景识别
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部