期刊文献+
共找到97篇文章
< 1 2 5 >
每页显示 20 50 100
不同噪声条件下健听人群水平声源定位能力差异研究
1
作者 李星 何金凯 赵琦 《中国听力语言康复科学杂志》 2024年第5期479-483,共5页
目的探讨不同噪声条件下健听人群水平声源定位能力的差异。方法选取2022年8月~2023年8月在我院检查的听力正常者78例,测试在安静、白噪声35 dB SPL、40 dB SPL和言语噪声40 dB SPL条件下,受试者应答扬声器与发声扬声器的均方根误差(root... 目的探讨不同噪声条件下健听人群水平声源定位能力的差异。方法选取2022年8月~2023年8月在我院检查的听力正常者78例,测试在安静、白噪声35 dB SPL、40 dB SPL和言语噪声40 dB SPL条件下,受试者应答扬声器与发声扬声器的均方根误差(root mean square error,RMSE)和平均应答时间。结果不同噪声条件下受试者平均应答时间比较无显著差异(P>0.05);安静条件下受试者RMSE为10.21°±1.55°,明显低于白噪声35 dB SPL、40 dB SPL和言语噪声40 dB SPL条件下(P<0.05);白噪声40 dB SPL、言语噪声40 dB SPL条件下受试者RMSE分别为15.02°±2.22°和15.16°±2.06°,明显高于白噪声35 dB SPL(P<0.05);安静、白噪声35 dB SPL、白噪声40 dB SPL和言语噪声40 dB SPL条件下受试者对低频、中频和高频刺激声的平均应答时间无显著差异(P>0.05);白噪声35 dB SPL、40 dB SPL和言语噪声40 dB SPL条件下受试者对高频刺激声的RMSE均高于低频、中频刺激声(P<0.05),对中频刺激声的RMSE均高于低频刺激声(P<0.05);安静、白噪声35 dB SPL、40 dB SPL和言语噪声40 dB SPL条件下受试者对前方声源的RMSE明显低于其他方位(P<0.05);安静、白噪声35 dB SPL、40 dB SPL和言语噪声40 dB SPL条件下受试者对前方和其他方位声源的平均应答时间无显著差异(P>0.05);安静、白噪声35 dB SPL、40 dB SPL和言语噪声40 dB SPL条件下,不同性别、年龄受试者RMSE及平均应答时间无显著差异(P>0.05)。结论噪声对健听人群声源识别定位能力有明显影响,在不同噪声条件下,受试者更容易定位来自前方的声源。 展开更多
关键词 听力正常 声源定位 白噪声 言语噪声
下载PDF
基于LMD改进特征提取的三路病理语音识别
2
作者 张楠 陈媛媛 +1 位作者 陈鑫钰 侯懿桃 《电子测量技术》 北大核心 2024年第12期140-147,共8页
针对发音障碍患者发音不够清晰准确,导致病理语音识别率低的问题,提出一种基于LMD改进的Gammatone滤波器组图谱特征提取算法进行三路病理语音识别,首先,该算法采用LMD分解语音信号,对分解后的各语音分量做短时傅里叶变换后进行频率合成... 针对发音障碍患者发音不够清晰准确,导致病理语音识别率低的问题,提出一种基于LMD改进的Gammatone滤波器组图谱特征提取算法进行三路病理语音识别,首先,该算法采用LMD分解语音信号,对分解后的各语音分量做短时傅里叶变换后进行频率合成,提取滤波器组特征及其一阶、二阶差分特征,构成能获取病理语音有效局部特征的LMD-GFbank图谱特征;其次,为了进一步优化网络模型在训练过程中遗漏掉部分有效特征信息,提出一种三路病理语音识别模型;最后,结合语音特征信息进行病理语音识别模型训练和测试。实验结果表明,LMD-GFbank图谱特征在三路病理语音识别模型上的识别率达到了93.36%,优于传统MFCC、GFCC、Fbank特征的语音识别效果,验证了所提算法及识别模型能提升病理语音识别准确率。 展开更多
关键词 发音障碍 局部均值分解 病理语音识别 特征提取
下载PDF
基于局部Transformer的泰语分词和词性标注联合模型
3
作者 朱叶芬 线岩团 +1 位作者 余正涛 相艳 《智能系统学报》 CSCD 北大核心 2024年第2期401-410,共10页
泰语分词和词性标注任务二者之间存在高关联性,已有研究表明将分词和词性标注任务进行联合学习可以有效提升模型性能,为此,提出了一种针对泰语拼写和构词特点的分词和词性标注联合模型。针对泰语中字符构成音节,音节组成词语的特点,采... 泰语分词和词性标注任务二者之间存在高关联性,已有研究表明将分词和词性标注任务进行联合学习可以有效提升模型性能,为此,提出了一种针对泰语拼写和构词特点的分词和词性标注联合模型。针对泰语中字符构成音节,音节组成词语的特点,采用局部Transformer网络从音节序列中学习分词特征;考虑到词根和词缀等音节与词性的关联,将用于分词的音节特征融入词语序列特征,缓解未知词的词性标注特征缺失问题。在此基础上,模型采用线性分类层预测分词标签,采用线性条件随机场建模词性序列的依赖关系。在泰语数据集LST20上的试验结果表明,模型分词F1、词性标注微平均F1和宏平均F1分别达到96.33%、97.06%和85.98%,相较基线模型分别提升了0.33%、0.44%和0.12%。 展开更多
关键词 泰语分词 词性标注 联合学习 局部Transformer 构词特点 音节特征 线性条件随机场 联合模型
下载PDF
数字助听器关键算法研究现状与进展
4
作者 杨荣 马凤领 潘国新 《北京生物医学工程》 2024年第5期531-536,共6页
数字助听器具有听力补偿作用,可以在不损伤听力障碍患者听力的情况下有效提高其听力水平,是目前解决听力障碍的主要途径。近年来随着科技进步,深度学习、麦克风阵列、计算场景分析等技术的改进和发展极大推动了数字助听器的发展。本文... 数字助听器具有听力补偿作用,可以在不损伤听力障碍患者听力的情况下有效提高其听力水平,是目前解决听力障碍的主要途径。近年来随着科技进步,深度学习、麦克风阵列、计算场景分析等技术的改进和发展极大推动了数字助听器的发展。本文综述了响度补偿、噪声处理、语音增强、回声消除等技术在数字助听器中的应用现状,归纳各技术的研究成果,探讨其局限性和改进方式,并对未来数字助听器的发展做了展望。 展开更多
关键词 数字助听器 响度补偿 语音增强 声源定位 回声消除
下载PDF
一种基于Transformer模型的特征增强算法及其应用研究
5
作者 李俊华 段志奎 于昕梅 《佛山科学技术学院学报(自然科学版)》 CAS 2024年第3期27-34,共8页
Transformer模型在自动语音识别(ASR)任务中展现出优秀的性能,但在特征提取方面存在两个问题:一是模型集中于全局特征交互信息提取,忽略了其他有用的特征信息,如局部特征交互信息;二是模型对低层特征交互信息的利用不够充分。为了解决... Transformer模型在自动语音识别(ASR)任务中展现出优秀的性能,但在特征提取方面存在两个问题:一是模型集中于全局特征交互信息提取,忽略了其他有用的特征信息,如局部特征交互信息;二是模型对低层特征交互信息的利用不够充分。为了解决这两个问题,提出了卷积线性映射(CMLP)模块以强化局部特征交互,并设计低层特征融合(LF)模块来融合高低层特征。通过整合这些模块,构建了CLformer模型。在两个中文普通话数据集(Aishell-1和HKUST)上进行实验,结果表明,CLformer显著提升了模型性能,在Aishell-1上较基线提高0.3%,在HKUST上提高0.5%。 展开更多
关键词 Transformer模型 自动语音识别 特征增强 局部特征 特征融合
下载PDF
口部定位疗法联合引导式教育治疗言语语言障碍儿童的疗效观察 被引量:6
6
作者 张玲 吴浪龙 +1 位作者 康怀鑫 徐高红 《听力学及言语疾病杂志》 CAS CSCD 北大核心 2023年第1期26-30,共5页
目的 探讨口部定位疗法联合引导式教育治疗言语语言障碍儿童的临床疗效。方法 采用随机数字表法将2018年7月~2019年12月收治的84例言语语言障碍儿童分为对照组与观察组,每组42例。对照组给予常规言语训练,观察组给予常规语言训练的同时... 目的 探讨口部定位疗法联合引导式教育治疗言语语言障碍儿童的临床疗效。方法 采用随机数字表法将2018年7月~2019年12月收治的84例言语语言障碍儿童分为对照组与观察组,每组42例。对照组给予常规言语训练,观察组给予常规语言训练的同时进行口部定位治疗联合引导式教育,1次/天,40分/次,5次/周,4周为1疗程,连续治疗3个疗程。治疗前后,分别采用简易口部运动功能量表、Frenchay汉语版构音障碍检测表、语音清晰度量表、Gesell发育量表评估两组患儿的口部运动功能、构音情况、语音清晰度、语言行为能力,并采用汉语儿童语言发育评定法(S-S)评估俩两组患儿的临床疗效。结果 治疗前,两组患儿的口部运动功能评分、构音、语音清晰度及语言行为评分比较,差异无统计学意义(P>0.05)。治疗3个疗程后,两组患儿的口部运动功能评分、构音、语音清晰度及语言行为评分均有明显改善,且观察组明显高于对照组,差异有统计学意义(P<0.05);对照组的治疗总有效率为73.81%,观察组为95.24%,两组比较差异有统计学意义(P<0.05)。结论 口部定位疗法联合引导式教育能明显促进言语语言障碍儿童康复,且疗效显著。 展开更多
关键词 口部定位治疗 引导式教育 言语语言障碍 儿童 疗效
下载PDF
单侧聋人工耳蜗植入长期随访1例
7
作者 姜子刚 王金平 +1 位作者 赵东 李春娇 《中国听力语言康复科学杂志》 2023年第5期486-488,515,共4页
目的探讨单侧聋(single-sided deafness,SSD)成人患者人工耳蜗植入远期效果。以为单侧聋患者人工耳蜗植入适应症提供借鉴和参考。方法选择一例单侧聋20年成人进行人工耳蜗植入,随访其残余听力、言语识别率、声源定位能力、以及言语空间... 目的探讨单侧聋(single-sided deafness,SSD)成人患者人工耳蜗植入远期效果。以为单侧聋患者人工耳蜗植入适应症提供借鉴和参考。方法选择一例单侧聋20年成人进行人工耳蜗植入,随访其残余听力、言语识别率、声源定位能力、以及言语空间和听觉质量主观量表(SQQ)。结果该患者术后残余听力早期保持良好,但五年后残余听力未能保留。言语识别率随术后随访时间延长而有所提升,但没达到较高水平。声源定位能力随时间有所改善。随访SQQ量表可以看出SSD患者人工耳蜗植入后对于言语理解、空间听觉、声音聆听能力都有所帮助,尤其对于空间听觉帮助较大。结论SSD患者人工耳蜗植入后,可以改善患者噪声下的言语识别率与声源定位能力及生活质量。建议进一步大样本研究,为SSD患者人工耳蜗植入适应症提供科学依据。 展开更多
关键词 单侧聋 人工耳蜗 声源定位 言语识别
下载PDF
基于双阶段Conv-Transformer的时频域语音增强算法 被引量:3
8
作者 沈学利 田桂源 +1 位作者 姜彦吉 马琳琳 《计算机工程》 CAS CSCD 北大核心 2023年第6期123-130,共8页
频域语音增强算法通常存在相位失配问题,而相位信息对于语音增强任务非常重要。时域语音增强算法可以有效解决相位失配问题,但是噪声和语音在频域中更易分离。为了实现时域和频域语音增强算法的优势互补,提出一种基于双阶段Conv-Transfo... 频域语音增强算法通常存在相位失配问题,而相位信息对于语音增强任务非常重要。时域语音增强算法可以有效解决相位失配问题,但是噪声和语音在频域中更易分离。为了实现时域和频域语音增强算法的优势互补,提出一种基于双阶段Conv-Transformer的时频域语音增强算法。采用编解码结构,将带噪语音经过短时傅里叶变换得到的频域特征和一维卷积处理后得到的时域特征作为输入。考虑到Transformer擅长提取语音序列的全局依赖关系,卷积神经网络可以关注局部特征,为了更好地提取时域和频域中的局部信息和全局信息,设计一种Conv-Transformer模块。在此基础上,联合时域和频域损失函数对模型进行优化,使得模型可以同时学习语音在时域和频域中的分布规律。实验结果表明,与单一域的语音增强算法相比,该算法具有更好的降噪效果,增强后的语音感知质量、短时可懂度、信号失真测度、噪声失真测度、综合质量测度分别为3.04、0.953、4.34、3.55、3.69。 展开更多
关键词 语音增强 时频域 卷积神经网络 局部信息 全局信息
下载PDF
基于传声器阵列的声源定位 被引量:9
9
作者 朱广信 陈彪 金蓉 《电声技术》 北大核心 2003年第1期34-37,共4页
文中对利用传声器进行语音声源定位时所面临的几个问题作了讨论。同时分析比较了几类主要的源定位方法,并给出了基于可控波束形成的源定位的仿真结果。
关键词 传声器阵列 声源定位 语音 可控波束形成 仿真 语音信号处理
下载PDF
基于麦克风阵列的声源定位研究 被引量:21
10
作者 邵怀宗 林静然 +2 位作者 彭启琮 居太亮 徐异凌 《云南民族大学学报(自然科学版)》 CAS 2004年第4期256-258,267,共4页
 基于麦克风阵列的声源定位是有效声源提取的前提和基础,其技术在多媒体通信中得到了广泛的应用.讨论了基于麦克风均匀线阵和均匀圆阵的声源定位方法,并进行了仿真,其结果表明这两种模型均能有效地提取出声源的位置.并给出了算法的硬...  基于麦克风阵列的声源定位是有效声源提取的前提和基础,其技术在多媒体通信中得到了广泛的应用.讨论了基于麦克风均匀线阵和均匀圆阵的声源定位方法,并进行了仿真,其结果表明这两种模型均能有效地提取出声源的位置.并给出了算法的硬件实现的原理框图. 展开更多
关键词 麦克风阵列 声源定位 原理图
下载PDF
面向语音情感识别的Gabor分块局部二值模式特征 被引量:5
11
作者 陶华伟 柳晶晶 +3 位作者 梁瑞宇 查诚 张昕然 赵力 《信号处理》 CSCD 北大核心 2016年第5期505-511,共7页
谱特征在语音情感识别中起到了重要的作用,然而现有的谱特征仍未能充分表达谱图中的语音情感信息。为研究语音情感与谱图之间的联系,提出了一种面向语音情感识别的Gabor分块局部二值模式特征(GBLBP)。首先,获取情感语音的对数能量谱;... 谱特征在语音情感识别中起到了重要的作用,然而现有的谱特征仍未能充分表达谱图中的语音情感信息。为研究语音情感与谱图之间的联系,提出了一种面向语音情感识别的Gabor分块局部二值模式特征(GBLBP)。首先,获取情感语音的对数能量谱;然后,采用多尺度,多方向的Gabor小波对对数能量谱进行处理,得到Gabor谱图;再次,对每张Gabor谱图进行分块,采用局部二值模式提取每个块的局部能量分布信息;最后,将提取到的所有特征级联,得到GBLBP特征。EMO-DB库及中文语音库上的实验结果表明:GBLBP特征的平均加权召回率比MFCC高了9%~10%,识别性能显著优于众多谱特征,且与现有声学特征有较好的融合性。 展开更多
关键词 GABOR小波 局部二值模式 语音情感识别 谱特征
下载PDF
基于局部余弦变换的2.4kb/s低比特率语音编码 被引量:3
12
作者 董恩清 汪一鸣 +2 位作者 李宏亮 侯兴松 刘贵忠 《西安交通大学学报》 EI CAS CSCD 北大核心 2003年第4期388-391,共4页
系统地设计了一个基于局部余弦变换的 2 4kb/s低比特率的语音编码器 .对局部余弦变换系数采用分维矢量量化方法进行量化 ,码书设计采用LGB算法 .编码中的码书搜索采用树形快速搜索算法 .通过主观非正式听力测试和客观参数评价 ,从理解... 系统地设计了一个基于局部余弦变换的 2 4kb/s低比特率的语音编码器 .对局部余弦变换系数采用分维矢量量化方法进行量化 ,码书设计采用LGB算法 .编码中的码书搜索采用树形快速搜索算法 .通过主观非正式听力测试和客观参数评价 ,从理解性和自然度两方面来看 ,用设计的 2 4kb/s低比特率的编码方法编码的语音质量比FS10 15 (LPC 10e)编码标准编码的语音质量要好 ,而且具有较强的鲁棒性 。 展开更多
关键词 局部余弦变换 语音编码 低比特率 变换编码 矢量量化
下载PDF
人机交互中的声源定位与增强方法 被引量:1
13
作者 殷瑞祥 李文东 《数据采集与处理》 CSCD 北大核心 2015年第2期328-335,共8页
基于人机交互的实际应用场景,提出了一种交互目标声源三维定位与语音增强算法。该算法首先在广义相关法的基础上提出一种声达时延差的估计方法,通过由6个麦克风构成的平行均匀线阵接收模型,实现对目标声源的三维定位;然后在交互目标声... 基于人机交互的实际应用场景,提出了一种交互目标声源三维定位与语音增强算法。该算法首先在广义相关法的基础上提出一种声达时延差的估计方法,通过由6个麦克风构成的平行均匀线阵接收模型,实现对目标声源的三维定位;然后在交互目标声源定位的基础上,通过调整时延波束叠加的权值,实现对目标语音的增强。仿真实验结果表明,文中提出的算法能够准确定位目标声源并对目标语音进行有效增强。在信噪比大于1.5dB的环境中,该算法可使目标声源达到98%以上定位精度,5dB以上信噪比改善,同时算法运算量小且易于硬件实现。 展开更多
关键词 声源定位 语音增强 人机交互 麦克风阵列 近场语音模型
下载PDF
MFSC系数特征局部有限权重共享CNN语音识别 被引量:9
14
作者 黄玉蕾 罗晓霞 刘笃仁 《控制工程》 CSCD 北大核心 2017年第7期1507-1513,共7页
针对传统语音识别应用中识别效果不理想的问题,提出一种基于美尔谱系数(MFSC)特征的有限局部权重共享卷积神经网络(CNN)语音识别。首先,借鉴图像处理中对输入图像信息的处理方式,构建语音信号的二维阵列特征映射输入形式,每个映射表示... 针对传统语音识别应用中识别效果不理想的问题,提出一种基于美尔谱系数(MFSC)特征的有限局部权重共享卷积神经网络(CNN)语音识别。首先,借鉴图像处理中对输入图像信息的处理方式,构建语音信号的二维阵列特征映射输入形式,每个映射表示为含静态数据、一阶导数、二阶导数的MFSC系数特征,便于应用图像处理方式进行识别;其次,引入图像处理的卷积神经网络,并且针对语音信号特征的局部特性,构建有限局部权重共享卷积神经网络学习算法,提高语音信号辨识度并降低算法复杂度;最后,通过实验对所提算法进行验证,并且给出算法参数变化影响实验,为具体应用提供依据。 展开更多
关键词 卷积神经网络 局部权重共享 语音识别 特征映射 美尔谱系数
下载PDF
入湘三峡移民的语言态度及其对语言交际的影响 被引量:10
15
作者 刘青松 《中南大学学报(社会科学版)》 2007年第1期105-107,共3页
语言(方言)本无好坏之分,但是由于人们年龄、性别、文化程度以及所处的环境、文化背景等的不同,往往对不同的语言作出不同的评价。入湘三峡移民身处多种语言(方言)并存的地区,对不同的话持有不同看法:年龄越小、文化程度越高,越认同普... 语言(方言)本无好坏之分,但是由于人们年龄、性别、文化程度以及所处的环境、文化背景等的不同,往往对不同的语言作出不同的评价。入湘三峡移民身处多种语言(方言)并存的地区,对不同的话持有不同看法:年龄越小、文化程度越高,越认同普通话或当地话;反之,年龄越大、文化程度越低,就越喜欢家乡话。移民的语言态度直接或间接地影响着他们的语言交际。 展开更多
关键词 三峡移民 语言态度 语言交际 当地话 家乡话
下载PDF
麦克风阵列语音增强技术及其应用 被引量:13
16
作者 洪鸥 《微计算机信息》 北大核心 2006年第01S期142-144,179,共4页
本文简要叙述了应用麦克风阵列进行语音增强的原理及方法。且由于麦克风阵列在实际语音处理时具有良好的拾取语音能力及噪声鲁棒性,本文将介绍该技术在车载系统环境、机器人语音识别、大型场所的记录会议、助听装置及声源定位等系统中... 本文简要叙述了应用麦克风阵列进行语音增强的原理及方法。且由于麦克风阵列在实际语音处理时具有良好的拾取语音能力及噪声鲁棒性,本文将介绍该技术在车载系统环境、机器人语音识别、大型场所的记录会议、助听装置及声源定位等系统中的应用。 展开更多
关键词 麦克风阵列 声源定位 语音增强
下载PDF
一种改进的信号灵活分割算法及语音信号清浊音的自动分割 被引量:2
17
作者 董恩清 刘贵忠 +1 位作者 周亚同 顿玉洁 《电子学报》 EI CAS CSCD 北大核心 2001年第10期1364-1367,共4页
文中主要对王永忠等提出的灵活分割算法存在的问题做了相应的改进 ,并做了比较分析 ,然后将改进后的分割算法应用于语音信号的清 -浊音自动分割中 .经过大量的理论模型与实际语音信号验证该改进后的算法确实解决了二进分割算法及王永忠... 文中主要对王永忠等提出的灵活分割算法存在的问题做了相应的改进 ,并做了比较分析 ,然后将改进后的分割算法应用于语音信号的清 -浊音自动分割中 .经过大量的理论模型与实际语音信号验证该改进后的算法确实解决了二进分割算法及王永忠方法存在的问题 ,达到了对信号自适应有效分割 .仍然采用Wesfreid等提出的清 -浊音识别准则 ,将新的分割方法应用到实际语音信号的清 -浊音自动分割中 ,不仅同样产生较好划分结果 。 展开更多
关键词 信号分割算法 二叉树 局部余弦变换 语音信号 语音分割
下载PDF
明代方志书写烈女抗暴“言论”模式探析 被引量:13
18
作者 刘正刚 《暨南学报(哲学社会科学版)》 CSSCI 北大核心 2014年第2期119-128,164,共10页
明代纂修方志已成为官府事务之一,列女传是方志重要组成部分,并已趋于模式化倾向。方志书写烈女在社会动荡中面对暴力侵害时多会伴随"言论"而自杀或被杀,凸显了烈女们的儒家正统形象。但方志书写的这些生活于不同时代、不同... 明代纂修方志已成为官府事务之一,列女传是方志重要组成部分,并已趋于模式化倾向。方志书写烈女在社会动荡中面对暴力侵害时多会伴随"言论"而自杀或被杀,凸显了烈女们的儒家正统形象。但方志书写的这些生活于不同时代、不同地域、不同阶层的烈女抗暴"言论"却呈现了几种模式化现象,揭示了编修者通过对烈女"言论"的虚拟或想象,以此向社会推广儒家正统的忠孝节义观念。 展开更多
关键词 明代 地方志 烈女 言论
下载PDF
基于子带可控响应功率的多声源定位方法 被引量:6
19
作者 倪志莲 蔡卫平 张怡典 《计算机工程与应用》 CSCD 2013年第24期205-209,共5页
为了提高多个说话人情况下麦克风阵列的定位性能,提出基于子带可控响应功率的多声源定位算法。该算法将语音信号频域分为7个子带,在每个子带计算相位变换加权的可控响应功率函数,在声源空间搜索其最大值得到声源位置的初始估计。根据语... 为了提高多个说话人情况下麦克风阵列的定位性能,提出基于子带可控响应功率的多声源定位算法。该算法将语音信号频域分为7个子带,在每个子带计算相位变换加权的可控响应功率函数,在声源空间搜索其最大值得到声源位置的初始估计。根据语音信号频率的稀疏性,这些初始估计包含多个声源的位置,运用会聚聚类算法得到最终的声源位置估计。仿真和实验表明,在有2个说话人,10 dB信噪比,较强混响的条件下,该算法比传统算法的定位正确率提高了约4%,额外率降低了约7%。 展开更多
关键词 麦克风阵列 多声源定位 子带可控响应功率 聚类
下载PDF
基于次梯度投影的数字助听器自适应声源定位方法 被引量:2
20
作者 王青云 赵力 邹采荣 《东南大学学报(自然科学版)》 EI CAS CSCD 北大核心 2009年第4期667-672,共6页
该方法在特征值分解算法的基础之上,利用次梯度投影方法自适应估计声源到麦克风的脉冲响应系数,进而估计出各麦克风之间时延,并利用几何方法定位声源在3D空间的位置.与传统的基于广义互相关的时延估计算法相比,提出的算法在房间反射与... 该方法在特征值分解算法的基础之上,利用次梯度投影方法自适应估计声源到麦克风的脉冲响应系数,进而估计出各麦克风之间时延,并利用几何方法定位声源在3D空间的位置.与传统的基于广义互相关的时延估计算法相比,提出的算法在房间反射与共振的情况下定位精度更高;与基于NLMS算法的自适应特征值分解时延估计算法相比,提出的算法收敛速度更快,并且在强噪声的情况下鲁棒性更强.基于眼镜数字助听器声源定位系统的实验与仿真研究了麦克风阵不同的几何尺寸对算法性能和定位精度的影响,证明了在不同信噪比情况下该算法都能有效定位声源的3D空间位置. 展开更多
关键词 声源定位 自适应次梯度投影算法 数字助听器
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部