期刊文献+
共找到42篇文章
< 1 2 3 >
每页显示 20 50 100
融合注意力机制的CS-BiLSTM深度回声消除算法 被引量:2
1
作者 许春冬 王茹霞 +2 位作者 徐锦武 凌贤鹏 黄乔月 《现代电子技术》 2023年第5期55-59,共5页
在全双工通信系统中,声学回声会降低用户的体验,针对在双向通话场景下自适应滤波算法消除声学回声效果不理想以及非线性声学回声难以消除的问题,提出一种注意力机制与BiLSTM网络相结合的CS-BiLSTM深度声学回声消除算法。首先通过构建BiL... 在全双工通信系统中,声学回声会降低用户的体验,针对在双向通话场景下自适应滤波算法消除声学回声效果不理想以及非线性声学回声难以消除的问题,提出一种注意力机制与BiLSTM网络相结合的CS-BiLSTM深度声学回声消除算法。首先通过构建BiLSTM网络提取语音的时序特征,之后引入通道和空间注意力机制提取回声信号的空间特征信息,并融合均方根误差与平均绝对误差提出一种新的损失函数,提高模型的鲁棒性。改进后的CS-BiLSTM网络模型能够获得清晰的语音信号,具有更好的回声消除性能。仿真结果表明,在非线性回声和双向通话环境下,与其他几种参考算法相比,所提出的CS-BiLSTM算法在感知语音质量评价方面明显优于其他算法,更有效地实现了回声消除,此外,该算法结构简单且模型参数量更少。 展开更多
关键词 回声消除 双工通信 注意力机制 特征提取 语音信号获得 损失函数优化 回声系统模型 对比实验
下载PDF
PSO-BP神经网络在语音干扰效果评估中的应用 被引量:5
2
作者 许亮 赵松波 +3 位作者 高强 莫家庆 吕小毅 郭翔 《现代电子技术》 北大核心 2019年第6期43-46,50,共5页
为了克服BP神经网络在连续语音数据干扰效果评估过程中存在的弊端缺陷,提出一种利用粒子群优化算法神经网络的客观语音干扰效果评估方法。该方法利用Mel倒谱技术提取所得的连续语音数据特征参数作为模型输入,再通过粒子群优化对BP神经... 为了克服BP神经网络在连续语音数据干扰效果评估过程中存在的弊端缺陷,提出一种利用粒子群优化算法神经网络的客观语音干扰效果评估方法。该方法利用Mel倒谱技术提取所得的连续语音数据特征参数作为模型输入,再通过粒子群优化对BP神经网络的初始权系进行多点优化,建立了粒子群算法优化的BP神经网络模型,通过优化后的神经网络模型实现输入值到对应主观评价MOS证,对比表明,粒子群算法优化后的BP神经网络模型,其收敛速度较传统BP在4%以内,模型相关系数和标准差更加接近理想参数。 展开更多
关键词 干扰 BP神经网络 粒子群优化算法 Mel倒谱 特征参数 主观MOS
下载PDF
OM-LSA和小波阈值去噪结合的语音增强 被引量:3
3
作者 刘凤增 李国辉 李博 《计算机科学与探索》 CSCD 2011年第6期547-552,共6页
针对OM-LSA(optimally modified log-spectral amplitude estimator)算法产生的残留噪声,提出了一种结合OM-LSA和小波阈值去噪的语音增强算法。首先,进行语音对数幅度谱估计;然后,估计残留噪声,利用带噪语音第一级小波系数和语音不存在... 针对OM-LSA(optimally modified log-spectral amplitude estimator)算法产生的残留噪声,提出了一种结合OM-LSA和小波阈值去噪的语音增强算法。首先,进行语音对数幅度谱估计;然后,估计残留噪声,利用带噪语音第一级小波系数和语音不存在时的增益函数进行估计,解决了常规方法对增强后语音噪声估计不准确的问题;最后,在小波域利用软阈值法对语音信号进行阈值处理。实验结果表明,提出的算法有效地去除了OM-LSA算法中的残余噪声,在分段信噪比(segmental signal-to-noise ratio,SegSNR)和对数谱失真(log-spectral distortion,LSD)等指标评价上有较大的提高。 展开更多
关键词 小波阈值去噪 残留噪声 最优改进对数谱幅度估计(OM—LSA) 语音增强
下载PDF
多说话人语音环境下目标说话人声纹验证方法研究 被引量:2
4
作者 陈家峥 张斌 李雅明 《物联网技术》 2024年第2期3-7,10,共6页
声纹身份验证技术越来越多的应用于IoT智能设备中,针对多说话人语音环境,应用传统VAD模块的声纹验证系统错误拒绝率严重升高,甚至无法工作。本文从语音分离技术入手,设计实现了一种只对目标说话人触发的轻量化SD-VAD模型。首先,通过在... 声纹身份验证技术越来越多的应用于IoT智能设备中,针对多说话人语音环境,应用传统VAD模块的声纹验证系统错误拒绝率严重升高,甚至无法工作。本文从语音分离技术入手,设计实现了一种只对目标说话人触发的轻量化SD-VAD模型。首先,通过在基线模型中引入CNN和BiLSTM结构,使神经网络获得更强大的特征提取能力和上下文依赖性。其次,重新定义类内加权损失,对不同的分类混淆错误施加不同的惩罚,使模型重点关注目标说话人相关的分类,最大程度保留目标语音的完整性。最后,本文将SD-VAD应用于声纹验证模型的前端。实验结果表明,本文改进的结构相较于基线模型,mAP提升了1.5%,目标说话人类的AP提升了1.9%。相较于传统VAD模块,使基于ECAPA-TDNN的声纹验证系统错误拒绝率(FRR)降低了13.95%,较大提升了声纹验证系统的鲁棒性和使用灵活性。 展开更多
关键词 物联网 声纹验证 语音分离 多说话人环境 语音活动检测(VAD) ECAPA-TDNN
下载PDF
基于CNN-HMM和RNN的维吾尔语语音识别 被引量:3
5
作者 穆凯代姆罕·伊敏江 艾斯卡尔·艾木都拉 米吉提·阿不里米提 《现代电子技术》 2021年第11期172-176,共5页
神经网络模型的发展给资源匮乏语言的语音及语言信息处理带来新的机遇,基于神经网络的少数民族语言的语音识别系统效率及准确率比传统方法有了很大提高。对于大词汇量语音识别系统,适当选择声学模型和语言模型很重要。对较小的维吾尔语... 神经网络模型的发展给资源匮乏语言的语音及语言信息处理带来新的机遇,基于神经网络的少数民族语言的语音识别系统效率及准确率比传统方法有了很大提高。对于大词汇量语音识别系统,适当选择声学模型和语言模型很重要。对较小的维吾尔语语料库(THUYG公开语料库)进行了深入研究,采用Kaldi开源语音识别平台将深度的CNN-HMM作为声学模型,通过理论分析和对比实验,分别在N-gram和RNN两种语言模型上进行对比实验。实验结果表明,基于神经网络RNN语言模型的系统有更好的识别效果,提升了维吾尔语语音识别准确率,并将词错误率降到15.06%。 展开更多
关键词 语音识别 维吾尔语 声学模型 语言模型 CNN-HMM N-GRAM语言模型 循环神经网络 Kaldi
下载PDF
基于特征融合的正常语音和低语语音分类系统
6
作者 王睿 艾斯卡尔·艾木都拉 《现代电子技术》 2023年第4期161-165,共5页
低语(Whisper Speech)是指凑近别人耳朵小声说话,即私下里轻微的说话声。低语是一种常见的发音方式,由于发音方式比较特殊,其与正常语音在特征方面有较大差异。目前,区分低语和正常语音多数是借助于各类软件对某些声学特征进行直接观测... 低语(Whisper Speech)是指凑近别人耳朵小声说话,即私下里轻微的说话声。低语是一种常见的发音方式,由于发音方式比较特殊,其与正常语音在特征方面有较大差异。目前,区分低语和正常语音多数是借助于各类软件对某些声学特征进行直接观测,比如常见的频谱图等,而对于二者的分类模型研究较少,且没有一个公开的汉语低语语料库。为此,首先创建一个汉语低语语料库;其次,建立一种鲁棒的低语与正常语音的分类系统,提出一种基于卷积神经网络(CNN)的特征融合方法,该方法将光谱平坦度(Spectral Flatness)和语音均方根(Root Mean Square,RMS)相结合。实验结果表明,所提出的特征融合方法能够提高低语与正常语音分类系统的性能,与基线模型相比,准确率提高21.67%。 展开更多
关键词 低语 声学特征 汉语语料库 分类器 卷积神经网络 光谱平坦度 均方根 特征融合
下载PDF
基于子带可控响应功率的多声源定位方法 被引量:6
7
作者 倪志莲 蔡卫平 张怡典 《计算机工程与应用》 CSCD 2013年第24期205-209,共5页
为了提高多个说话人情况下麦克风阵列的定位性能,提出基于子带可控响应功率的多声源定位算法。该算法将语音信号频域分为7个子带,在每个子带计算相位变换加权的可控响应功率函数,在声源空间搜索其最大值得到声源位置的初始估计。根据语... 为了提高多个说话人情况下麦克风阵列的定位性能,提出基于子带可控响应功率的多声源定位算法。该算法将语音信号频域分为7个子带,在每个子带计算相位变换加权的可控响应功率函数,在声源空间搜索其最大值得到声源位置的初始估计。根据语音信号频率的稀疏性,这些初始估计包含多个声源的位置,运用会聚聚类算法得到最终的声源位置估计。仿真和实验表明,在有2个说话人,10 dB信噪比,较强混响的条件下,该算法比传统算法的定位正确率提高了约4%,额外率降低了约7%。 展开更多
关键词 麦克风阵列 多声源定位 子带可控响应功率 聚类
下载PDF
一种心音信号盲源分离方法 被引量:10
8
作者 孙科学 成谢锋 《电子测量与仪器学报》 CSCD 2012年第6期498-502,共5页
为了有效实现单路心音混合信号的盲分离,本文提出了一种基于EMD分解和独立成分函数的单路含噪心音信号盲源分离的方法。首先讨论了单路混合信号的分离模型,含噪信号预处理的方法,以及如何利用EMD变换进行窄带分层和获取独立成分函数的技... 为了有效实现单路心音混合信号的盲分离,本文提出了一种基于EMD分解和独立成分函数的单路含噪心音信号盲源分离的方法。首先讨论了单路混合信号的分离模型,含噪信号预处理的方法,以及如何利用EMD变换进行窄带分层和获取独立成分函数的技术;然后通过独立成分函数作为基函数对单路含噪心音信号进行分解,使单路心音信号由一维向量转变为多维向量,从而实现心音信号的盲源分离;最后通过实际的心音分离实验,验证了本方法的实用性,其分离结果的相似度达到0.9792。 展开更多
关键词 盲源分离 经验模值分解 独立基函数 单路含噪信号
下载PDF
基于神经网络的语音信号识别与分类 被引量:1
9
作者 薛雅洁 贺红霞 杨祎 《现代电子技术》 2023年第24期79-84,共6页
针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语... 针对基于深度神经网络的端对端的语音识别技术展开研究,通过深度全序列卷积神经网络(DFCNN)声学模型和Transformer语言模型搭建一种端对端的语音识别系统。该系统完成对模型及数据的训练,实现对多字符中文语音的识别,并对隐马尔可夫语音识别方法和深度神经网络下的语音识别方法的系统搭建难度、原理差异和识别精确度进行对比研究。仿真结果表明,所提方法能够实现对连续多字符中文语音的有效识别,识别正确率在90%以上。 展开更多
关键词 语音信号识别 深度全序列卷积神经网络 隐马尔可夫链 声学特征提取 梅尔倒谱系数 CTC损失函数
下载PDF
基于模糊综合评价法的情感语音数据库的建立 被引量:9
10
作者 宋静 张雪英 +1 位作者 孙颖 畅江 《现代电子技术》 北大核心 2016年第13期51-54,58,共5页
为建立一个真实、自然、丰富的情感语音数据库,研究选择高兴、惊奇、悲伤、生气四种情感类型,利用截取广播剧的方式获得初选阶段的情感语音数据库。通过模糊综合评价与层次分析法、熵权法相结合建立情感语音的模糊综合评价模型,利用该... 为建立一个真实、自然、丰富的情感语音数据库,研究选择高兴、惊奇、悲伤、生气四种情感类型,利用截取广播剧的方式获得初选阶段的情感语音数据库。通过模糊综合评价与层次分析法、熵权法相结合建立情感语音的模糊综合评价模型,利用该模型对初选阶段的数据库进行模糊评价,筛选得到最终高质量的情感语音数据库。将三种类型的数据库用于情感语音识别实验,对比分析了不同类型数据库的差异,同时也验证了本数据库的有效性。 展开更多
关键词 情感语音数据库 模糊综合评价 层次分析法 熵权法 情感语音识别
下载PDF
基于改进C_0复杂度和MFCC相似度的端点检测 被引量:5
11
作者 许昊 张二华 《现代电子技术》 北大核心 2015年第10期7-9,15,共4页
为了提高语音端点检测的准确率,提出一种基于改进C0复杂度和MFCC相似度相结合的端点检测算法。首先,计算每一帧语音信号的C0复杂度以及MFCC相似度。然后,结合C0复杂度与MFCC相似度作为新的特征参数,设置阈值进行端点检测。对信噪比... 为了提高语音端点检测的准确率,提出一种基于改进C0复杂度和MFCC相似度相结合的端点检测算法。首先,计算每一帧语音信号的C0复杂度以及MFCC相似度。然后,结合C0复杂度与MFCC相似度作为新的特征参数,设置阈值进行端点检测。对信噪比在-15~15 dB范围内的含噪语音进行端点检测,使用Matlab软件进行仿真实验。实验结果表明,该方法相对于单独的两种方法提高了检测率,且稳定性更强。 展开更多
关键词 音信号处理 C0复杂度 MFCC相似度 端点检测
下载PDF
智能听障助理系统的设计与实现 被引量:2
12
作者 余华芳 杨龙友 +2 位作者 麦志华 邓海燕 鲍丰 《现代电子技术》 2012年第13期108-110,共3页
为了听障人士家居安全和减少其家人的精神负担,设计了一款基于STC89C52RC单片机控制的智能听障助理系统。该系统具有门铃感应,烟雾、火灾报警等功能,价格低廉。实验证明,该系统操作简单,运行稳定可靠,抗干扰能力强。
关键词 单片机 听力障碍 传感器 无线收发模块
下载PDF
语谱图傅里叶变换的二字汉语词汇语音识别 被引量:1
13
作者 潘迪 梁士利 +2 位作者 魏莹 许廷发 王双维 《现代电子技术》 北大核心 2017年第16期13-18,共6页
以语音信号的语谱图作为处理对象,提出一种基于宽窄带语谱图傅里叶变换频域图像二进宽度分带投影特征融合的二字汉语词汇语音识别算法。首先,对宽窄语谱图傅里叶变换频域图的图像意义以及相应的语音特性进行分析;然后,分别对宽窄带语谱... 以语音信号的语谱图作为处理对象,提出一种基于宽窄带语谱图傅里叶变换频域图像二进宽度分带投影特征融合的二字汉语词汇语音识别算法。首先,对宽窄语谱图傅里叶变换频域图的图像意义以及相应的语音特性进行分析;然后,分别对宽窄带语谱图频域图像进行二进宽度分带列投影和行投影,将投影值作为语音识别的第一个特征参数集合和第二个特征参数集合,将以上两个特征集进行特征融合作为二字词汇语音识别的特征量,以支持向量机为分类器实现二字汉语词汇语音识别。实验结果表明,该方法对特定人二字汉语词汇语音的识别率可达96.8%,对非特定人二字汉语词汇语音的识别率可达98.8%,为解决汉语词汇整体语音识别提供了一种新的思路。 展开更多
关键词 傅里叶变换 语谱图 特征融合 支持向量机
下载PDF
基于小波变换和时域波形的基音检测算法 被引量:4
14
作者 陈小利 徐金甫 《现代电子技术》 2011年第1期77-79,共3页
为了准确地检测语音信号的基音周期,采用小波变换和时域波形相结合的方法,分别用传统的自相关法、平均幅度差法及文中算法对纯净语音和不同信噪比时的含噪语音进行基音检测。实验表明,自相关法易出现半频错误,平均幅度差法易出现倍频错... 为了准确地检测语音信号的基音周期,采用小波变换和时域波形相结合的方法,分别用传统的自相关法、平均幅度差法及文中算法对纯净语音和不同信噪比时的含噪语音进行基音检测。实验表明,自相关法易出现半频错误,平均幅度差法易出现倍频错误,且两者随着信噪比的降低,错误帧数呈增加趋势。然而文中算法倍频、半频错误相对较少,基音轮廓清晰、平滑,无大的跳变,符合语音信号慢时变性的一般规律,从而提高了基音检测的精度。 展开更多
关键词 基音检测 小波变换 自相关法 平均幅度差法
下载PDF
硬盘播放器音频解码电路的设计 被引量:1
15
作者 张凯 王海滨 +2 位作者 易鹏飞 唐赞 甘凤萍 《现代电子技术》 北大核心 2015年第5期77-79,共3页
为满足超高清码流仪高品质的音频效果需求,设计了一种基于数字音频接收器CS8416和音频数/模转换器CS4398的高性能音频解码电路。该解码电路主要由数字音频接收电路、立体声数/模转换电路、模拟信号调理电路以及开关机静噪电路四部分组... 为满足超高清码流仪高品质的音频效果需求,设计了一种基于数字音频接收器CS8416和音频数/模转换器CS4398的高性能音频解码电路。该解码电路主要由数字音频接收电路、立体声数/模转换电路、模拟信号调理电路以及开关机静噪电路四部分组成。最高支持24位、192 k Hz采样频率的AES/EBU和S/PDIF音频数据的解码,设计的开关机静噪电路结构简单,能有效地抑制开关机时的冲击噪声。 展开更多
关键词 超高清码流仪 音频解码 AES/EBU S/PDIFT
下载PDF
基于“互联网+”的声纹识别技术在刑事案件侦破中的应用研究 被引量:7
16
作者 魏莲芳 《现代电子技术》 北大核心 2020年第7期34-38,共5页
对面向"互联网+"的声纹识别技术进行研究,并分析了其在刑事案件侦破中的应用。基于GMM-UBM声纹识别确认系统,对GMM-UBM模型构建方法进行详细描述,研究模型参数最大后验概率算法、估计期望最大化算法、参数训练和识别过程。对... 对面向"互联网+"的声纹识别技术进行研究,并分析了其在刑事案件侦破中的应用。基于GMM-UBM声纹识别确认系统,对GMM-UBM模型构建方法进行详细描述,研究模型参数最大后验概率算法、估计期望最大化算法、参数训练和识别过程。对基于GMM-UBM的声纹识别系统进行设计,利用对比实验的方法分别验证在相同条件下GMM建模方法、GMM-UBM建模方法的识别效果。在测试随机抽取的一组语音时,系统均具有较高的识别成功率,在进行不同人数测试时,随着样本人数的增加,系统识别率会有少许降低,但平均识别率较高,为89.6%;与GMM系统相比,GMM-UBM系统具有较高的识别率,随着混合度的增加,GMM-UBM系统识别率随之增大。 展开更多
关键词 刑事案件侦破 声纹识别 互联网+ GMM-UBM 识别率 参数训练
下载PDF
基于LPC的藏语语音基音周期的检测分析 被引量:1
17
作者 马英 陈超 贾国庆 《现代电子技术》 北大核心 2015年第16期13-15,19,共4页
基音周期是语音信号的重要参数,提取藏语语音基音周期为藏语语音识别和藏语语音合成奠定很重要的基础。这里在分析藏语发音特点的基础上进行基于LPC的藏语语音基音周期提取算法的分析,实践表明,该方法更加符合小信噪比藏语音信号基音周... 基音周期是语音信号的重要参数,提取藏语语音基音周期为藏语语音识别和藏语语音合成奠定很重要的基础。这里在分析藏语发音特点的基础上进行基于LPC的藏语语音基音周期提取算法的分析,实践表明,该方法更加符合小信噪比藏语音信号基音周期和提取。在传统LPC分析方法的基础上结合自相关法和倒谱法,分析计算平均相对误差,总结出了符合藏语语音特点的特征提取算法。 展开更多
关键词 LPC 藏语语音 基音周期 倒谱法
下载PDF
一种基于短时倒谱速变率的语音信号平滑端点检测方法 被引量:1
18
作者 王帛 冯新喜 《现代电子技术》 2010年第23期92-94,98,共4页
短波通信以其天波传播特性,在通信领域具有其他通信手段无法替代的地位。为解决短波通信中信噪比较低,噪声信号严重影响语音处理效果的问题,提出了一种基于短时倒谱速变率的平滑端点检测方法,通过检测噪声信号的倒谱特征,初步确定语音... 短波通信以其天波传播特性,在通信领域具有其他通信手段无法替代的地位。为解决短波通信中信噪比较低,噪声信号严重影响语音处理效果的问题,提出了一种基于短时倒谱速变率的平滑端点检测方法,通过检测噪声信号的倒谱特征,初步确定语音信号端点,然后加入平滑优化处理以及Holdon设计,降低由于倒谱突变造成的误判。实测信号仿真实验证明,该方法在不过多加重系统负担的前提下,取得了良好的效果。 展开更多
关键词 倒谱速变率 平滑优化 Holdon设计 端点检测
下载PDF
基于线性预测的自适应语音增强技术 被引量:1
19
作者 王新民 雷丽 徐智辉 《孝感学院学报》 2005年第3期31-33,共3页
提出了一种基于线性预测的自适应语音增强方法。该方法利用带噪语音的线性预测作为自适应滤波器的参考输入,使有色噪声的相关性隐含于参考输入之中,从而大大地提高了语音的信噪比。仿真实验证明,被环境噪声污染了的语音信号经自适应系... 提出了一种基于线性预测的自适应语音增强方法。该方法利用带噪语音的线性预测作为自适应滤波器的参考输入,使有色噪声的相关性隐含于参考输入之中,从而大大地提高了语音的信噪比。仿真实验证明,被环境噪声污染了的语音信号经自适应系统处理后,其信噪比提高了32.70dB。 展开更多
关键词 语音增强 自适应算法 线性预测
下载PDF
基于软件无线电的直扩通信终端设计与仿真
20
作者 陈颖 张福洪 《现代电子技术》 2010年第21期15-17,共3页
随着软件无线电技术在各个领域的广泛应用,由软件来实现直扩通信终端已成为可能。基于软件无线电的思想,提出了一种基于软件无线电的直扩通信终端设计方案。分析了扩频伪码类型、扩频增益、中频选取、伪码同步电路等系统参数,并用Matla... 随着软件无线电技术在各个领域的广泛应用,由软件来实现直扩通信终端已成为可能。基于软件无线电的思想,提出了一种基于软件无线电的直扩通信终端设计方案。分析了扩频伪码类型、扩频增益、中频选取、伪码同步电路等系统参数,并用Matlab对系统进行了仿真,验证了方案的可行性。该系统具有体积小,灵活性好,低功耗,扩展性强等优点。 展开更多
关键词 软件无线电 直扩通信 扩频增益 伪码同步
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部