期刊文献+
共找到40篇文章
< 1 2 >
每页显示 20 50 100
Wavelet De-noising of Speech Using Singular Spectrum Analysis for Decomposition Level Selection
1
作者 蔡铁 朱杰 《Journal of Shanghai Jiaotong university(Science)》 EI 2007年第2期190-196,共7页
The problem of speech enhancement using threshold de-noising in wavelet domain was considered.The appropriate decomposition level is another key factor pertinent to de-noising performance.This paper proposed a new wav... The problem of speech enhancement using threshold de-noising in wavelet domain was considered.The appropriate decomposition level is another key factor pertinent to de-noising performance.This paper proposed a new wavelet-based de-noising scheme that can improve the enhancement performance significantly in the presence of additive white Gaussian noise.The proposed algorithm can adaptively select the optimal decomposition level of wavelet transformation according to the characteristics of noisy speech.The experimental results demonstrate that this proposed algorithm outperforms the classical wavelet-based de-noising method and effectively improves the practicability of this kind of techniques. 展开更多
关键词 speech enhancement wavelet de-noising singular spectrum analysis (SSA) support vector machine (SVM)
下载PDF
Application of Cochlear Model in Speech Analysis/Synthesis Using Sinusoidal Representation 被引量:1
2
作者 Yuan Jingxian Wan Wanggen Yu Xiaoqing (School of Communication & Information Engineering, Shanghai University) 《Advances in Manufacturing》 SCIE CAS 1999年第1期47-52,共6页
A sinusoidal representation of speech and a cochlear model are used to extract speech parameters in this paper, and a speech analysis/synthesis system controlled by the auditory spectrum is developed with the model. T... A sinusoidal representation of speech and a cochlear model are used to extract speech parameters in this paper, and a speech analysis/synthesis system controlled by the auditory spectrum is developed with the model. The computer simulation shows that speech can be synthesized with only 12 parameters per frame on the average. The method has the advantages of few parameters, low complexity and high performance of speech representation. The synthetic speech has high intelligibility. 展开更多
关键词 speech analysis/synthesis sinusoidal representation cochlear model auditory spectrum
下载PDF
Performance Analysis of Spoken Arabic Digits Recognition Techniques
3
作者 Ali Ganoun Ibrahim Almerhag 《Journal of Electronic Science and Technology》 CAS 2012年第2期153-157,共5页
A performance evaluation of sound recognition techniques in recognizing some spoken Arabic words, namely digits from zero to nine, is proposed. One of the main characteristics of aU Arabic digits is polysyllabic words... A performance evaluation of sound recognition techniques in recognizing some spoken Arabic words, namely digits from zero to nine, is proposed. One of the main characteristics of aU Arabic digits is polysyllabic words except for zero. The performance analysis is based on different features of phonetic isolated Arabic digits. The main aim of this paper is to compare, analyze, and discuss the outcomes of spoken Arabic digits recognition systems based on three recognition features: the Yule-Walker spectrum features, the Walsh spectrum features, and the Mel frequency Cepstral coefficients (MFCC) features. The MFCC based recognition system achieves the best average correct recognition. On the other hand, the Yule-Walker based recognition system achieves the worst average correct recognition. 展开更多
关键词 Arabic digits spectrum analysis speech recognition.
下载PDF
An Efficient Reference Free Adaptive Learning Process for Speech Enhancement Applications 被引量:1
4
作者 Girika Jyoshna Md.Zia Ur Rahman L.Koteswararao 《Computers, Materials & Continua》 SCIE EI 2022年第2期3067-3080,共14页
In issues like hearing impairment,speech therapy and hearing aids play a major role in reducing the impairment.Removal of noise signals from speech signals is a key task in hearing aids as well as in speech therapy.Du... In issues like hearing impairment,speech therapy and hearing aids play a major role in reducing the impairment.Removal of noise signals from speech signals is a key task in hearing aids as well as in speech therapy.During the transmission of speech signals,several noise components contaminate the actual speech components.This paper addresses a new adaptive speech enhancement(ASE)method based on a modified version of singular spectrum analysis(MSSA).The MSSA generates a reference signal for ASE and makes the ASE is free from feeding reference component.The MSSA adopts three key steps for generating the reference from the contaminated speech only.These are decomposition,grouping and reconstruction.The generated reference is taken as a reference for variable size adaptive learning algorithms.In this work two categories of adaptive learning algorithms are used.They are step variable adaptive learning(SVAL)algorithm and time variable step size adaptive learning(TVAL).Further,sign regressor function is applied to adaptive learning algorithms to reduce the computational complexity of the proposed adaptive learning algorithms.The performance measures of the proposed schemes are calculated in terms of signal to noise ratio improvement(SNRI),excess mean square error(EMSE)and misadjustment(MSD).For cockpit noise these measures are found to be 29.2850,-27.6060 and 0.0758 dB respectively during the experiments using SVAL algorithm.By considering the reduced number of multiplications the sign regressor version of SVAL based ASE method is found to better then the counter parts. 展开更多
关键词 Adaptive algorithm speech enhancement singular spectrum analysis reference free noise canceller variable step size
下载PDF
基于主成分的频谱迭代稀疏化语音增强方法
5
作者 董娴 邵玉斌 +2 位作者 杜庆治 龙华 马迪南 《四川大学学报(自然科学版)》 CAS CSCD 北大核心 2024年第3期229-237,共9页
针对现有频谱稀疏化方法在复杂环境语音增强上性能不佳的问题,提出一种基于主成分分析的迭代频谱稀疏化方法.首先,对输入信号的语谱图进行二维中值滤波处理,得到行分量频谱和列分量频谱;对包含语音主音的行分量频谱序列进行主成分分析(P... 针对现有频谱稀疏化方法在复杂环境语音增强上性能不佳的问题,提出一种基于主成分分析的迭代频谱稀疏化方法.首先,对输入信号的语谱图进行二维中值滤波处理,得到行分量频谱和列分量频谱;对包含语音主音的行分量频谱序列进行主成分分析(PCA),以去除噪声部分并保留主要语音结构;然后联合列分量频谱序列和缩放因子进行混合重构原信号,并采用动态缩放因子实现对列分量频谱噪声的有效控制.在此基础上,利用稀疏化对噪声的抑制作用,对频谱进行多次稀疏化,以减弱噪声.实验结果表明,该方法增强了不同类型噪声下语音的信噪比,包括White、Pink、Babble、Volvo和Factory等五种噪声,输入信噪比为15 dB,所提方法的信噪比分别提升了13.89 dB,11.97 dB,5.65 dB,5.26 dB和4.73 dB,该方法在其他信噪比下也能有效地抑制噪声和保留有效特征信息,并减少因背景噪声引起的语音失真. 展开更多
关键词 语音增强 多维度频谱分析 谱稀疏化 主成分分析
下载PDF
3~8岁中重度孤独症谱系障碍儿童回声式言语特征分析
6
作者 吴轶茗 程琪 +1 位作者 赵燕春 卢海丹 《中国康复理论与实践》 CSCD 北大核心 2024年第11期1351-1358,共8页
目的探讨以汉语为母语的3~8岁中重度孤独症谱系障碍(ASD)儿童在不同情境下的回声式言语特点。方法2024年1月至3月,采集5例3~8岁中重度ASD儿童在机构与家庭两种情境下各15 min的康复课程视频,采用语言样本分析和自编编码的方法对其回声... 目的探讨以汉语为母语的3~8岁中重度孤独症谱系障碍(ASD)儿童在不同情境下的回声式言语特点。方法2024年1月至3月,采集5例3~8岁中重度ASD儿童在机构与家庭两种情境下各15 min的康复课程视频,采用语言样本分析和自编编码的方法对其回声式言语语料的内容、结构等进行分析,同时收集他们的口语语言能力。分析回声式言语与口语语言能力之间的相关性。结果共记录235个回声式言语相关话轮。其中,即时性与延迟性回声式言语的数量之比为7∶1;平均每2~3句言语回应中有1次为回声式言语行为,平均语句长度为2.97,平均词长为2.23。动词与名词出现频率高,分别为45.03%和38.48%,陈述性词句多,平均占比72.58%。回声式言语结构变化类型为重复原话语末尾部分的频次最高,平均占比29.98%。ASD儿童回声式言语的类型、频率、句长、句式、结构等特征在机构与家庭情境下无明显差异;ASD儿童模仿句长、词语理解与命名的语言能力分数与其回声式言语的数量、频率、句长、句式类型频次明显相关(r>0.881,P<0.05)。结论3~8岁中重度ASD儿童回声式言语活动呈现出跨情境的稳定性,与自身的理解性语言与表达性语言能力相关。即时性回声式言语多,句长短,实词优势大,陈述性语句多,经常重复原话语句子的结尾部分。 展开更多
关键词 孤独症谱系障碍 儿童 回声式言语 语言样本分析
下载PDF
面向语音情感识别的改进可辨别完全局部二值模式 被引量:9
7
作者 陶华伟 张昕然 +3 位作者 梁瑞宇 查诚 赵力 王青云 《声学学报》 EI CSCD 北大核心 2016年第6期905-912,共8页
为了研究语音情感与语谱图特征间的关系,本文研究并提出一种面向语音情感识别的改进可辨别完全局部二值模式特征。首先,基于语谱图灰度图像,计算图像的完全局部二值符号模式(CLBP_S)、幅度模式(CLBP_M)的统计直方图。然后,将CLBP_S,... 为了研究语音情感与语谱图特征间的关系,本文研究并提出一种面向语音情感识别的改进可辨别完全局部二值模式特征。首先,基于语谱图灰度图像,计算图像的完全局部二值符号模式(CLBP_S)、幅度模式(CLBP_M)的统计直方图。然后,将CLBP_S,CLBP_M统计直方图输入可区别特征学习模型中,训练得到全局显著性模式集合。最后,采用全局显著性模式集合对CLBP_S,CLBP_M直方图进行处理,将处理后的特征级联,得到面向语音情感识别的改进可辨别完全局部二值模式特征(IDisCLBP_SER)。基于柏林库、中文情感语音库的语音情感识别实验显示,IDisCLBP_SER特征召回率比纹理图像信息(TII)等特征提高了8%以上,比声学频谱特征平均提高了4%以上。而且,本文提出的特征可以和现有声学特征进行较好融合,融合后的特征召回率比现有声学特征召回率提高1%~4%。 展开更多
关键词 语音情感识别 统计直方图 灰度图像 纹理图像 召回率 旋转不变性 模式集 人机交互 分类器 描述子
下载PDF
语音信号中相位信息的听觉感知研究 被引量:5
8
作者 同鸣 卞正中 +2 位作者 戴启军 陈砚圃 张亮 《西安交通大学学报》 EI CAS CSCD 北大核心 2003年第12期1288-1291,1307,共5页
通过主观听觉测试实验,研究了语音信号中相位信息对人的听觉感知的影响.实验结果表明,保持语音信号的幅度谱不变,在改变其相位谱时,只要重建信号在时域中的包络不变,重建语音和原始语音就不存在主观听觉上的差异.重建语音的听觉感知效... 通过主观听觉测试实验,研究了语音信号中相位信息对人的听觉感知的影响.实验结果表明,保持语音信号的幅度谱不变,在改变其相位谱时,只要重建信号在时域中的包络不变,重建语音和原始语音就不存在主观听觉上的差异.重建语音的听觉感知效果主要取决于附加相位对频率的导数的起伏幅度.重建语音中不同频率分量之间的最大相对时移决定语音感知的质量,当最大相对时移小于10ms时,语音感知质量最优;只要相位失真带来的不同频率分量之间的最大相对时移小于20ms,就不会影响对连续语音的正常理解. 展开更多
关键词 语音信号 听觉感知 相位谱 附加相位
下载PDF
小波阈值降噪算法中最优分解层数的自适应选择 被引量:44
9
作者 蔡铁 朱杰 《控制与决策》 EI CSCD 北大核心 2006年第2期217-220,共4页
小波阈值降噪算法是一种去除数字信号中白噪声的有效算法.针对加性高斯白噪声的情况,提出一种自适应小波降噪算法,用于语音信号的增强.它能根据带噪信号的特点,自适应选择小波变换的最优分解层数.实验结果表明,该算法比经典的小波降噪... 小波阈值降噪算法是一种去除数字信号中白噪声的有效算法.针对加性高斯白噪声的情况,提出一种自适应小波降噪算法,用于语音信号的增强.它能根据带噪信号的特点,自适应选择小波变换的最优分解层数.实验结果表明,该算法比经典的小波降噪算法具有更好的降噪效果,能有效提高算法的实用性能. 展开更多
关键词 语音增强 小波降噪 分解层数 奇异谱分析
下载PDF
一种基于分带谱熵和谱能量的语音端点检测算法 被引量:12
10
作者 李如玮 鲍长春 《北京工业大学学报》 CAS CSCD 北大核心 2007年第9期920-924,共5页
语音端点检测的精确度直接影响语音识别的准确度.在噪声环境下,语音端点检测很困难.信噪比下降,语音端点检测的正确率也随之下降,同时,噪声类型的变化影响端点检测的正确率.为此,提出了一种改进的、适合在电话语音城市名识别系统中应用... 语音端点检测的精确度直接影响语音识别的准确度.在噪声环境下,语音端点检测很困难.信噪比下降,语音端点检测的正确率也随之下降,同时,噪声类型的变化影响端点检测的正确率.为此,提出了一种改进的、适合在电话语音城市名识别系统中应用的端点检测算法,并结合分带谱熵和谱能量形成了一个新的特征参数集,利用该参数集进行端点检测,弥补了分别采用分带谱熵和谱能量进行端点检测的缺陷,提高了检测性能. 展开更多
关键词 语音处理 语音识别 谱分析 端点检测 分带谱熵
下载PDF
舌再造术后语音功能的检测 被引量:7
11
作者 张陈平 邱蔚六 林国础 《口腔颌面外科杂志》 CAS 1995年第1期15-19,26,共6页
舌缺损严重影响语音功能,本实验中开发了语音分析LPCFFT计算机软件,对患者术后的发音情况给予客观评价,技术指标为:元音LPC共振峰测定,辅音FFT谱线观察,手术前后元音及辅音离散度分析等。结果发现舌部手术以后,在[... 舌缺损严重影响语音功能,本实验中开发了语音分析LPCFFT计算机软件,对患者术后的发音情况给予客观评价,技术指标为:元音LPC共振峰测定,辅音FFT谱线观察,手术前后元音及辅音离散度分析等。结果发现舌部手术以后,在[a]、[i]、[u]3个元音中以[i]音的变化较明显,元音[i]的语音指标能较好地反映舌部的功能状态。我们还进行耳听语音测定,并与频谱检查结果之间进行相关分析,结果元音[i]的离散度与耳测评分之间相关性好。 展开更多
关键词 舌再造术 语音清晰度 频谱分析
下载PDF
基于窄带谱能量的快速正弦分析方法 被引量:2
12
作者 杨萃 韦岗 《声学学报》 EI CSCD 北大核心 2009年第5期462-470,共9页
文中提出了一种基于窄带谱能量的快速正弦参数分析方法。该方法将信号η阶导数的傅氏变换与传统傅氏变换相结合,并且根据窗函数的主瓣能量集中特性,用原始信号的窄带能量逼近单个正弦分量的全带能量来提取正弦参数。实验表明,与已有算... 文中提出了一种基于窄带谱能量的快速正弦参数分析方法。该方法将信号η阶导数的傅氏变换与传统傅氏变换相结合,并且根据窗函数的主瓣能量集中特性,用原始信号的窄带能量逼近单个正弦分量的全带能量来提取正弦参数。实验表明,与已有算法相比,该算法的提取精度提高了30%~60%,计算量降低了4倍以上,可应用于实时语音分析和语音通信。 展开更多
关键词 谱能量 正弦 窄带 傅氏变换 N阶导数 能量集中 语音通信 语音分析
下载PDF
基于DFT的嵌入式普通话语音快速识别 被引量:3
13
作者 邓力 梁向东 《实验室研究与探索》 CAS 北大核心 2017年第6期128-132,共5页
基于选定的频率普通话发音识别技术,由定义的输入普通话语音拾取的普通话语音识别腔共振曲线,通过对中文分词、韵母声母频谱识别,对中文语音的声母、韵母、声调集成、输出的中文拼音词序列组合,形成句子的中文拼音序列。通过韵母分析方... 基于选定的频率普通话发音识别技术,由定义的输入普通话语音拾取的普通话语音识别腔共振曲线,通过对中文分词、韵母声母频谱识别,对中文语音的声母、韵母、声调集成、输出的中文拼音词序列组合,形成句子的中文拼音序列。通过韵母分析方法进行单音节,频域幅频特性分析技术,不需要学习或培训事先要用于一个特定的人的声音,能够识别非特定的单词和句子的普通话语音,采用速率自适应梳状(Discrete Fourier Transform,DFT)谱分析算法,只需极少量的计算,就能够确定地包含4个声调的普通话,具有响应速度快,所需存储空间小,能方便的移植到嵌入式设备的应用程序中。 展开更多
关键词 语音识别 频谱分析 DFT算法
下载PDF
基于数字信号处理的嗓音控制开关(VOX)算法研究 被引量:2
14
作者 张天骐 李伟 +1 位作者 林孝康 刘林 《应用声学》 CSCD 北大核心 2005年第3期157-163,共7页
本文提出了一种基于数字谱分析的嗓音控制开关(VOX,Voice-OperatedTransmit)的新算法,该算法简单、实用,在某种程度上克服了传统VOX算法的结构复杂、参数难调等局限,对噪声的鲁棒性也较好,而且易于用数字信号处理实现。首先利用信号功... 本文提出了一种基于数字谱分析的嗓音控制开关(VOX,Voice-OperatedTransmit)的新算法,该算法简单、实用,在某种程度上克服了传统VOX算法的结构复杂、参数难调等局限,对噪声的鲁棒性也较好,而且易于用数字信号处理实现。首先利用信号功率谱二次处理,提取出语音的平均幅度包络,然后对所得包络进行阈值处理、限幅放大,最后就得到VOX函数。理论分析和计算机模拟结果表明,该算法不仅能较为准确地提取出语音波形的平均幅度包络,而且能工作在较低的信噪比条件下。 展开更多
关键词 数字信号处理 控制开关 算法研究 嗓音 Voice 信号功率谱 二次处理 阈值处理 模拟结果 语音波形 VOX 谱分析 新算法 鲁棒性 包络 计算机 信噪比 幅度 平均 提取 限幅
下载PDF
基于特征音素的说话人识别方法 被引量:1
15
作者 王昌龙 周福才 +1 位作者 凌裕平 於锋 《仪器仪表学报》 EI CAS CSCD 北大核心 2007年第10期1831-1835,共5页
本文提出了一种基于特征音素的说话人识别方法,并在低成本门禁系统中获得实现。首先利用清音和浊音悬殊的数字特征将语音信号中的清音和浊音分离,再将分离后的几个浊音的特征频率和相对强度作为特征参数组成30维特征向量。在PC上进行了... 本文提出了一种基于特征音素的说话人识别方法,并在低成本门禁系统中获得实现。首先利用清音和浊音悬殊的数字特征将语音信号中的清音和浊音分离,再将分离后的几个浊音的特征频率和相对强度作为特征参数组成30维特征向量。在PC上进行了高阶谱分析和快速傅里叶变换,比较了2种方法声韵分离的效果。然后分别用神经网络识别算法和模板比对法进行识别实验,主要应用目标为单住户语音门禁系统,具有自学习功能,能随着家庭成员的年龄和生理变化不断调整特征向量模板,该方法已在低成本单片机系统中实现。 展开更多
关键词 语音信号处理 说话人识别 特征提取 频谱分析
下载PDF
应用语音信号辅助“数字信号处理”课程教学 被引量:3
16
作者 杜世民 杨润萍 +1 位作者 钟志光 孙乐鸣 《电气电子教学学报》 2017年第1期83-85,112,共4页
本文针对"数字信号处理"课程的特点,提出在该课程教学中引入实际的语音信号分析来辅助教学的思路。以语音信号为例,应用Matlab软件,对序列的运算、频谱分析和滤波器设计等重要知识点进行了仿真实现,并给出了仿真结果。通过运... 本文针对"数字信号处理"课程的特点,提出在该课程教学中引入实际的语音信号分析来辅助教学的思路。以语音信号为例,应用Matlab软件,对序列的运算、频谱分析和滤波器设计等重要知识点进行了仿真实现,并给出了仿真结果。通过运用所学知识对实际语音信号进行处理,可以加深学生对所学知识的理解,激发他们对课程的学习兴趣,从而有效地提高了课堂教学的效率。 展开更多
关键词 数字信号处理 语音信号 辅助教学 频谱分析
下载PDF
Hilbert-Huang变换在语音信号精细时频分析中的应用 被引量:2
17
作者 宋倩倩 于凤芹 《计算机工程与应用》 CSCD 北大核心 2010年第28期149-151,156,共4页
语音信号是一种典型的非平稳信号,其特性及表征本质特征的参数均是随时间变化的,而时频分析是分析时变谱的有力工具,Hilbert-Huang变换是一种新型的具有自适应性的时频分析方法,对于非线性、非平稳信号有清晰的物理意义,通过HHT变换,能... 语音信号是一种典型的非平稳信号,其特性及表征本质特征的参数均是随时间变化的,而时频分析是分析时变谱的有力工具,Hilbert-Huang变换是一种新型的具有自适应性的时频分析方法,对于非线性、非平稳信号有清晰的物理意义,通过HHT变换,能够得到信号的时间-频率-振幅三维分布特征。分析了HHT算法的原理,采用了合适的端点效应处理方法提高了EMD的分解精度,通过仿真实验得到了语音信号更加精细的时频结构,并与STFT、WVD及Choi-Williams分布进行了对比,显示了HHT算法的优越性。 展开更多
关键词 语音信号 时频分析 HILBERT-HUANG变换 Hilbert谱
下载PDF
自闭症儿童普通话发音声学研究 被引量:5
18
作者 吴西愉 《语言文字应用》 CSSCI 北大核心 2021年第4期15-26,共12页
本研究通过分析自闭症儿童和典型发展儿童的语音参数,探讨自闭症儿童的发音特点。被试模仿标准播音员发音,内容覆盖了普通话的声母、韵母、声调以及一篇短文。本研究提取并分析了单音节时长、五度调值、元音共振峰,以及句子发音的语速... 本研究通过分析自闭症儿童和典型发展儿童的语音参数,探讨自闭症儿童的发音特点。被试模仿标准播音员发音,内容覆盖了普通话的声母、韵母、声调以及一篇短文。本研究提取并分析了单音节时长、五度调值、元音共振峰,以及句子发音的语速和最大音强标准差参数。研究表明,相较于典型发展儿童自闭症儿童的语音参数个体差异较大,且部分自闭症儿童的各语音声学参数的稳定性不如典型发展儿童。本研究结果可用于自闭症儿童的发音康复训练以及训练效果评估。 展开更多
关键词 自闭症谱系障碍 普通话 语音 声学分析
下载PDF
基于FFT算法的声光三维显示装置 被引量:2
19
作者 杨佩 《微型电脑应用》 2020年第3期31-34,共4页
设计了一种基于FFT算法的声光三维显示装置。该装置通过FFT快速傅里叶变换算法来对语音信号进行频谱分析,并将频谱分析结果以三维视觉效果呈现。该装置可以大大提高传统二维频谱显示器的显示能力和观察效果,为使用者带来立体化的动态视... 设计了一种基于FFT算法的声光三维显示装置。该装置通过FFT快速傅里叶变换算法来对语音信号进行频谱分析,并将频谱分析结果以三维视觉效果呈现。该装置可以大大提高传统二维频谱显示器的显示能力和观察效果,为使用者带来立体化的动态视听效果,可广泛应用于舞台表演、教育教学和大众娱乐等领域。 展开更多
关键词 FFT算法 声光 三维显示 语音信号 频谱分析
下载PDF
语音短时分析的谱误差及其全相位DFT谱研究
20
作者 王宏 潘金贵 《计算机应用》 CSCD 北大核心 2007年第10期2575-2577,共3页
主要以汉明窗为例,定量分析了窗函数引起的信号幅度谱误差,给出了相对幅度谱补偿系数的理论值。对单频信号和噪声信号的计算机仿真分析验证了该补偿系数的正确性。此外,为进一步提高语音短时谱的分析质量,还给出了一种计算语音短时全相... 主要以汉明窗为例,定量分析了窗函数引起的信号幅度谱误差,给出了相对幅度谱补偿系数的理论值。对单频信号和噪声信号的计算机仿真分析验证了该补偿系数的正确性。此外,为进一步提高语音短时谱的分析质量,还给出了一种计算语音短时全相位DFT谱的方法,并通过计算机仿真验证了该方法的谱分析性能。 展开更多
关键词 语音信号处理 短时谱 全相位DFT谱
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部