期刊文献+
共找到248篇文章
< 1 2 13 >
每页显示 20 50 100
TWO KINDS OF PITCH PREDICTORS IN SPEECH COMPRESSING CODING
1
作者 Bao Changchun Dai Yisong Fan Changxin(Xidian University, Xi’an 710071) (Jilin University of technology, Changchun 130025) 《Journal of Electronics(China)》 1997年第3期200-208,共9页
This paper studies two kinds of methods for pitch predictor in speech compressing coding, i.e., open-loop and closed-loop structures. Some of simplified approaches for solving pitch predictor equation are suggested, a... This paper studies two kinds of methods for pitch predictor in speech compressing coding, i.e., open-loop and closed-loop structures. Some of simplified approaches for solving pitch predictor equation are suggested, and the performances are compared under several conditions. The computer simulation results are shown. 展开更多
关键词 speech processing LINEAR PREDICTION pitch PREDICTION
下载PDF
合成语音与自然语音的音高差异——从18种语言核心词看合成语音的音高特点
2
作者 王帅 《天津外国语大学学报》 2024年第5期88-98,F0003,共12页
论文以18种语言核心词的合成语音和自然语音为研究对象,从音高均值、最大值、最小值、标准差以及单位时间内词的音高变化幅度分析了合成语音和自然语音的音高表现,考察了合成语音的音高特点。整体看来,较之自然语音,合成语音的整体音高... 论文以18种语言核心词的合成语音和自然语音为研究对象,从音高均值、最大值、最小值、标准差以及单位时间内词的音高变化幅度分析了合成语音和自然语音的音高表现,考察了合成语音的音高特点。整体看来,较之自然语音,合成语音的整体音高均值低于自然语音。在具体的语言中,合成语音的音高表现存在语言间的差异,部分语言的合成语音和自然语音的音高表现非常接近,而部分语言的合成语音和自然语音的音高表现呈现出了较大的差异。就单位时间内词音高的变化幅度而言,大部分语言的合成语音词音高变化幅度大于自然语音的词音高变化幅度,这种情况与合成语音中的词音高曲线存在畸变的现象有关。 展开更多
关键词 核心词 合成语音 自然语音 音高差异
下载PDF
听觉模型鲁棒性特征研究及应用 被引量:1
3
作者 王文华 夏秀渝 《成都信息工程大学学报》 2024年第3期275-282,共8页
人类的听觉系统具有非常精细而巧妙的结构,即使在嘈杂的环境中,也能准确地理解语音。采用精细的耳蜗模型作为前端处理可以实现更好的语音处理。利用快速压缩的非对称谐振器级联(CARFAC)作为人耳外周模型,结合听觉稳定图像得到精确的皮... 人类的听觉系统具有非常精细而巧妙的结构,即使在嘈杂的环境中,也能准确地理解语音。采用精细的耳蜗模型作为前端处理可以实现更好的语音处理。利用快速压缩的非对称谐振器级联(CARFAC)作为人耳外周模型,结合听觉稳定图像得到精确的皮层前听觉模型。在听觉模型的基础上提取较准确的基音轮廓,利用基音信息进行声场景分析,合成鲁棒性语音特征,并将其送入神经网络进行监督训练,以实现语音增强。实验结果表明,噪声条件下,由听觉模型提取的特征在各语音评价指标下都有较好的体现,可以更好表征语音信号,具有一定的鲁棒性。 展开更多
关键词 CARFAC模型 听觉稳定图像 语音增强系统 基音提取
下载PDF
Prosodic Modification of Chinese Speech Based on Sinusoidal Model 被引量:1
4
作者 Jiang-yang Zhou Fang-jing Zheng +1 位作者 Quan Sha Pei-gi Chai 《Advances in Manufacturing》 SCIE CAS 2000年第4期299-303,共5页
Modification on time scale and pitch scale of Chinese syllable based on sinusoidal model is presented in this paper. Firstly, the short term speech is decomposed into a sum of sinusoidal waves of different magnitud... Modification on time scale and pitch scale of Chinese syllable based on sinusoidal model is presented in this paper. Firstly, the short term speech is decomposed into a sum of sinusoidal waves of different magnitudes and phases. Then vocal tract system and excitation are obtained using a homomophic technique. Lastly, the speech with desired time scale and pitch scale is obtained through the change of frequency and phase of excitation while the parameters of vocal tract system are changed accordingly. The results show that the adjustable scale of pitch and time scale is big using this algorithm and it is suitable to be used in analysis and synthesis of Chinese speech. 展开更多
关键词 Chinese speech sinusoidal model pitch scale time scale prosodic modificatp
下载PDF
Emotional Speech Synthesis Based on Prosodic Feature Modification 被引量:2
5
作者 Ling He Hua Huang Margaret Lech 《Engineering(科研)》 2013年第10期73-77,共5页
The synthesis of emotional speech has wide applications in the field of human-computer interaction, medicine, industry and so on. In this work, an emotional speech synthesis system is proposed based on prosodic featur... The synthesis of emotional speech has wide applications in the field of human-computer interaction, medicine, industry and so on. In this work, an emotional speech synthesis system is proposed based on prosodic features modification and Time Domain Pitch Synchronous OverLap Add (TD-PSOLA) waveform concatenative algorithm. The system produces synthesized speech with four types of emotion: angry, happy, sad and bored. The experiment results show that the proposed emotional speech synthesis system achieves a good performance. The produced utterances present clear emotional expression. The subjective test reaches high classification accuracy for different types of synthesized emotional speech utterances. 展开更多
关键词 EMOTIONAL speech Synthesis Prosodic Features Time Domain pitch SYNCHRONOUS OVERLAP ADD
下载PDF
Adaptive Pitch Transposition: Smart Auditory Spectral Shifts in Cochlear Implants
6
作者 Kevin Struwe Ralf Salomon 《Engineering(科研)》 2017年第9期739-754,共16页
Patients with severe hearing loss have the option to get a cochlear implant device to regain their hearing. Yet, the implantation process is not always optimal, which in some cases results in a shallow insertion depth... Patients with severe hearing loss have the option to get a cochlear implant device to regain their hearing. Yet, the implantation process is not always optimal, which in some cases results in a shallow insertion depth or an accidental insertion into the wrong cochlear duct. As a consequence, the patients' pitch discrimination ability is suboptimal, leading to an even more decreased vowel identification, which is vital for speech recognition. This paper presents a technical approach to solve this problem: the adaptive pitch transposition module modifies the frequency content in a fashion so that the pitch is fixed to an optimal value. To determine this value, a patient-individual best pitch is determined experimentally by evaluating speech recognition at different pitches. This best pitch is subsequently called the comfort pitch. As a result of the considerations a technical implementation is presented in principle. A system comprised of pitch detection, pitch transposition and an arbitrary chosen comfort pitch is described in depth. It has been implemented prototypically in Matlab/Octave and tested with an example audio file. The system?itself is designed as a preprocessing stage preceding cochlear implant processing. 展开更多
关键词 COCHLEAR IMPLANTS pitch TRANSPOSITION speech Processing
下载PDF
基于分数基音延迟动态搜索的语音隐写算法
7
作者 田晖 严艳 +3 位作者 汤莉莉 吴俊彦 王慧东 全韩彧 《电子学报》 EI CAS CSCD 北大核心 2023年第1期67-75,共9页
论文提出了一种基于分数基音延迟动态搜索的语音隐写算法.该算法可根据隐藏容量(x比特/子帧)的需要将分数基音延迟候选值集合划分为2x个子集,每个子集代表不同的x比特信息.在闭环基音搜索过程中,可为每个子帧选择既能表示待嵌入隐秘信... 论文提出了一种基于分数基音延迟动态搜索的语音隐写算法.该算法可根据隐藏容量(x比特/子帧)的需要将分数基音延迟候选值集合划分为2x个子集,每个子集代表不同的x比特信息.在闭环基音搜索过程中,可为每个子帧选择既能表示待嵌入隐秘信息且内插后的归一化相关系数最大的分数基音延迟候选值,从而有效降低隐写操作对于原始载体的影响.以目前IP语音系统中广泛使用的自适应多速率语音编码为例,对该算法从隐藏容量、不可感知性及抗检测性三方面进行了性能评估并与相关工作进行了对比分析.实验结果表明,本文提出的隐写算法较之现有基于基音延迟的隐写算法可在确保较高隐写容量的同时达到更好隐写安全性(即更好抗检测能力和不可感知性). 展开更多
关键词 语音隐写 动态搜索 分数基音延迟 自适应多速率语音编码 隐写安全性
下载PDF
SPEECH ENHANCEMENT USING HARMONICS REGENERATION BASED ON MULTIBAND EXCITATION
8
作者 Zhang Yanfang Tang Kun Cui Huijuan 《Journal of Electronics(China)》 2011年第4期565-570,共6页
This paper proposes an algorithm that adopts the harmonic regeneration as post-processing to improve the performance of speech enhancement using traditional Short Time Spectral Amplitude(STSA).The proposed algorithm a... This paper proposes an algorithm that adopts the harmonic regeneration as post-processing to improve the performance of speech enhancement using traditional Short Time Spectral Amplitude(STSA).The proposed algorithm aims to alleviate the distortion of the high harmonics of enhanced speech via the traditional STSA,and consequently improves the speech quality.We first detect the pitch,or fundamental frequency,of the enhanced speech via the traditional STSA,and then,divide the whole spectrum into multiple sub-bands which center on each harmonic.After that,a series of specially designed windows centered on each harmonic are applied to all the sub-bands,in order to redistribute the energy in the sub-bands.The results of experiment demonstrate that the method has both theo-retical and practical basis. 展开更多
关键词 speech enhancement Short time spectral amplitude Harmonic regeneration Multiband excitation pitch detection
下载PDF
基于ASA的单声道双人混合语音浊音分离
9
作者 李黎 张二华 唐振民 《计算机与数字工程》 2023年第12期2918-2923,共6页
单声道语音分离在噪声环境下的语音识别、多媒体检索等场景中具有重要的作用。论文研究了基于听觉场景分析(ASA)的单声道双人混合语音浊音的分离方法,首先通过傅里叶变换将混合语音转换到时频域,然后以基音周期轨迹为线索,利用梳状滤波... 单声道语音分离在噪声环境下的语音识别、多媒体检索等场景中具有重要的作用。论文研究了基于听觉场景分析(ASA)的单声道双人混合语音浊音的分离方法,首先通过傅里叶变换将混合语音转换到时频域,然后以基音周期轨迹为线索,利用梳状滤波器提取浊音各次谐波的频谱,最后由傅里叶逆变换重构分离的浊音。论文采用倒谱法估计每帧语音的基音周期,利用基音周期的连续性绘制基音周期谱图估计双人语音的基音轨迹,针对双人混合语音中基音轨迹减弱甚至消失的问题,论文对传统倒谱计算方法进行了改进,核心思想是对传统倒谱计算过程中与频谱内积的三角函数进行正半周削波。实验结果表明,改进的倒谱算法能够增强双人混合语音中减弱的基音轨迹,并使部分消失的基音轨迹得以重现,显著提高分离语音的可懂度。 展开更多
关键词 语音分离 单声道 基音增强 倒谱
下载PDF
基于基音周期轨迹的连续汉语语音切分技术研究
10
作者 高桥 张二华 《计算机与数字工程》 2023年第1期163-167,共5页
连续语音识别技术是人工智能领域的研究热点之一,连续语音切分是语音识别的关键环节。实现准确可靠的连续语音切分算法,能够明显提升连续语音识别系统的性能,符合目前连续语音识别系统的应用需求。论文通过分析汉语语音识别的建模单元... 连续语音识别技术是人工智能领域的研究热点之一,连续语音切分是语音识别的关键环节。实现准确可靠的连续语音切分算法,能够明显提升连续语音识别系统的性能,符合目前连续语音识别系统的应用需求。论文通过分析汉语语音识别的建模单元、汉语的语言结构和发音规律,综合利用语音信号的时域特征、频域特征与倒谱域特征,依据基音周期轨迹的断点和斜率变化,设计浊音检测与多级切分算法,实现了连续汉语语音切分技术。实验表明,算法能够取得较好结果,且在噪声环境下具有较好的鲁棒性。 展开更多
关键词 语谱图 倒谱 基音周期谱 基音周期轨迹 多尺度分析
下载PDF
小波变换用于信号突变的检测 被引量:36
11
作者 程俊 张璞 +1 位作者 戴善荣 易克初 《通信学报》 EI CSCD 北大核心 1995年第3期96-104,共9页
本文介绍了小波变换用于信号突变的检测原理,给出了实现小波变换的快速算法。语音的基音检测作为一个应用实例,在文中得到验证。理论与实验表明,利用小波变换检测基音与传统方法相比具有独到之处。
关键词 小波变换 信号突变 信号检测 信号处理
下载PDF
不同情绪状态下汉语语音的声学特征分析 被引量:23
12
作者 高慧 苏广川 陈善广 《航天医学与医学工程》 CAS CSCD 北大核心 2005年第5期350-354,共5页
目的探索汉语语音受发音人情绪影响的声学特征变化规律。方法分析在平静和生气、欢快、悲伤等情绪下,汉语语音的基频、短时能量、时长、语速、共振峰和明亮度的变化规律。结果与平静语音相比,生气、欢快、悲伤3种情绪的语音特征都有不... 目的探索汉语语音受发音人情绪影响的声学特征变化规律。方法分析在平静和生气、欢快、悲伤等情绪下,汉语语音的基频、短时能量、时长、语速、共振峰和明亮度的变化规律。结果与平静语音相比,生气、欢快、悲伤3种情绪的语音特征都有不同程度的改变。结论根据特征参数的改变规律,可为进一步的情绪化语音合成和汉语语音的情绪识别奠定基础。 展开更多
关键词 语音 情绪 分析 基音
下载PDF
基于混合幅度差函数的基音提取算法 被引量:16
13
作者 刘建 郑方 +1 位作者 邓菁 吴文虎 《电子学报》 EI CAS CSCD 北大核心 2006年第10期1925-1928,共4页
为了减少基音周期提取中的倍频和半频错误,进行更准确的基音周期估计,提出一种基于混合幅度差函数的基音周期提取方法.分析比较了不同幅度差和自相关函数估计基音周期错误率的分布,结合两类典型幅度差函数的优点定义了混合幅度差函数;... 为了减少基音周期提取中的倍频和半频错误,进行更准确的基音周期估计,提出一种基于混合幅度差函数的基音周期提取方法.分析比较了不同幅度差和自相关函数估计基音周期错误率的分布,结合两类典型幅度差函数的优点定义了混合幅度差函数;进而基于混合幅度差函数,给出了使用历史信息进行校正的后处理方法.分析表明,所提方法可提高基音周期估计准确率,接近实时地确定基音周期,减少了传统基音周期估计因平滑处理而带来的误差或者动态规划处理带来的延迟.大量实验表明本文提出的基音周期提取方法比传统方法的错误率降低了13.8%. 展开更多
关键词 语音信息处理 基音周期提取 混合幅度差函数
下载PDF
一种适于计算声场景分析的混叠语音基音检测方法 被引量:3
14
作者 赵鹤鸣 朱美虹 +1 位作者 俞一彪 陈雪勤 《电子学报》 EI CAS CSCD 北大核心 2003年第1期123-126,共4页
本文提出了一种在混叠语音信号中检测各自语音分量基音信息的方法 .该方法采用小波变换作为基音检测模型中的滤波处理 ,并用广义自相关运算突出基音信息 ,用增强自相关累和消除冗余信息 ,并提出了用基音概率函数来预测并跟踪不同基音的... 本文提出了一种在混叠语音信号中检测各自语音分量基音信息的方法 .该方法采用小波变换作为基音检测模型中的滤波处理 ,并用广义自相关运算突出基音信息 ,用增强自相关累和消除冗余信息 ,并提出了用基音概率函数来预测并跟踪不同基音的变化以提高基音检测的准确性 .本文提出的方法可应用于计算声场景分析中 .实验结果表明 ,该方法对于混叠语音的基音检测是非常有效的 . 展开更多
关键词 声场景分析 混叠语音 基音检测 小波变换
下载PDF
言语中的音高信息声学语音学加工的大脑偏侧化 被引量:6
15
作者 张林军 周峰英 +1 位作者 王晓怡 舒华 《应用心理学》 CSSCI 2008年第4期330-335,共6页
旨在探讨言语中音高信息自下而上的声学语音学加工的神经机制和大脑偏侧化。发现,被动听和主动判断任务分别激活了颞叶和额叶,激活在颞极、颞上回和额下回眶部表现出明显的右侧优势。结果表明,对言语中音高信息自下而上的声学语音学加... 旨在探讨言语中音高信息自下而上的声学语音学加工的神经机制和大脑偏侧化。发现,被动听和主动判断任务分别激活了颞叶和额叶,激活在颞极、颞上回和额下回眶部表现出明显的右侧优势。结果表明,对言语中音高信息自下而上的声学语音学加工主要是右脑的功能,言语与非言语信号的音高信息可能有相似的加工机制,支持Gandour等提出的理论。 展开更多
关键词 言语 音高 偏侧化
下载PDF
基于归一化互相关函数的基音检测算法 被引量:42
16
作者 鲍长春 樊昌信 《通信学报》 EI CSCD 北大核心 1998年第10期27-31,共5页
本文提出了一种归一化互相关函数基音检测算法(NCCFPDA——NormalizedCross-CorrelationFunctionPitchDetectionAlgorithm),该算法在基音检测主过程的前端和末端... 本文提出了一种归一化互相关函数基音检测算法(NCCFPDA——NormalizedCross-CorrelationFunctionPitchDetectionAlgorithm),该算法在基音检测主过程的前端和末端加入了有效的预处理和后处理技术,实验分析表明,该方法在一般噪声环境下,基音周期提取和清浊判决具有令人满意的效果。 展开更多
关键词 语音处理 基音检测 相关函数
下载PDF
失歌症者对音乐和言语音高的加工 被引量:6
17
作者 蒋存梅 杨玉芳 《心理科学进展》 CSSCI CSCD 北大核心 2012年第2期159-167,共9页
音高是音乐和言语领域中一个重要维度。失歌症是一种对音乐音高加工的障碍。探讨失歌症者对音乐和言语音高的加工有助于揭示音乐和言语音高加工是否共享特定的认知和神经机制。已有研究结果表明,失歌症者对音乐音高加工存在障碍,这种音... 音高是音乐和言语领域中一个重要维度。失歌症是一种对音乐音高加工的障碍。探讨失歌症者对音乐和言语音高的加工有助于揭示音乐和言语音高加工是否共享特定的认知和神经机制。已有研究结果表明,失歌症者对音乐音高加工存在障碍,这种音高障碍在一定程度上影响到言语音高加工。同时,声调语言背景无法弥补失歌症者的音高障碍。这些研究结果支持了资源-共享框架(resource-sharing framework),即音乐和语言共享特定的认知和神经机制(Patel,2003,2008,inpress),并可能在一定程度上为失语症临床治疗提供借鉴。 展开更多
关键词 先天失歌症 音高障碍 音乐 言语 音高加工
下载PDF
汉语自然话语的音高下倾 被引量:4
18
作者 王茂林 訾广玲 +1 位作者 熊玮 林茂灿 《中文信息学报》 CSCD 北大核心 2013年第6期128-133,共6页
该研究使用电话对话语料,在统计的基础上对语句的音高下倾进行了考察。发现绝大多数语句的音高都是逐渐下降的,音高曲线前高后低的走势有其生理上的原因,并且具有标界功能。少数语句音高不下降,这与词语的载义重度、焦点及音节本调有关... 该研究使用电话对话语料,在统计的基础上对语句的音高下倾进行了考察。发现绝大多数语句的音高都是逐渐下降的,音高曲线前高后低的走势有其生理上的原因,并且具有标界功能。少数语句音高不下降,这与词语的载义重度、焦点及音节本调有关。该文又对陈述句和疑问句的音高进行了考察,发现与陈述句相比,疑问句的整体音域较大,句末无疑问语气词的是非问句末尾两音节间的降幅较小。 展开更多
关键词 自然话语 音高 下倾
下载PDF
基于参考独立分量分析的语音增强方法 被引量:7
19
作者 林秋华 郑永瑞 殷福亮 《大连理工大学学报》 EI CAS CSCD 北大核心 2006年第6期915-919,共5页
参考独立分量分析(independen t com ponen t ana lys is w ith reference,ICA-R)将源信号的先验知识以参考信号的形式引入学习算法中,可以从混合信号中仅抽取期望的源信号.基于ICA-R提出了一种语音增强新方法.通过比较语音信号和多种... 参考独立分量分析(independen t com ponen t ana lys is w ith reference,ICA-R)将源信号的先验知识以参考信号的形式引入学习算法中,可以从混合信号中仅抽取期望的源信号.基于ICA-R提出了一种语音增强新方法.通过比较语音信号和多种噪声信号的特点,合理地构造了具有语音信号重要特性的参考信号,进而应用ICA-R从多种加性噪声中抽取了期望增强的语音信号.计算机仿真和性能分析结果均表明了该方法的有效性. 展开更多
关键词 独立分量分析 盲源分离 语音增强 基音频率 参考信号
下载PDF
汉语连续语音中声调识别的特殊性研究 被引量:2
20
作者 钟金宏 杨善林 蒋俊杰 《小型微型计算机系统》 CSCD 北大核心 2002年第4期470-473,共4页
大词汇连续语音识别是当前语音识别研究的主流 ,探讨其中声调识别的特殊性是一项有意义的工作 .本文从声调获取、语音分割、声调模式和声调识别等四个方面进行了研究 ,通过对现有研究成果的分析和总结 ,并结合自己的研究工作 ,得出了若... 大词汇连续语音识别是当前语音识别研究的主流 ,探讨其中声调识别的特殊性是一项有意义的工作 .本文从声调获取、语音分割、声调模式和声调识别等四个方面进行了研究 ,通过对现有研究成果的分析和总结 ,并结合自己的研究工作 ,得出了若干结论 。 展开更多
关键词 声调识别 基音检测 语音分割 声调模式 汉语连续语音 特殊性 语音识别
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部