期刊文献+
共找到21篇文章
< 1 2 >
每页显示 20 50 100
Robust Speech Recognition System Using Conventional and Hybrid Features of MFCC,LPCC,PLP,RASTA-PLP and Hidden Markov Model Classifier in Noisy Conditions 被引量:7
1
作者 Veton Z.Kepuska Hussien A.Elharati 《Journal of Computer and Communications》 2015年第6期1-9,共9页
In recent years, the accuracy of speech recognition (SR) has been one of the most active areas of research. Despite that SR systems are working reasonably well in quiet conditions, they still suffer severe performance... In recent years, the accuracy of speech recognition (SR) has been one of the most active areas of research. Despite that SR systems are working reasonably well in quiet conditions, they still suffer severe performance degradation in noisy conditions or distorted channels. It is necessary to search for more robust feature extraction methods to gain better performance in adverse conditions. This paper investigates the performance of conventional and new hybrid speech feature extraction algorithms of Mel Frequency Cepstrum Coefficient (MFCC), Linear Prediction Coding Coefficient (LPCC), perceptual linear production (PLP), and RASTA-PLP in noisy conditions through using multivariate Hidden Markov Model (HMM) classifier. The behavior of the proposal system is evaluated using TIDIGIT human voice dataset corpora, recorded from 208 different adult speakers in both training and testing process. The theoretical basis for speech processing and classifier procedures were presented, and the recognition results were obtained based on word recognition rate. 展开更多
关键词 speech Recognition Noisy Conditions Feature Extraction Mel-Frequency Cepstral Coefficients Linear Predictive Coding Coefficients Perceptual Linear production RASTA-PLP Isolated speech Hidden Markov model
下载PDF
A synthesis method based on speech production and articulatory model
2
作者 YU Zhenli (Dept. of Information and Electronic Engineering, Zhejiang University Hangzhou 310028) Ching Pak-chung (Dept. of Electronic Engineering, The Chinese University of Hong Kang Shatin, N.T. Hong Kong) 《Chinese Journal of Acoustics》 2000年第2期128-141,共14页
A method to synthesize formant targeted sounds based on speech production model and Reflection-Type Line Analog (RTLA) articulatory synthesis model is presented. The synthesis model is implemented with scattering pro... A method to synthesize formant targeted sounds based on speech production model and Reflection-Type Line Analog (RTLA) articulatory synthesis model is presented. The synthesis model is implemented with scattering process derived from a RTLA of vocal tract system according to the acoustic mechanism of speech production. The vocal-tract area function which controls the synthesis model is derived from the first three formant trajectories by using the inverse solution of speech production. The proposed method not only gives good naturalness and dynamic smoothness, but also is capable to control or modify speech timbres easily and flexibly. Further and mores it needs less number of control parameters and very low update rate of the parameters. 展开更多
关键词 PSOLA A synthesis method based on speech production and articulatory model
原文传递
基于乘积HMM的双模态语音识别方法 被引量:8
3
作者 赵晖 顾亚强 唐朝京 《计算机工程》 CAS CSCD 北大核心 2010年第8期7-9,共3页
针对噪声环境中的语音识别,提出一种用于双模态语音识别的乘积隐马尔可夫模型(HMM)。在独立训练音频HMM和视频HMM的基础上,建立二维训练模型,表征音频流和视频流之间的异步特性。引入权重系数,根据不同噪声环境自适应调整音频流与视频... 针对噪声环境中的语音识别,提出一种用于双模态语音识别的乘积隐马尔可夫模型(HMM)。在独立训练音频HMM和视频HMM的基础上,建立二维训练模型,表征音频流和视频流之间的异步特性。引入权重系数,根据不同噪声环境自适应调整音频流与视频流的权重。实验结果证明,与其他双模态语音识别方法相比,该方法的识别性能更高。 展开更多
关键词 双模态语音识别 乘积隐马尔可夫模型 异步特性 权重系数
下载PDF
输出假设的心理语言学基础 被引量:29
4
作者 王颖 《外语教学》 北大核心 2005年第4期18-22,共5页
Swain(1985,1995)提出的可理解输出假设明确地阐明输出促使学习者从以语义为基础的认知处理转向以句法为基础的认知处理,后者在语言的准确表达乃至最终的习得中是十分必要的。本文在全面综述这一假设四大功能的基础上,讨论了“输出假设... Swain(1985,1995)提出的可理解输出假设明确地阐明输出促使学习者从以语义为基础的认知处理转向以句法为基础的认知处理,后者在语言的准确表达乃至最终的习得中是十分必要的。本文在全面综述这一假设四大功能的基础上,讨论了“输出假设”促进二语习得的心理语言学理论基础。本文从Levelt(1989,1992,1999)的言语产出模型入手,讨论了在产出与监察过程中,语法编码过程检查交际意图与输出匹配情况,这促使学习者发现自己中介语的不足,在某种情况下,可作为学习者意识提高的内部启动装置,反过来为语言学习创造理想的条件。 展开更多
关键词 可理解输出假设 Levelt 言语产出模型 心理语言学基础
下载PDF
一种基于联合源-滤波器模型优化的语音声门源模型估计方法 被引量:3
5
作者 付强 Peter Murphy 颜永红 《电子学报》 EI CAS CSCD 北大核心 2007年第5期982-986,共5页
本文论述了一种基于联合源-滤波器分离的稳健声门源模型估计方法.此方法利用LF(Liljencrants-Fant)模型对声门波导数(glottal flow derivative)进行建模,而声道被描述为一个时变的ARX模型.由于联合估计问题是一个多变量非线性优化过程,... 本文论述了一种基于联合源-滤波器分离的稳健声门源模型估计方法.此方法利用LF(Liljencrants-Fant)模型对声门波导数(glottal flow derivative)进行建模,而声道被描述为一个时变的ARX模型.由于联合估计问题是一个多变量非线性优化过程,本文采用了一个两阶段(two-pass)的实现策略来解决这一问题.第一阶段初始化声门源和声道模型,并为其后的联合优化过程提供稳健的初始参数.第二阶段的联合估计则最终决定模型估计的精度,由信任域下降优化算法实现.通过分别对合成和真实语音的实验,表明该方法是一种具有一定精度和较好的稳健性的声门源模型估计算法. 展开更多
关键词 语音产生模型 源-滤波器 声门波导数 ARX 声门波估计 联合优化
下载PDF
言语生成及理解的心理模型 被引量:2
6
作者 周秋原 金升霞 《长江大学学报(社会科学版)》 2004年第1期134-136,共3页
言语生成 (speechproduction)和言语理解 (speechunderstanding)是语言交际中十分复杂的心理认知过程 ,也是心理语言学研究中的一个重要内容。本文拟对有关言语生成和理解的几种心理模型予以讨论 ,探讨言语生成及理解的过程和实质。
关键词 言语生成 言语理解 心理模型 语言学
下载PDF
从口误透视言语生成的心理机制 被引量:4
7
作者 邱明明 《浙江社会科学》 CSSCI 北大核心 2012年第10期119-124,160,共6页
本文拟从心理语言学的理论出发,从认知的视角探索语言生成的心理机制。通过分析英语和汉语的言语失误语料来洞察语言生成过程中,不同语言单位在语言系统层面上的运作和处理方式,为了解心理机制的共性以便构建心理模式提供跨语言的参考... 本文拟从心理语言学的理论出发,从认知的视角探索语言生成的心理机制。通过分析英语和汉语的言语失误语料来洞察语言生成过程中,不同语言单位在语言系统层面上的运作和处理方式,为了解心理机制的共性以便构建心理模式提供跨语言的参考依据。 展开更多
关键词 语言生成 言语失误 心理机制 心理模式
下载PDF
基于语音生成逆向解的嘶音合成方法
8
作者 程启明 俞振利 张礼和 《科技通报》 北大核心 2001年第5期6-9,共4页
提出了一种应用三质量块声带模型与语音生成逆向映射法相结合的嘶音合成方法 .应用这种方法合成的嘶音信号与实际嘶音信号的实验比较结果表明 。
关键词 语音合音 语音生成模型 嘶音信号 语音生成逆向映射法 三质量块声带模型
下载PDF
基于DIVA模型的语音-映射单元自动获取
9
作者 张少白 刘欣 《智能系统学报》 CSCD 北大核心 2013年第4期305-311,共7页
针对DIVA模型中存在的"感知能力与语音生成技巧发育不平衡"问题,提出了一种自动获取语音-映射单元的方法.该方法将人耳模拟为一个具有不同带宽的并联带通滤波器组,分别与模型中21维度的听觉存储空间相关联,对不同听觉的不同反... 针对DIVA模型中存在的"感知能力与语音生成技巧发育不平衡"问题,提出了一种自动获取语音-映射单元的方法.该方法将人耳模拟为一个具有不同带宽的并联带通滤波器组,分别与模型中21维度的听觉存储空间相关联,对不同听觉的不同反应,分别考虑其频带的屏蔽效应、听觉响度与频率的关系.在读取语音输入信号的过程中,模型能较好地获得初始听觉表示,其方式与婴儿咿呀学语的过程基本一致.仿真实验表明,通过边界定义、相似性比较以及搜索更新等步骤,此方法能很好地进行初始输入模式的自组织匹配,并最终使DIVA模型更具语音获取的自然特性. 展开更多
关键词 DIVA模型 音素 语音-映射单元 语音生成与获取
下载PDF
双模态语音识别中乘积HMM权重系数与瞬时SNR的关系研究
10
作者 赵晖 顾亚强 唐朝京 《计算机应用》 CSCD 北大核心 2009年第B12期279-281,285,共4页
在有噪声污染等复杂情况下,为了能够得到更高的语音识别率,提出了一种新的乘积隐马尔可夫模型(HMM)用于双模态语音识别,研究并确定了模型中权重系数与瞬时信噪比(SNR)之间的关系。该模型在独立训练音频和视频HMM的基础上,建立二维训练模... 在有噪声污染等复杂情况下,为了能够得到更高的语音识别率,提出了一种新的乘积隐马尔可夫模型(HMM)用于双模态语音识别,研究并确定了模型中权重系数与瞬时信噪比(SNR)之间的关系。该模型在独立训练音频和视频HMM的基础上,建立二维训练模型,并使用重估策略保证更高的准确性。同时引入广义几率递减(GPD)算法,调整音视频特征的权重系数。实验结果表明,提出的方法在噪声环境下体现出了良好稳定的识别性能。 展开更多
关键词 双模态语音识别 乘积隐马尔可夫模型 权重系数 重估 广义几率递减算法
下载PDF
俄罗斯的言语生成模型理论 被引量:6
11
作者 贾旭杰 《解放军外国语学院学报》 北大核心 2002年第3期31-34,共4页
言语的生成是心理语言学研究中的一个重要课题。西方心理语言学界比较流行的言语生成模型有串行模型、并行模型和列维特 (Levelt)模型三种。俄罗斯心理语言学家们从维果茨基 (Л .С .Выготский)开始 ,建构了一系列言语生成模... 言语的生成是心理语言学研究中的一个重要课题。西方心理语言学界比较流行的言语生成模型有串行模型、并行模型和列维特 (Levelt)模型三种。俄罗斯心理语言学家们从维果茨基 (Л .С .Выготский)开始 ,建构了一系列言语生成模型 。 展开更多
关键词 言语生成 言语活动 模型
下载PDF
Three Elements That Affect the Realisation of Subject-Verb Agreement in the Speech Production of L2 Speakers of English with L1 Chinese 被引量:1
12
作者 Yi MA Yige Zou 《Chinese Journal of Applied Linguistics》 2018年第3期376-395,398,共21页
The experiment presented in this research is targeting a 'positional' stage of a 'modular' model of speech production originally proposed by Levelt (1989), Bock & Levelt (1994), where selected lemmas are inse... The experiment presented in this research is targeting a 'positional' stage of a 'modular' model of speech production originally proposed by Levelt (1989), Bock & Levelt (1994), where selected lemmas are inserted into syntactic frames. Results suggest a difference between L1 and L2 English speakers at the positional stage. While this might suggest that the speech planning process is different in native and non-native speakers, an alternative view is also proposed that the observed differences are the result of differences in the way that linguistic forms are stored, rather than a fundamental difference in the way that speech is planned. This result indicates main verb, copula be & local dependency effect are the three elements that affect the realization of English subject-verb agreement, and helps us locate the phase where L2 subject-verb agreement errors happen. 展开更多
关键词 second language production speech production model L2 subject-verb agreement local dependency effect
原文传递
一种改进的伪逆控制方案在DIVA模型中的应用
13
作者 张昕 张少白 《南京邮电大学学报(自然科学版)》 北大核心 2012年第3期81-85,共5页
语音生成与获取是一个涉及大脑诸多部位的复杂认知过程,这个过程包括一种从依照句法和语义组织句子或短语的表述一直延伸到音素产生的分层结构。DIVA(directions into velocities of artculators)模型,是一种关于语音生成与获取后描述... 语音生成与获取是一个涉及大脑诸多部位的复杂认知过程,这个过程包括一种从依照句法和语义组织句子或短语的表述一直延伸到音素产生的分层结构。DIVA(directions into velocities of artculators)模型,是一种关于语音生成与获取后描述相关处理过程的数学模型,也是一种为了生成单词、音节或者音素,用来控制模拟声道运动的自适应网络模型。在当今真正具有生物学意义的语音生成和获取的神经网络模型中,DIVA模型的定义和测试相对而言是最彻底的,并且是唯一一种应用伪逆控制方案的模型。文中引入基于零空间的伪逆算法,对DIVA模型中的伪逆控制求解算法进行改进,从而更加精确地获得了DIVA模型的相应参数,提高了DIVA模型的鲁棒性。 展开更多
关键词 语音生成与获取 DIVA模型 伪逆算法 零空间 鲁棒性
下载PDF
关于DIVA模型中语速对语音生成影响的研究
14
作者 刘燕燕 张少白 《计算机技术与发展》 2011年第12期33-35,40,共4页
着重研究语速对语音生成的影响。过去有不少人对此进行了研究,指出语速的变化对元音和辅音的运动产生了不同的影响,但是具体是什么样的影响并没有明确指出。基于DIVA模型,通过修改ODV和AVV活动的公式对语速对元音和辅音运动产生的影响... 着重研究语速对语音生成的影响。过去有不少人对此进行了研究,指出语速的变化对元音和辅音的运动产生了不同的影响,但是具体是什么样的影响并没有明确指出。基于DIVA模型,通过修改ODV和AVV活动的公式对语速对元音和辅音运动产生的影响进行了研究和探讨。仿真实验表明,语速的增加导致了辅音运动速度的增加,但元音运动速度只增加了少量的值,有时甚至还会减小。最终得出的结论是:尽管语速对元音和辅音的运动速度产生了不同的影响,但最大速度与运动距离比值的增量却是大致相同的。 展开更多
关键词 DIVA模型 语音生成 凸形区域 语速
下载PDF
Feedforward Control of a 3-D Physiological Articulatory Model for Vowel Production
15
作者 方强 Akikazu Nishikido Jianwu Dang 《Tsinghua Science and Technology》 SCIE EI CAS 2009年第5期617-622,共6页
A three-dimensional (3-D) physiological articulatory model was developed to account for the biomechanical properties of the speech organs in speech production. Control of the model to investigate the mechanism of sp... A three-dimensional (3-D) physiological articulatory model was developed to account for the biomechanical properties of the speech organs in speech production. Control of the model to investigate the mechanism of speech production requires an efficient control module to estimate muscle activation patterns, which is used to manipulate the 3-D physiological articulatory model, according to the desired articulatory posture. For this purpose, a feedforward control strategy was developed by mapping the articulatory target to the corresponding muscle activation pattern via the intrinsic representation of vowel articulation. In this process, the articulatory postures are first mapped to the corresponding intrinsic representations; then, the articulatory postures are clustered in the intrinsic representations space and a nonlinear function is approximated for each cluster to map the intrinsic representation of vowel articulation to the muscle activation pattern by using general regression neural networks (GRNN). The results show that the feedforward control module is able to manipulate the 3-D physiological articulatory model for vowel production with high accuracy both acoustically and articulatorily. 展开更多
关键词 speech production articulatory model articulatory posture intrinsic dimension feedforward control
原文传递
DFSMN语音识别技术在智能安全帽上的应用研究 被引量:2
16
作者 卓凡 陈凯 刘宪国 《中国高新科技》 2021年第20期48-50,共3页
语音是最自然的输入手段。近年来语音识别已被广泛应用于智能家具、车载导航等场合,安全帽作为工地必备的物品,吸纳语音处理技术是必然趋势。文章在智能安全帽的基础上,依据现有服务器搭建语音识别云,基于深度神经网络的语音识别模型—... 语音是最自然的输入手段。近年来语音识别已被广泛应用于智能家具、车载导航等场合,安全帽作为工地必备的物品,吸纳语音处理技术是必然趋势。文章在智能安全帽的基础上,依据现有服务器搭建语音识别云,基于深度神经网络的语音识别模型——DFSMN声学模型结合改进Transformer语言模型的语音识别系统,对语音识别技术进行了研究,从安全帽现状、语音识别技术的实现等诸多方面阐述了语音识别在工地生产中的应用构想,为语音识别的人机交互新技术在工地生产的大量应用提供理论支持。 展开更多
关键词 语音识别 工地生产 DFSMN声学模型
下载PDF
A Real-Time Oral Cavity Gesture Based Words Synthesizer Using Sensors
17
作者 Palli Padmini C.Paramasivam +2 位作者 G.Jyothish Lal Sadeen Alharbi Kaustav Bhowmick 《Computers, Materials & Continua》 SCIE EI 2022年第6期4523-4554,共32页
The present system experimentally demonstrates a synthesis of syllables and words from tongue manoeuvers in multiple languages,captured by four oral sensors only.For an experimental demonstration of the system used in... The present system experimentally demonstrates a synthesis of syllables and words from tongue manoeuvers in multiple languages,captured by four oral sensors only.For an experimental demonstration of the system used in the oral cavity,a prototype tooth model was used.Based on the principle developed in a previous publication by the author(s),the proposed system has been implemented using the oral cavity(tongue,teeth,and lips)features alone,without the glottis and the larynx.The positions of the sensors in the proposed system were optimized based on articulatory(oral cavity)gestures estimated by simulating the mechanism of human speech.The system has been tested for all English alphabets and several words with sensor-based input along with an experimental demonstration of the developed algorithm,with limit switches,potentiometer,and flex sensors emulating the tongue in an artificial oral cavity.The system produces the sounds of vowels,consonants,and words in English,along with the pronunciation of meanings of their translations in four major Indian languages,all from oral cavity mapping.The experimental setup also caters to gender mapping of voice.The sound produced from the hardware has been validated by a perceptual test to verify the gender and word of the speech sample by listeners,with∼98%and∼95%accuracy,respectively.Such a model may be useful to interpret speech for those who are speech-disabled because of accidents,neuron disorder,spinal cord injury,or larynx disorder. 展开更多
关键词 English vowels and consonants oral cavity proposed system SENSORS speech-disabled speech production vocal tract model
下载PDF
言语生成理论及其对英语口语教学的启示
18
作者 万狮狮 《齐齐哈尔师范高等专科学校学报》 2013年第3期117-118,共2页
我国高校毕业生普遍英语应用能力很差,尤其是口语能力。因此,必须改革传统的教学方式,寻找全新的方法来提高学生的口语能力。本文以Levelt的言语生成模型为理论基础,探讨了我国大学英语口语教学存在的不足。最后,本文针对我国英语口语... 我国高校毕业生普遍英语应用能力很差,尤其是口语能力。因此,必须改革传统的教学方式,寻找全新的方法来提高学生的口语能力。本文以Levelt的言语生成模型为理论基础,探讨了我国大学英语口语教学存在的不足。最后,本文针对我国英语口语教学提出了几点建议,期望能给英语口语教学改革带来一些新思路。 展开更多
关键词 言语生成模型 英语口语 英语口语教学
下载PDF
第二语言口语流利性测定指标的研究
19
作者 刘丽 《齐齐哈尔师范高等专科学校学报》 2012年第1期138-140,共3页
第二语言口语流利性是二语口语表达能力的重要体现之一,对其进行界定和测定是深入研究二语口语流利性的基础。笔者在综述前人对其研究的基础上,并结合自己的观察和实验,关于第二语言口语流利性的测定标准提出自己的见解。
关键词 口语流利性 口语流利性的测定 语言产出模式
下载PDF
汉语神经分析系统研究现状与展望 被引量:1
20
作者 张少白 王勇 +1 位作者 何利文 成谢锋 《中国科学:信息科学》 CSCD 北大核心 2015年第7期849-868,共20页
在神经生理学和神经解剖学的基础上仿真和描述大脑中涉及语音生成和理解区域的相关功能是目前人工语音合成系统的重要研究领域.波士顿大学语音实验室Guenther教授及其所带领的研究小组成功研制出了一种称之为"神经分析系统(Neuraly... 在神经生理学和神经解剖学的基础上仿真和描述大脑中涉及语音生成和理解区域的相关功能是目前人工语音合成系统的重要研究领域.波士顿大学语音实验室Guenther教授及其所带领的研究小组成功研制出了一种称之为"神经分析系统(Neuralynx System)"的仪器.这种仪器可以让使用者将自己头脑里想象的东西用语音合成系统正确地表述出来,其所依赖的语言背景为英文的29个基本音素.能否将中国人大脑里想象的东西也"阅读出来"呢?汉语与英语的发音区别很大,加工脑机制也颇为不同,仅基本发音音素就多于70个.那么,要想构建适用于中国人思维过程的汉语神经分析系统CNS(Chinese Neuralynx System),需要在Guenther的研究基础上做些什么样的补充和修改,或者说,CNS本身有哪些需要关注的特殊问题,其发展趋势、重点和难点是哪些?这是本文要加以叙述和探讨的主要问题.本文内容包括:(1)Neuralynx System研究现状;(2)国际、国内有关CNS的研究现状及存在问题;(3)CNS发展趋势和展望.通过本文的介绍,期望从事语音生成与获取以及汉语脑机制等领域研究工作的研究者们能有所启迪和收获. 展开更多
关键词 神经分析系统 汉语 音素 DIVA模型 语音生成与获取
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部