期刊文献+
共找到253篇文章
< 1 2 13 >
每页显示 20 50 100
Lattice Vector Quantization Applied to Speech and Audio Coding 被引量:1
1
作者 Minjie Xie 《ZTE Communications》 2012年第2期25-33,共9页
Lattice vector quantization (LVQ) has been used for real-time speech and audio coding systems. Compared with conventional vector quantization, LVQ has two main advantages: It has a simple and fast encoding process,... Lattice vector quantization (LVQ) has been used for real-time speech and audio coding systems. Compared with conventional vector quantization, LVQ has two main advantages: It has a simple and fast encoding process, and it significantly reduces the amount of memory required. Therefore, LVQ is suitable for use in low-complexity speech and audio coding. In this paper, we describe the basic concepts of LVQ and its advantages over conventional vector quantization. We also describe some LVQ techniques that have been used in speech and audio coding standards of international standards developing organizations (SDOs). 展开更多
关键词 vector quantization lattice vector quantization speech and audio coding transform coding
下载PDF
A REAL-TIME IMPLEMENTATION OF 4.2Kb/s CELP SPEECH CODING
2
作者 Bao Changchun Dai Yisong Fan Changxin(information Science Institute, Xidian University, Xi’an 710071) (Dept. of Electronic Eng., Jilin University of technology 130025) 《Journal of Electronics(China)》 1997年第1期52-58,共7页
This paper presents a real-time implementation of 4.2Kb/s CELP speech coding on single DSP chip. An algorithm reducing search complexity for adaptive codebook is suggested; the solving method that the parameters are c... This paper presents a real-time implementation of 4.2Kb/s CELP speech coding on single DSP chip. An algorithm reducing search complexity for adaptive codebook is suggested; the solving method that the parameters are changed into LSP parameters is discussed. The realtime implementation process of this coding on a commercial development board with a single TMS320C30 is described. 展开更多
关键词 speech coding linear prediction vector quantization
下载PDF
Linear Discriminant Analysis and Kernel Vector Quantization for Mandarin Digits Recognition
3
作者 赵军辉 谢湘 匡镜明 《Journal of Beijing Institute of Technology》 EI CAS 2004年第4期385-388,共4页
Linear discriminant analysis and kernel vector quantization are integrated into vector quantization based speech recognition system for improving the recognition accuracy of Mandarin digits. These techniques increase ... Linear discriminant analysis and kernel vector quantization are integrated into vector quantization based speech recognition system for improving the recognition accuracy of Mandarin digits. These techniques increase the class separability and optimize the clustering procedure. Speaker-dependent (SD) and speaker-independent (SI) experiments are performed to evaluate the performance of the proposed method. The experiment results show that the proposed method is capable of reaching the word error rate of 3.76% in SD case and 6.60 % in SI case. Such a system can be suitable for being embedded in personal digital assistant(PDA), mobile phone and so on to perform voice controlling such as digit dialing, calculating, etc. 展开更多
关键词 linear discriminant analysis kernel vector quantization speech recognition
下载PDF
A Novel Low-bit-rate Speech Coding Based on Decomposition of the Pitch-cycle Waveform of the Linear Predictive Residual
4
作者 Bao ChangchunAssociate professor of Information Engineering, Beijing Polytechnic University, Ph.D, CIE senior member (Department of Electronic Engineering, Beijing Polytechnic University, Beijing 100022) Fan ChangxinProfessor of Information Engineerin 《通信学报》 EI CSCD 北大核心 1998年第5期39-44,共6页
ANovelLowbitrateSpechCodingBasedonDecompositionofthePitchcycleWaveformoftheLinearPredictiveResidualBaoCh... ANovelLowbitrateSpechCodingBasedonDecompositionofthePitchcycleWaveformoftheLinearPredictiveResidualBaoChangchun(Departm... 展开更多
关键词 线性估计 语音编码 失量量化 分解 节圈波形
下载PDF
A Review of Speech Coding 被引量:3
5
作者 Bao ChangchunAssociate professor of Information Engineering, Beijing Polytechnic University, Ph.D, CIE senior member (Department of Electronic Engineering, Beijing Polytechnic University, Beijing 100022) Fan ChangxinProfessor with Xidian University, C 《通信学报》 EI CSCD 北大核心 1998年第5期45-56,共12页
AReviewofSpechCodingBaoChangchun(DepartmentofElectronicEngineering,BeijingPolytechnicUniversity,Beijing10... AReviewofSpechCodingBaoChangchun(DepartmentofElectronicEngineering,BeijingPolytechnicUniversity,Beijing100022)FanChangxin?.. 展开更多
关键词 语音编码 线性估计 综合分析 波形编码
下载PDF
Robust Speech Recognition System Using Conventional and Hybrid Features of MFCC,LPCC,PLP,RASTA-PLP and Hidden Markov Model Classifier in Noisy Conditions 被引量:7
6
作者 Veton Z.Kepuska Hussien A.Elharati 《Journal of Computer and Communications》 2015年第6期1-9,共9页
In recent years, the accuracy of speech recognition (SR) has been one of the most active areas of research. Despite that SR systems are working reasonably well in quiet conditions, they still suffer severe performance... In recent years, the accuracy of speech recognition (SR) has been one of the most active areas of research. Despite that SR systems are working reasonably well in quiet conditions, they still suffer severe performance degradation in noisy conditions or distorted channels. It is necessary to search for more robust feature extraction methods to gain better performance in adverse conditions. This paper investigates the performance of conventional and new hybrid speech feature extraction algorithms of Mel Frequency Cepstrum Coefficient (MFCC), Linear Prediction Coding Coefficient (LPCC), perceptual linear production (PLP), and RASTA-PLP in noisy conditions through using multivariate Hidden Markov Model (HMM) classifier. The behavior of the proposal system is evaluated using TIDIGIT human voice dataset corpora, recorded from 208 different adult speakers in both training and testing process. The theoretical basis for speech processing and classifier procedures were presented, and the recognition results were obtained based on word recognition rate. 展开更多
关键词 speech Recognition Noisy Conditions Feature Extraction Mel-Frequency Cepstral Coefficients linear Predictive coding Coefficients Perceptual linear Production RASTA-PLP Isolated speech Hidden Markov Model
下载PDF
Web Voice Browser Based on an ISLPC Text-to-Speech Algorithm
7
作者 LIAO Rikun JI Yuefeng LI Hui 《Wuhan University Journal of Natural Sciences》 CAS 2006年第5期1157-1160,共4页
A kind of Web voice browser based on improved synchronous linear predictive coding (ISLPC) and Text-toSpeech (TTS) algorithm and Internet application was proposed. The paper analyzes the features of TTS system wit... A kind of Web voice browser based on improved synchronous linear predictive coding (ISLPC) and Text-toSpeech (TTS) algorithm and Internet application was proposed. The paper analyzes the features of TTS system with ISLPC speech synthesis and discusses the design and implementation of ISLPC TTS-based Web voice browser. The browser integrates Web technology, Chinese information processing, artificial intelligence and the key technology of Chinese ISLPC speech synthesis. It's a visual and audible web browser that can improve information precision for network users. The evaluation results show that ISLPC-based TTS model has a better performance than other browsers in voice quality and capability of identifying Chinese characters. 展开更多
关键词 improved synchronous linear predictive coding (ISLPC) Text-to-speech (TTS) Web voice browser voice quality
下载PDF
基于小波变换和压缩感知的低速率语音编码方案 被引量:23
8
作者 叶蕾 杨震 郭海燕 《仪器仪表学报》 EI CAS CSCD 北大核心 2010年第7期1569-1575,共7页
本文提出一种新的低速率语音编码方案,基于语音信号小波变换高频系数的稀疏性,利用压缩感知原理,将小波变换高频系数进行压缩感知投影成数据量大大减少的观测序列,然后对观测序列采用码激励线性预测技术进行编解码,根据解码后的观测序列... 本文提出一种新的低速率语音编码方案,基于语音信号小波变换高频系数的稀疏性,利用压缩感知原理,将小波变换高频系数进行压缩感知投影成数据量大大减少的观测序列,然后对观测序列采用码激励线性预测技术进行编解码,根据解码后的观测序列,利用线性规划技术对小波变换高频系数进行重构,小波变换低频系数采用矢量量化技术编解码,并采用后置低通滤波器改善解码后小波高低频系数合成语音的听觉效果。该编码方案在低数码率(2.64~3.5 Kb/s)时得到的重构语音平均MOS分为3.0~3.4,达到4.8 Kb/s码激励线性预测语音编码质量。 展开更多
关键词 小波变换 压缩感知 码激励线性预测 矢量量化 线性规划
下载PDF
一种高效、低存储的线谱频率参数矢量量化器 被引量:5
9
作者 李靓 鲍长春 白燕宁 《北京工业大学学报》 CAS CSCD 北大核心 2005年第2期130-135,共6页
为了降低线谱频率(LSF)参数矢量量化器的搜索复杂度和码字存储单元,利用LSF参数的帧内和帧间相关性,设计了一种LSF参数的预测式多级分裂矢量量化器.该量化器对LSF参数的预测残差矢量进行两级矢量量化,其中第2级的误差矢量分裂成2个维数... 为了降低线谱频率(LSF)参数矢量量化器的搜索复杂度和码字存储单元,利用LSF参数的帧内和帧间相关性,设计了一种LSF参数的预测式多级分裂矢量量化器.该量化器对LSF参数的预测残差矢量进行两级矢量量化,其中第2级的误差矢量分裂成2个维数分别为4和6的子矢量进行矢量量化,采用瞬时联合多级矢量量化器设计算法设计码本,应用M-L树搜索算法搜索码字,降低了搜索复杂度和码字存储单元,在20 bit时,平均谱失真小于1 dB. 展开更多
关键词 语音编码 线性预测 线谱频率 矢量量化
下载PDF
基于神经网络的语音识别研究 被引量:10
10
作者 滕云 贺春林 岳淼 《重庆师范大学学报(自然科学版)》 CAS 2010年第4期73-76,共4页
由于具有良好的抽象分类特性,神经网络现已应用于语音识别系统的研究和开发,并成为解决识别相关问题的有效工具。为解决一般语音识别系统准确率较低的问题,本文分别给出了由循环神经网络(RNN)和多层感知器(MLP)组成识别模块的两种语音... 由于具有良好的抽象分类特性,神经网络现已应用于语音识别系统的研究和开发,并成为解决识别相关问题的有效工具。为解决一般语音识别系统准确率较低的问题,本文分别给出了由循环神经网络(RNN)和多层感知器(MLP)组成识别模块的两种语音识别系统,并对二者识别的准确性进行了比较。介绍了特征提取模块的主要工作步骤并讨论了组成识别模块的上述两种神经网络结构。其中,特征提取模块利用线性预测编码(LPC)倒谱编码器,把输入语音翻译成LPC倒谱空间中的曲线;而识别模块完成对某个特征空间曲线之间的联系和单词的识别。实验结果表明,MLP方法准确率高于RNN方法,而RNN方法准确率可达85%。 展开更多
关键词 神经网络 语音识别 循环神经网络 多层感知器 线性预测 矢量量化
下载PDF
基于局部余弦变换的2.4kb/s低比特率语音编码 被引量:3
11
作者 董恩清 汪一鸣 +2 位作者 李宏亮 侯兴松 刘贵忠 《西安交通大学学报》 EI CAS CSCD 北大核心 2003年第4期388-391,共4页
系统地设计了一个基于局部余弦变换的 2 4kb/s低比特率的语音编码器 .对局部余弦变换系数采用分维矢量量化方法进行量化 ,码书设计采用LGB算法 .编码中的码书搜索采用树形快速搜索算法 .通过主观非正式听力测试和客观参数评价 ,从理解... 系统地设计了一个基于局部余弦变换的 2 4kb/s低比特率的语音编码器 .对局部余弦变换系数采用分维矢量量化方法进行量化 ,码书设计采用LGB算法 .编码中的码书搜索采用树形快速搜索算法 .通过主观非正式听力测试和客观参数评价 ,从理解性和自然度两方面来看 ,用设计的 2 4kb/s低比特率的编码方法编码的语音质量比FS10 15 (LPC 10e)编码标准编码的语音质量要好 ,而且具有较强的鲁棒性 。 展开更多
关键词 局部余弦变换 语音编码 低比特率 变换编码 矢量量化
下载PDF
低速率声码器中残差谱的变维矢量量化 被引量:3
12
作者 鲍长春 王都生 樊昌信 《电子学报》 EI CAS CSCD 北大核心 1999年第1期12-16,共5页
基于一个基音周期内语音线性预测残差(LPRlinearpredictionresidual)波形,提出了一种简单而有效的LPR谱变维矢量量化(VDVQ)方法,即利用具有固定维数的通用码本对LPR谱幅度形状进行矢量量... 基于一个基音周期内语音线性预测残差(LPRlinearpredictionresidual)波形,提出了一种简单而有效的LPR谱变维矢量量化(VDVQ)方法,即利用具有固定维数的通用码本对LPR谱幅度形状进行矢量量化.通用码本和结构化的VQ相组合减少了存储和计算复杂度,产生了高的量化效率,增强了编码语音的感性质量.计算机仿真结果表明,利用该VDVQ技术设计的24kb/s语音编码器产生了高质量合成语音. 展开更多
关键词 语音编码 线性预测 变维矢量量化 声码器
下载PDF
一种采用混合激励的超低速率分段声码器 被引量:3
13
作者 闵刚 张雄伟 +1 位作者 杨吉斌 安云峰 《数据采集与处理》 CSCD 北大核心 2009年第5期680-685,共6页
为满足通信和多媒体存储对超低速语音编码的要求,提出了一种平均编码速率为200和300 bps的超低速率声码器算法。结合分段声码器和M ELP算法的优点,该算法对语音建立了混合激励分段编码模型。提出了线谱对参数的变维矩阵量化和激励参数... 为满足通信和多媒体存储对超低速语音编码的要求,提出了一种平均编码速率为200和300 bps的超低速率声码器算法。结合分段声码器和M ELP算法的优点,该算法对语音建立了混合激励分段编码模型。提出了线谱对参数的变维矩阵量化和激励参数的变维矢量量化方案,在超低速率条件下获得了较好的量化效果,同时有效地降低了码本存储量。非正式主观听力测试表明:编码速率为300 bps时,重建语音保持了较高的可懂度和一定的自然度;编码速率为200 bps时,语音质量仍可以接受。 展开更多
关键词 语音编码 混合激励 矢量量化 语音分段
下载PDF
SELP声码器基音周期参数量化合成改进算法 被引量:3
14
作者 计哲 李晔 +1 位作者 崔慧娟 唐昆 《高技术通讯》 EI CAS CSCD 北大核心 2010年第1期45-48,共4页
针对正弦激励线性预测(SELP)声码器在解码端使用整型基音周期会引入额外舍入误差的问题,提出了一种码本整型化修正算法,该算法通过对码本中的各个码字在线性域进行取整,达到与解码端反量化过程一致的效果。测试结果表明,该算法能够有效... 针对正弦激励线性预测(SELP)声码器在解码端使用整型基音周期会引入额外舍入误差的问题,提出了一种码本整型化修正算法,该算法通过对码本中的各个码字在线性域进行取整,达到与解码端反量化过程一致的效果。测试结果表明,该算法能够有效地降低基音周期对数域矢量量化的量化误差,并且能够将合成语音的平均意见得分(MOS)提高0.05左右,明显改善合成语音质量。 展开更多
关键词 语音编码 基音周期 矢量量化 特征参数
下载PDF
归一化自适应预测矢量量化算法压缩SAR原始数据 被引量:5
15
作者 关振红 朱岱寅 朱兆达 《电子与信息学报》 EI CSCD 北大核心 2006年第3期507-511,共5页
该文提出归一化自适应预测矢量量化(NAPVQ)算法压缩SAR原始数据。NAPVQ算法先采用矢量线性预测器对输入矢量进行预测,再对原矢量与预测矢量之间的残差矢量进行矢量量化。该算法可视为差分脉冲调制在矢量量化中的拓展,其性能优于块自适... 该文提出归一化自适应预测矢量量化(NAPVQ)算法压缩SAR原始数据。NAPVQ算法先采用矢量线性预测器对输入矢量进行预测,再对原矢量与预测矢量之间的残差矢量进行矢量量化。该算法可视为差分脉冲调制在矢量量化中的拓展,其性能优于块自适应量化(BAVQ)算法以及归一化预测自适应量化(NPAQ)算法。对算法复杂度的进一步分析表明,NAPVQ算法能获得复杂度和性能之间比较合理的折衷,具有实用价值。 展开更多
关键词 合成孔径雷达 数据压缩 差分脉冲调制 矢量量化 预测矢量量化
下载PDF
基于局部余弦变换的低比特变速率语音编码算法研究 被引量:3
16
作者 董恩清 蔡光跃 李永利 《通信学报》 EI CSCD 北大核心 2005年第5期122-127,共6页
提出将局部余弦变换(LCT)算法应用于语音编码中,系统设计了一个平均比特率近1.6kbit/s的低比特变速率语音编码器。在变比特率编码器设计中采用SVM算法进行VAD检测。激活语音帧的语音模式采用GSM半速率编码中的划分方法,但将其中的强浊... 提出将局部余弦变换(LCT)算法应用于语音编码中,系统设计了一个平均比特率近1.6kbit/s的低比特变速率语音编码器。在变比特率编码器设计中采用SVM算法进行VAD检测。激活语音帧的语音模式采用GSM半速率编码中的划分方法,但将其中的强浊音模式和中浊音模式合并为一个中强浊音模式。对各类语音模式和无声帧(背景噪声)的局部余弦变换系数采用分维矢量量化算法进行量化,码书设计采用LGB算法。编码中的码书搜索采用树形快速搜索算法。通过主观非正式听力测试表明设计的变比特率编码器编码的重建语音MOS约为3.15,与比特率为2.4kbit/s美国联邦声码器标准MELP的重建语音相当,具有较强的顽健性,适合于对存在各种环境噪声的语音进行编码。 展开更多
关键词 局部余弦变换 语音编码 变速率编码 矢量量化 支持向量机
下载PDF
ITU-TG.729算法及其实时实现 被引量:5
17
作者 李淑红 黄献波 《电声技术》 北大核心 2004年第3期21-23,26,共4页
在介绍G.729编解码算法原理和TMS320C541定点DSP芯片的基础上,详细讨论了G.729编解码算法在TMS320C541上实时实现的关键技术。实验结果表明,单片TMS320C541能够实时实现G.729语音编解码算法。
关键词 G.729编解码算法 TMS320C541 DSP芯片 语音压缩编码 线性预测 矢量量化
下载PDF
甚低速率语音编码中的高效模拟退火算法研究 被引量:5
18
作者 邹霞 陈亮 张雄伟 《系统仿真学报》 CAS CSCD 2004年第10期2181-2184,共4页
为了解决600bps甚低速率语音编码中码本矢量量化信噪比低以及抗信道误码能力差的难题,本文提出了一种改进的模拟退火算法,在600bps甚低速率语音编码中得到了成功的应用。首先,采用改进的模拟退火算法设计语音编码参数矢量量化码本。然后... 为了解决600bps甚低速率语音编码中码本矢量量化信噪比低以及抗信道误码能力差的难题,本文提出了一种改进的模拟退火算法,在600bps甚低速率语音编码中得到了成功的应用。首先,采用改进的模拟退火算法设计语音编码参数矢量量化码本。然后,采用模拟退火算法分配码本序号,以此提高在信道误码条件下语音编码算法的鲁棒性。仿真结果表明本算法的量化信噪比与经典的LBG算法相比改善了0.4dB左右,平均误码失真与采用随机分配码本序号的方法相比改善60%以上。非正式主观试听表明600bps语音编码算法的合成语音具有良好的可懂度和自然度,并且在1%信道误码条件下仍然具有良好的性能。 展开更多
关键词 语音处理 甚低速率语音编码 矢量量化 模拟退火
下载PDF
2.4kb/s MELP算法设计 被引量:3
19
作者 胡剑凌 徐盛 陈健 《上海交通大学学报》 EI CAS CSCD 北大核心 2000年第6期789-792,共4页
提出了一种新的工作于极低码率下的混合激励线性预测 ( MELP)声码器 .该声码器结合了线性预测编码 ( LPC)和多带激励编码算法的优点 ,对算法和量化方案重新进行了设计和改造 ,其主要特征包括改进的基音检测算法、混合的周期脉冲和随机... 提出了一种新的工作于极低码率下的混合激励线性预测 ( MELP)声码器 .该声码器结合了线性预测编码 ( LPC)和多带激励编码算法的优点 ,对算法和量化方案重新进行了设计和改造 ,其主要特征包括改进的基音检测算法、混合的周期脉冲和随机噪声激励、有效的线性谱频率 ( LSF)参数量化以及激励谱形状表示 .非正式主观测试表明 ,由采用本算法的一个 2 .4kb/s编码器所重建的语音质量略优于美国联邦标准 4.8kb/s码激励线性预测编码 ( CELP) 展开更多
关键词 语音编码 线性预测 混合激励 声码器 算法 设计
下载PDF
基于ACELP的嵌入式语音编码算法 被引量:5
20
作者 范睿 鲍长春 李锐 《通信学报》 EI CSCD 北大核心 2007年第10期48-54,共7页
为实现对激励信号的精细描述,提出了一种基于ACELP模型的嵌入式语音编码算法,该算法通过逐层增加脉冲数以及采用一种新的自适应码书结构,能够保证各层编码的相对独立性以及编码器参数的最佳匹配。与以往基于ACELP模型的嵌入式编码算法相... 为实现对激励信号的精细描述,提出了一种基于ACELP模型的嵌入式语音编码算法,该算法通过逐层增加脉冲数以及采用一种新的自适应码书结构,能够保证各层编码的相对独立性以及编码器参数的最佳匹配。与以往基于ACELP模型的嵌入式编码算法相比,实现的编码器能够获得具有嵌入结构的码流,不仅能够保证核心层的合成语音质量,而且在增强层也取得了与对应速率的现有标准编码器相当的合成语音质量。 展开更多
关键词 语音编码 码激励线性预测 嵌入式编码 自适应码书 代数码书
下载PDF
上一页 1 2 13 下一页 到第
使用帮助 返回顶部