期刊文献+
共找到1,788篇文章
< 1 2 90 >
每页显示 20 50 100
听到“牛黄”能想到“黄牛”吗?——口语识别中的语音位置编码机制
1
作者 韩海宾 李兴珊 《心理科学进展》 CSSCI CSCD 北大核心 2024年第9期1488-1501,共14页
在众多语言中,都存在一系列词汇,经过语音位置转置后仍能有效成词,典型如中文中的“牛黄”与“黄牛”。阐明这类可转置词汇在语言理解过程中的编码方式,是一项至关重要的研究课题。在阅读领域,学者们已就词汇的位置编码机制展开了讨论,... 在众多语言中,都存在一系列词汇,经过语音位置转置后仍能有效成词,典型如中文中的“牛黄”与“黄牛”。阐明这类可转置词汇在语言理解过程中的编码方式,是一项至关重要的研究课题。在阅读领域,学者们已就词汇的位置编码机制展开了讨论,然而针对口语加工中语音位置编码的认知机制,至今仍存在序列−灵活编码之争:早期口语识别理论认为语音位置编码主要以序列编码方式为主,而近年来的研究则发现,音位、音节和句子等层面上存在以灵活编码为主的语音位置编码方式。未来研究应深入探索与口语识别中语音编码相关的认知机理、神经机制、语言获得以及人工智能等重要问题,由于汉字词在形音对应关系和语音加工单元等方面独具特殊性,后续研究应对汉字词的语音位置编码予以特别关注。 展开更多
关键词 口语识别 语音位置编码 汉字词
下载PDF
基于Transformer的多编码器端到端语音识别 被引量:1
2
作者 庞江飞 孙占全 《电子科技》 2024年第4期1-7,共7页
当前广泛使用的Transformer模型具有良好的全局依赖关系捕捉能力,但其在浅层时容易忽略局部特征信息。针对该问题,文中提出了一种使用多个编码器来改善语音特征信息提取能力的方法。通过附加一个额外的卷积编码器分支来强化对局部特征... 当前广泛使用的Transformer模型具有良好的全局依赖关系捕捉能力,但其在浅层时容易忽略局部特征信息。针对该问题,文中提出了一种使用多个编码器来改善语音特征信息提取能力的方法。通过附加一个额外的卷积编码器分支来强化对局部特征信息的捕捉,弥补浅层Transformer对局部特征信息的忽视,有效实现音频特征序列全局和局部依赖关系的融合,即提出了基于Transformer的多编码器模型。在开源中文普通话数据集Aishell-1上的实验表明,在没有外部语言模型的情况下,相比于Transformer模型,基于Transformer的多编码器模型的字符错误率降低了4.00%。在内部非公开的上海话方言数据集上,文中所提模型的性能提升更加明显,其字符错误率从19.92%降低至10.31%,降低了48.24%。 展开更多
关键词 TRANSFORMER 语音识别 端到端 深度神经网络 编码 多头注意力 特征融合 卷积分支网络
下载PDF
基于混合语音压缩编码技术的综合通信业务系统设计
3
作者 李凌云 陈奕钊 +3 位作者 王国法 蒋剑伟 周品臣 谢臣 《广东通信技术》 2024年第8期63-69,共7页
压缩编码技术是语音通信的关键技术的之一。针对语音数据传输需采用标准G.729编码格式,且数据通信链路速率为10 kbit/s的窄带数据传输场景,提出了基于G.729+AMBE的混合语音压缩编码技术,研制了综合通信业务系统样机,实现了低速率下的语... 压缩编码技术是语音通信的关键技术的之一。针对语音数据传输需采用标准G.729编码格式,且数据通信链路速率为10 kbit/s的窄带数据传输场景,提出了基于G.729+AMBE的混合语音压缩编码技术,研制了综合通信业务系统样机,实现了低速率下的语音和即时通信业务传输。测试结果表明,在G.729、AMBE的语音压缩编码速率分别为8 kbit/s、2.4 kbit/s时,语音质量MOS主观评价等级为4级,即时通信文件接收延时在2.1 s左右,满足窄带通信链路中语音业务和即时通信业务的传输要求。 展开更多
关键词 语音压缩编码 G.729 AMBE 低速率 数据通信
下载PDF
Frequentis语音交换系统中编码原理的研究
4
作者 邱瑞鑫 《中国信息界》 2024年第2期207-210,共4页
引言.Frequentis语音交换系统是民航系统中进行空中交通管制时使用的重要语音通信设备,在飞行员和地面管制员的语音通信和空中交通指挥中扮演着极其重要的角色。其主要功能之一是将管制员所发送的模拟话音转换为数字信号,在系统中传输... 引言.Frequentis语音交换系统是民航系统中进行空中交通管制时使用的重要语音通信设备,在飞行员和地面管制员的语音通信和空中交通指挥中扮演着极其重要的角色。其主要功能之一是将管制员所发送的模拟话音转换为数字信号,在系统中传输。通过系统提供的各种类型的接口,如模拟无线接口(ERIF)、模拟有线接口(BCB)和IP接口(GPIF 05.40),将系统内部信号转换为对应接口类型语音信号发送出去,发挥语音数据交换的功能。其中,语音信号的数/模、模/数转换,即由模拟信号与数字码组之间的转换过程是最核心的原理。 展开更多
关键词 语音通信 无线接口 编码原理 模/数转换 数字信号 语音信号 码组 接口类型
下载PDF
水声通信中低码速率语音编码算法的研究 被引量:4
5
作者 肖东 莫福源 +2 位作者 陈庚 郭圣明 马力 《声学学报》 EI CSCD 北大核心 2013年第5期589-596,共8页
中远距离(>10 km)水声语音通信时,由于可利用带宽窄、复杂多变等不利因素对信息传输率的制约,语音编码速率应降到尽可能的低。利用水声信道传播时延大的特点,结合人耳听觉感知的特性,在深入研究混合激励线性预测编码(MELP)标准之后,... 中远距离(>10 km)水声语音通信时,由于可利用带宽窄、复杂多变等不利因素对信息传输率的制约,语音编码速率应降到尽可能的低。利用水声信道传播时延大的特点,结合人耳听觉感知的特性,在深入研究混合激励线性预测编码(MELP)标准之后,提出一种语音编码速率可调节的变比特率语音编码算法。其平均码速率约600 bps,主观语音质量评估平均得分(PESQ MOS)约2.8分。对该编码算法性能进行了计算机仿真和海上实验验证。实验及仿真表明,在误码率不高于10^(-3)时,本算法表现良好且稳定,合成语音清晰可懂,易于辨认说话人。 展开更多
关键词 语音编码算法 编码速率 水声通信 混合激励线性预测编码 计算机仿真 海上实验 信息传输率 语音通信
下载PDF
语音编码在聋生唇读汉字语音识别中的作用 被引量:13
6
作者 雷江华 孙灯勇 +1 位作者 刘昌 方俊明 《心理科学》 CSSCI CSCD 北大核心 2010年第2期315-317,293,共4页
本研究探讨了聋生唇读汉字语音识别中语音编码、助听器、音素可见性的作用。结果表明,编码方式、助听器与音素之间的交互作用在正确率和反应时上都显著,音素可见性在唇读汉字语音识别过程中作用明显,助听器明显作用于单韵母语音识别过... 本研究探讨了聋生唇读汉字语音识别中语音编码、助听器、音素可见性的作用。结果表明,编码方式、助听器与音素之间的交互作用在正确率和反应时上都显著,音素可见性在唇读汉字语音识别过程中作用明显,助听器明显作用于单韵母语音识别过程。尽管语音编码、口形运动编码与手指语编码共同作用于聋生唇读汉字语音识别的过程,但手指语编码与口形运动编码的作用明显不如语音编码,语音编码内在强力支持着聋生唇读汉字语音识别的过程,起着中间调节器的功能。 展开更多
关键词 聋生 唇读 编码方式 语音识别 助听器
下载PDF
G.729 CS-ACELP语音编码算法的优化及其DSP实现 被引量:13
7
作者 许丽红 阚海鹰 +1 位作者 余小清 万旺根 《上海大学学报(自然科学版)》 CAS CSCD 2001年第1期13-17,共5页
在研究 G.72 9CS- ACEL P语音编码算法基础上 ,通过分析其原理及基本特征 ,在实际应用中提出了优化算法的两种方案 ,大大降低了算法复杂度 ;并介绍了利用 DSP相应的开发环境对简化后的算法进行软件模拟 ,实验结果证明其输出语音仍然保... 在研究 G.72 9CS- ACEL P语音编码算法基础上 ,通过分析其原理及基本特征 ,在实际应用中提出了优化算法的两种方案 ,大大降低了算法复杂度 ;并介绍了利用 DSP相应的开发环境对简化后的算法进行软件模拟 ,实验结果证明其输出语音仍然保持了很高的合成品质 ;最后给出了以 DSP为核心的硬件系统构成框图 . 展开更多
关键词 G.729算法 语音编码 算法优化 DSP芯片
下载PDF
音素关联的多文种语音融合编码方法 被引量:6
8
作者 孙广武 戴永 +1 位作者 喻世东 李璇 《计算机工程与应用》 CSCD 2013年第19期217-221,共5页
依据异类文种之间、同类文种不同语音之间存在音素数据关联的特性,提出多文种语音数据融合编码方法。将不同文种存在的相同音素数据段块按段块模板截取语音样本序列,小波变换,提取特征矢量,生成共享模板集;任意字音或语句音串均按共享... 依据异类文种之间、同类文种不同语音之间存在音素数据关联的特性,提出多文种语音数据融合编码方法。将不同文种存在的相同音素数据段块按段块模板截取语音样本序列,小波变换,提取特征矢量,生成共享模板集;任意字音或语句音串均按共享模板集提供的元素进行编码与解码;以模板音素串构成的语音记录库按(音节、音素)索引。实验结果表明,单字语音数据压缩比、语音数据存储量、语音还原分段信噪比、主观评价得分等参数均明显优于已有方法,语音还原质量良好。 展开更多
关键词 语音 音素 关联 多文种 融合编码
下载PDF
言语产生中双词素词的语音编码 被引量:7
9
作者 周晓林 庄捷 于淼 《心理学报》 CSSCI CSCD 北大核心 2002年第3期242-247,共6页
采用同音判断和音节监控方法 ,考察言语产生中双词素词语音激活的特点。选用以偏正结构的双词素词为名称的图片和与双词素词中首尾两个词素同音的两组探测字作为实验材料 ,探测字在图片呈现后 5 0毫秒 (实验一 ) ,或图片呈现前 130 0毫... 采用同音判断和音节监控方法 ,考察言语产生中双词素词语音激活的特点。选用以偏正结构的双词素词为名称的图片和与双词素词中首尾两个词素同音的两组探测字作为实验材料 ,探测字在图片呈现后 5 0毫秒 (实验一 ) ,或图片呈现前 130 0毫秒 (实验二 )出现 ,要求被试判断出现的字是否与图片名称中任何一个词素同音。实验结果与绝大部分言语产生理论的预期相反 ,对图片名称第一词素的反应慢于第二词素。考虑到首尾两个词素对整词意义贡献的差别 ,作者把实验结果解释为词素意义对语音激活的作用 :第二词素的语义重要性决定了对应音节激活的快速性 ,双词素词中词素音位激活的速度和时间性受词义和词素意义激活程度的影响 ,而不完全取决于词素发音的序列性。实验不支持音位编码从左到右。 展开更多
关键词 言语产生 音位编码 语音编码 序列性加工 音节监控 同音判断
下载PDF
1.6Kb/s类MELP语音压缩编码器的FPGA实现 被引量:4
10
作者 郭立 王妙锋 +2 位作者 刘璐 郁理 李琳 《小型微型计算机系统》 CSCD 北大核心 2008年第8期1553-1556,共4页
基于"CPU软核+模块算法IP"的方法对一个1.6Kb/s类MELP语音压缩编码算法进行了实现,并将整个语音压缩编码器在FPGA上进行了整体验证,实验结果说明本文给出的语音压缩编码器的实现结构是可行的,能够满足语音压缩编码算法对实时... 基于"CPU软核+模块算法IP"的方法对一个1.6Kb/s类MELP语音压缩编码算法进行了实现,并将整个语音压缩编码器在FPGA上进行了整体验证,实验结果说明本文给出的语音压缩编码器的实现结构是可行的,能够满足语音压缩编码算法对实时性的要求,从而为下一阶段语音压缩编码器的芯片设计提供有力的可行性论据.同时,由于本文给出的语音压缩编码器的实现结构中的各模块算法IP对于许多语音压缩编码算法中都适用,因此该语音压缩编码器的实现结构对不同的语音压缩编码算法具有一定的通用性. 展开更多
关键词 语音压缩编码 MELP FPGA实现 SOC
下载PDF
1.8~2.4kbps多带激励语音编码器 被引量:4
11
作者 张军 韦岗 肖自美 《声学学报》 EI CSCD 北大核心 2002年第5期398-404,共7页
在多带激励(MultiBand Excitation,MBE)语音模型的基础上提出了一种基于基音处频域误差函数特性的快速基音细搜索算法和一种基于 MBE-LPC与 VDVQ(Variable-Dimension Vector Quantization)的可分级谱幅度矢量量化方案,实现了一种 1.... 在多带激励(MultiBand Excitation,MBE)语音模型的基础上提出了一种基于基音处频域误差函数特性的快速基音细搜索算法和一种基于 MBE-LPC与 VDVQ(Variable-Dimension Vector Quantization)的可分级谱幅度矢量量化方案,实现了一种 1.8~2.4 kbps可分级的 MBE语音编码器。实验结果表明木文所实现 MBE编码器在保持与常规同速率的MBE-VDVQ合成质量相当的同时能大幅度减少所需的运算量和存储空间。 展开更多
关键词 多带激励语音编码 语音编码 语音信号处理 MBE语音模型
下载PDF
一种利用多带激励模型改进的低速率线性预测语音编码算法 被引量:10
12
作者 杨明 邱锋海 莫福源 《声学学报》 EI CSCD 北大核心 2001年第4期329-334,共6页
提出了一种利用多带激励(MBE)模型改进的低速率线性预测(LPC)语音编码算法.文中介绍了该算法的参数提取、量化编码及语音合成的具体方案,并用C语言构造了一个基于该算法的速率为1,6 kb/s的语音编码/解码系统.主... 提出了一种利用多带激励(MBE)模型改进的低速率线性预测(LPC)语音编码算法.文中介绍了该算法的参数提取、量化编码及语音合成的具体方案,并用C语言构造了一个基于该算法的速率为1,6 kb/s的语音编码/解码系统.主观测听表明,该系统性能与 2.4 kb/s的 MELP算法接近或相当。 展开更多
关键词 多带激励模型 低速率线性预测语音编码 参数提取 量化编码 语音合成 C语言 保密通信 传输速率
下载PDF
中低速率语音编码技术的发展及应用 被引量:6
13
作者 温斌 尹建琪 吴善培 《电信科学》 北大核心 1996年第10期35-38,共4页
本文简要介绍了语音编码技术的产生与发展的历史,着重概述了当前中低速率语音编码技术的发展现状及各应用领域所采用的标准算法。
关键词 语音编码 波形编码 声码器 语音压缩
下载PDF
基于深度自编码网络语音识别噪声鲁棒性研究 被引量:9
14
作者 黄丽霞 王亚楠 +1 位作者 张雪英 王洪翠 《计算机工程与应用》 CSCD 北大核心 2017年第13期49-54,共6页
为了解决传统径向基(Radial basis function,RBF)神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,... 为了解决传统径向基(Radial basis function,RBF)神经网络在语音识别任务中基函数中心值和半径随机初始化的问题,从人脑对语音感知的分层处理机理出发,提出利用大量无标签数据初始化网络参数的无监督预训练方式代替传统随机初始化方法,使用深度自编码网络作为语音识别的声学模型,分析梅尔频率倒谱系数(Mel Frequency Cepstrum Coefficient,MFCC)和基于Gammatone听觉滤波器频率倒谱系数(Gammatone Frequency Cepstrum Coefficient,GFCC)下非特定人小词汇量孤立词的抗噪性能。实验结果表明,深度自编码网络在MFCC特征下较径向基神经网络表现出更优越的抗噪性能;而与经典的MFCC特征相比,GFCC特征在深度自编码网络下平均识别率相对提升1.87%。 展开更多
关键词 语音识别 鲁棒性 深度自编码网络 GFCC特征 MFCC特征
下载PDF
最新的ITU-T嵌入式变速率语音编码关键技术 被引量:9
15
作者 李海婷 范睿 +4 位作者 朱恒 刘泽新 鲍长春 贾懋珅 李锐 《电声技术》 2006年第11期50-55,58,共7页
介绍了ITU-T的新一代语音编码标准G.729.1的编码器、译码器原理,讨论了此标准实现码流嵌入式所采用的关键技术:嵌入式的码激励线性预测编码技术、时域频带扩展技术以及时域混叠抵消的预测变换编码技术,并通过客观评测验证了G.729.1语音... 介绍了ITU-T的新一代语音编码标准G.729.1的编码器、译码器原理,讨论了此标准实现码流嵌入式所采用的关键技术:嵌入式的码激励线性预测编码技术、时域频带扩展技术以及时域混叠抵消的预测变换编码技术,并通过客观评测验证了G.729.1语音编码标准的高性能。 展开更多
关键词 语音编码 音频编码 嵌入式编解码器
下载PDF
基于局部余弦变换的2.4kb/s低比特率语音编码 被引量:3
16
作者 董恩清 汪一鸣 +2 位作者 李宏亮 侯兴松 刘贵忠 《西安交通大学学报》 EI CAS CSCD 北大核心 2003年第4期388-391,共4页
系统地设计了一个基于局部余弦变换的 2 4kb/s低比特率的语音编码器 .对局部余弦变换系数采用分维矢量量化方法进行量化 ,码书设计采用LGB算法 .编码中的码书搜索采用树形快速搜索算法 .通过主观非正式听力测试和客观参数评价 ,从理解... 系统地设计了一个基于局部余弦变换的 2 4kb/s低比特率的语音编码器 .对局部余弦变换系数采用分维矢量量化方法进行量化 ,码书设计采用LGB算法 .编码中的码书搜索采用树形快速搜索算法 .通过主观非正式听力测试和客观参数评价 ,从理解性和自然度两方面来看 ,用设计的 2 4kb/s低比特率的编码方法编码的语音质量比FS10 15 (LPC 10e)编码标准编码的语音质量要好 ,而且具有较强的鲁棒性 。 展开更多
关键词 局部余弦变换 语音编码 低比特率 变换编码 矢量量化
下载PDF
基于奇异值分解的低速率波形内插语音编码算法 被引量:13
17
作者 王贵平 鲍长春 张鹏 《电子学报》 EI CAS CSCD 北大核心 2006年第1期135-140,共6页
波形内插(WI)语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文基于一种奇异值分解(SVD)的特征波形分解方法,利用语音信号的感知特性,将二维特征波形的幅度谱分成基本矩阵、过渡矩阵和... 波形内插(WI)语音编码模型作为当今最具潜力的低速率语音编码方案之一,因其良好的性能,越来越受到人们的重视.本文基于一种奇异值分解(SVD)的特征波形分解方法,利用语音信号的感知特性,将二维特征波形的幅度谱分成基本矩阵、过渡矩阵和补充矩阵,并采用了不同的量化方法,有效地降低了运算复杂度;另外,本文根据语音信号时变特性,将三个矩阵分为三种组合模式表示特征波形幅度谱,并引入周期因子和能量熵来衡量矩阵周期程度,解决了奇异值分解后参数难于量化的问题,提高了编码效率.主观A/B测试表明,本文提出的2.4kbps SVD-WI编码器的重建语音质量略好于2·4kbps MELP编码器. 展开更多
关键词 语音编码 波形内插 特征波形 奇异值分解 周期因子
下载PDF
听障者语音编码的研究范式述评 被引量:6
18
作者 闫国利 兰泽波 +2 位作者 孟珠 王影超 王正光 《心理科学》 CSSCI CSCD 北大核心 2019年第2期500-505,共6页
对于健听者而言,语音编码在阅读中具有重要作用。听障者在阅读中是否存在语音编码?对于拼音文字而言,这个问题目前国际上存在很大的争议。中国听障者在阅读中是否使用了语音编码的问题也逐渐开始受到重视。为了便于国内研究听障者语音... 对于健听者而言,语音编码在阅读中具有重要作用。听障者在阅读中是否存在语音编码?对于拼音文字而言,这个问题目前国际上存在很大的争议。中国听障者在阅读中是否使用了语音编码的问题也逐渐开始受到重视。为了便于国内研究听障者语音编码的学者参考,本文介绍了考察听障者语音编码研究中常用的研究范式,包括实验程序、逻辑及相应的研究成果。最后,对未来我国听障者语音编码的研究进行了展望。 展开更多
关键词 听障者 语音编码 研究范式
下载PDF
汉语口吃者在不出声言语中的语音编码 被引量:11
19
作者 张积家 肖二平 《心理学报》 CSSCI CSCD 北大核心 2008年第3期263-273,共11页
口吃者与非口吃者在不出声言语中语音编码的差异是口吃者语音加工异常的有力证据。通过三个实验,分别考察了口吃者与非口吃者监控汉语拼音中声母、韵母及声调的差异。结果表明,口吃者对声母的监控与非口吃者相比没有显著的差异,但在监... 口吃者与非口吃者在不出声言语中语音编码的差异是口吃者语音加工异常的有力证据。通过三个实验,分别考察了口吃者与非口吃者监控汉语拼音中声母、韵母及声调的差异。结果表明,口吃者对声母的监控与非口吃者相比没有显著的差异,但在监控韵母及声调时,口吃者的反应显著慢于非口吃者。研究结果支持了关于口吃的"内在修正假说",对研究汉语的语音编码有启发,对于口吃的诊断和治疗也有重要的启示。 展开更多
关键词 口吃 语音编码 音素监控 内在修正假说
下载PDF
ACELP语音编码中代数码书的快速搜索算法 被引量:3
20
作者 鲍长春 窦庚欣 +1 位作者 范睿 刘泽新 《北京工业大学学报》 CAS CSCD 北大核心 2007年第8期823-827,共5页
为降低ACELP语音编码中代数码书搜索的复杂度,提出了一种基于代数多子码书结构的多路径快速搜索算法.实验结果表明,在不降低编码质量的条件下,这种搜索算法的复杂度仅为全搜索算法的1/128.
关键词 语音编码 算法 计算复杂度
下载PDF
上一页 1 2 90 下一页 到第
使用帮助 返回顶部