期刊文献+
共找到27篇文章
< 1 2 >
每页显示 20 50 100
语音媒体扩展卡的设计
1
作者 李向前 《电脑与微电子技术》 1994年第3期7-8,10,共3页
文章较详细介绍了声音数字化扩展卡的一种电路设计,并附有原理逻辑图。分析了扩展接口卡寄存器编程方法,给出部分源程序。
关键词 语音扩展 多媒体 设计
下载PDF
用于隐马尔可夫模型语音带宽扩展的激励分段扩展方法 被引量:5
2
作者 郭雷勇 李宇 +1 位作者 林胜义 谭洪舟 《计算机应用》 CSCD 北大核心 2017年第8期2416-2420,共5页
语音带宽扩展通过人为恢复窄带语音的频谱带宽来提高语音听觉质量。针对源滤波器扩展模型的激励扩展问题,提出一种分段扩展方法。该方法在扩展带的低频段与高频段部分分别采用窄带激励源的高频部分与帧能量等效的白噪声作为激励信号,最... 语音带宽扩展通过人为恢复窄带语音的频谱带宽来提高语音听觉质量。针对源滤波器扩展模型的激励扩展问题,提出一种分段扩展方法。该方法在扩展带的低频段与高频段部分分别采用窄带激励源的高频部分与帧能量等效的白噪声作为激励信号,最后两者与原窄带激励组成宽带激励信号。基于隐马尔可夫模型(HMM)谱包络估计的宽带语音重构实验结果表明:该方法降低了重建语音的失真度,恢复重建的语音信号优于谱平移激励扩展方法。 展开更多
关键词 语音带宽扩展 分段扩展 谱平移 激励信号 隐马尔可夫模型
下载PDF
基于受限玻尔兹曼机的语音带宽扩展 被引量:3
3
作者 王迎雪 赵胜辉 +1 位作者 于莹莹 匡镜明 《电子与信息学报》 EI CSCD 北大核心 2016年第7期1717-1723,共7页
语音带宽扩展是为了提高语音质量,利用语音低频和高频之间的相关性重构语音高频的一种技术。高斯混合模型法是语音带宽技术中被广泛应用的一种方法,但是,由于该方法假设语音高频、低频服从高斯分布,且只表征了语音低频、高频之间的线性... 语音带宽扩展是为了提高语音质量,利用语音低频和高频之间的相关性重构语音高频的一种技术。高斯混合模型法是语音带宽技术中被广泛应用的一种方法,但是,由于该方法假设语音高频、低频服从高斯分布,且只表征了语音低频、高频之间的线性关系,从而导致合成的高频语音出现失真。因此,该文提出一种基于受限玻尔兹曼机的方法,该方法利用两个高斯伯努利受限玻尔兹曼机提取语音低频和高频中蕴含的高阶统计特性;并利用前馈神经网络将语音低频高阶统计特性参数映射为高频高阶统计特性参数。这样,通过提取语音低频和高频中蕴含的高阶统计特性,该方法可以深层挖掘语音高频和语音低频之间的实际关系,从而更加准确地模拟频谱包络分布,合成质量更高的语音。客观测试、主观测试结果表明,该方法性能优于传统的高斯混合模型方法。 展开更多
关键词 语音带宽扩展 受限玻尔兹曼机 前馈神经网络 高斯混合模型
下载PDF
基于时频感知神经网络的语音频带扩展 被引量:1
4
作者 许春冬 凌贤鹏 +1 位作者 应冬文 王晶 《信号处理》 CSCD 北大核心 2021年第10期2004-2012,共9页
为了进一步提高基于深度学习的语音频带扩展性能,提出了一种基于编解码器的神经网络结构,编码器对数据进行深度特征提取,解码器进行宽带语音重构,并在编解码器中间设计了局部敏感哈希自注意力层,用于增强模型对深度特征的有效选择。编... 为了进一步提高基于深度学习的语音频带扩展性能,提出了一种基于编解码器的神经网络结构,编码器对数据进行深度特征提取,解码器进行宽带语音重构,并在编解码器中间设计了局部敏感哈希自注意力层,用于增强模型对深度特征的有效选择。编解码器内部使用了时间卷积网络,有效提升了模型对语音时序数据上下文依赖关系的学习能力。为了促进模型朝更加准确的方向训练,还提出了一种时频感知损失函数,有利于模型在时域、频域以及感知域获取窄带语音到宽带语音的最优映射解。通过主观和客观实验结果表明,该方法优于传统方法和近几年基于深度神经网络的语音频带扩展方法。 展开更多
关键词 语音频带扩展 时间卷积网络 时频感知目标损失 局部敏感哈希注意力机制
下载PDF
基于Flatten-CNN的语音带宽扩展研究 被引量:2
5
作者 杨俊美 雷杨 陈习坤 《华南理工大学学报(自然科学版)》 EI CAS CSCD 北大核心 2021年第11期87-94,共8页
现有基于深度学习的语音带宽扩展算法中,时域算法语音特征提取不够精确,训练数据量大;频域算法对数功率谱特征提取未重视帧与帧之间的信息关联,频率轴数为奇数,不便于加深网络深度,且忽略时域信息;时频两域算法模型相对复杂。针对以上问... 现有基于深度学习的语音带宽扩展算法中,时域算法语音特征提取不够精确,训练数据量大;频域算法对数功率谱特征提取未重视帧与帧之间的信息关联,频率轴数为奇数,不便于加深网络深度,且忽略时域信息;时频两域算法模型相对复杂。针对以上问题,文中提出了一种基于Flatten-CNN的语音带宽扩展算法。首先,为了充分利用语音特征和减少数据量,文中算法基于频域运行;其次,为了利用对数功率谱时间轴信息,提出了一种改进的编码器,通过引入平铺层,实现对数功率谱时频两轴特征提取;接着,为了加深网络深度,在频率轴数据处理时去掉最后一个点,还原时再补零,使频率轴数为偶数,以利于加深网络深度;最后,为了利用语音信号时域信息,在损失函数中引入时域损失。为验证文中算法的有效性,用TIMIT数据集和VCTK数据集进行了模型的训练和测试,实验结果表明,与当前主流算法相比,文中算法生成的高带宽语音质量得到提高,呈现出了更好的听觉效果。 展开更多
关键词 语音带宽扩展 平铺层 时频两轴特征提取 时频损失 网络深度
下载PDF
基于码本映射和GMM的语音带宽扩展
6
作者 王迎雪 于莹莹 +1 位作者 赵胜辉 匡镜明 《北京理工大学学报》 EI CAS CSCD 北大核心 2017年第9期970-974,共5页
采用传统的高斯混合模型(Gaussian mixture model,GMM)进行语音带宽扩展时,会出现所估计的特征参数过平滑的问题,其主要原因是协方差估计不准确而导致扩展的高频特征细节信息的丢失,因此本文提出了码本映射(codebook mapping,CM)与高斯... 采用传统的高斯混合模型(Gaussian mixture model,GMM)进行语音带宽扩展时,会出现所估计的特征参数过平滑的问题,其主要原因是协方差估计不准确而导致扩展的高频特征细节信息的丢失,因此本文提出了码本映射(codebook mapping,CM)与高斯混合模型相结合的语音带宽扩展算法.提取高、低频特征参数,并训练高斯混合模型,基于高斯混合模型参数训练偏移矢量的码本;在扩展阶段,利用偏移矢量的码本将低频偏移矢量映射为高频偏移矢量,再将高频偏移矢量与高斯混合模型估计部分相加作为估计的高频特征参数.对利用该方法进行带宽扩展后的语音质量进行主观/客观评测.实验结果表明,相比传统的GMM语音带宽方法,CM-GMM合成的高频语音更接近原始高频语音,明显消除了高频过平滑现象. 展开更多
关键词 语音带宽扩展 高斯混合模型 码本映射
下载PDF
基于码本映射的语音带宽扩展算法研究
7
作者 薛梅 周南 《电子设计工程》 2010年第11期75-77,81,共4页
在现代通信系统中,电话语音的频带被限制在300 Hz~4 kHz的范围内,带来了语音可懂度和自然度的降低。为了在不增加额外成本的前提下提高语音的可懂度和自然度,进行了电话语音频带扩展的研究。提出了一种改进的基于码本映射的语音带宽扩... 在现代通信系统中,电话语音的频带被限制在300 Hz~4 kHz的范围内,带来了语音可懂度和自然度的降低。为了在不增加额外成本的前提下提高语音的可懂度和自然度,进行了电话语音频带扩展的研究。提出了一种改进的基于码本映射的语音带宽扩展算法:在码本映射的过程中,使用加权系数来得到映射码本。客观测试结果表明,用此算法得到的宽带语音的谱失真度比用一般的码本映射降低至少2%。主观测试结果表明,用此算法得到的宽带语音具有更好的可懂度和自然度。 展开更多
关键词 语音带宽扩展 码本映射 矢量量化 谱折叠 谱平移
下载PDF
基于压缩感知的语音带宽扩展方法
8
作者 郑洪磊 《中文科技期刊数据库(全文版)工程技术》 2016年第9期327-327,共1页
现在的语音通信系统中,传输的多是4KHz的窄带语音信号,其严重了损失了语音信号的可懂性和自然度。本文提出了一种新的语音带宽扩展的方法,对窄带信号做压缩感知,得到宽带信号,再进行小波去噪得到最终的宽带语音。仿真测试表明,该方法合... 现在的语音通信系统中,传输的多是4KHz的窄带语音信号,其严重了损失了语音信号的可懂性和自然度。本文提出了一种新的语音带宽扩展的方法,对窄带信号做压缩感知,得到宽带信号,再进行小波去噪得到最终的宽带语音。仿真测试表明,该方法合成的宽带语音的听觉效果远比窄带语音的听觉效果好。 展开更多
关键词 语音带宽扩展 压缩感知 语音信号
下载PDF
基于VoiceXML的语音信息发布模式 被引量:1
9
作者 杨喜权 韩正服 +1 位作者 石丹 丛荣华 《吉林大学学报(理学版)》 CAS CSCD 北大核心 2006年第6期935-938,共4页
探讨基于VoiceXML通过电话(固定或移动电话)的声音指令建立Internet的声音浏览器交互服务.在Tellme Stud io为开发平台下,利用VoiceXML标准作为声音文件并与XML动态数据库技术相结合,实现W eb天气信息实时语音交互查询,提出了一种基于Vo... 探讨基于VoiceXML通过电话(固定或移动电话)的声音指令建立Internet的声音浏览器交互服务.在Tellme Stud io为开发平台下,利用VoiceXML标准作为声音文件并与XML动态数据库技术相结合,实现W eb天气信息实时语音交互查询,提出了一种基于VoiceXML标准的天气信息语音发布模式. 展开更多
关键词 语音扩展描述语言 语音网关 扩展样式语言 语音信息发布
下载PDF
话音压缩/扩展技术在数话兼容无线列调系统中的应用 被引量:1
10
作者 沈京川 徐钧 余仑 《中国铁道科学》 EI CAS CSCD 北大核心 1998年第3期73-81,共9页
阐述了新型数话兼容列车无线调度通信系统的关键技术——数话同传和话音压缩/扩展,比较分析了几种数字编码方式,着重论述了连续可变斜率增量调制(CVSD)编码方式的原理、性能、编解码过程及在本系统中的应用。
关键词 无线列调系统 数话兼容 话音压缩 语音扩展 CVSD
下载PDF
基于幅值掩膜时频神经网络的语音频带扩展
11
作者 许春冬 谭国武 应冬文 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2024年第6期179-184,共6页
为了提高基于深度学习的语音频带扩展性能,提出一种结合幅值掩膜的时频神经网络模型.该模型既能利用语音的相位信息,又能通过幅值掩膜来优化预测语音的幅值.模型时域部分设计一种融合注意力机制的长短时记忆神经网络,该网络可以实现并... 为了提高基于深度学习的语音频带扩展性能,提出一种结合幅值掩膜的时频神经网络模型.该模型既能利用语音的相位信息,又能通过幅值掩膜来优化预测语音的幅值.模型时域部分设计一种融合注意力机制的长短时记忆神经网络,该网络可以实现并行计算,当预测高频语音时充分利用距离相近的前后语音帧之间的关系,舍弃对远距离语音帧之间关系的学习,从而减少模型的计算量.主客观实验表明该方法在信噪比和可懂度等度量上优于传统方法和基于深度神经网络的语音频带扩展方法. 展开更多
关键词 语音频带扩展 时频神经网络 长短时记忆神经网络 幅值掩膜 注意力机制
原文传递
基于VoiceXML的语音门户研究
12
作者 周振喜 戴国骏 +1 位作者 陈晓峰 张国煊 《微型机与应用》 2003年第12期52-54,共3页
语音扩展标记语言VoiceXML的结构模型和核心技术,并对语音互联的核心——语音门户作了详细的分析。
关键词 语音识别 语音合成 语音门户 VOICEXML 语音扩展标记语言
下载PDF
语音语法在VoiceXML中的应用
13
作者 汪林林 《西南师范大学学报(自然科学版)》 CAS CSCD 北大核心 2005年第2期235-239,共5页
语音语法是自动语音识别的重要参考依据, 在基于VoiceXML的语音增值业务中应用越来越广泛. 介绍了VoiceXML与语法的关系, 描述了语音识别原理, 推导出了常用的Nuance语法形式逻辑表达式. 在此基础上, 构建了一个语音拨号系统, 并着重阐... 语音语法是自动语音识别的重要参考依据, 在基于VoiceXML的语音增值业务中应用越来越广泛. 介绍了VoiceXML与语法的关系, 描述了语音识别原理, 推导出了常用的Nuance语法形式逻辑表达式. 在此基础上, 构建了一个语音拨号系统, 并着重阐述了其中语音语法的应用. 展开更多
关键词 语音扩展标记语言 双音多频收号器 自动语音识别 语音拨号 语音语法
下载PDF
基于VoiceXML的语音交互平台的设计与实现 被引量:4
14
作者 庾锡昌 刘伟平 +1 位作者 武晋 黄红斌 《计算机工程与设计》 CSCD 北大核心 2007年第8期1969-1972,共4页
设计并实现了一种基于VoiceXML(voice extensible markup language)的呼叫中心语音交互平台。该平台以OpenVXI开源项目的VoiceXML解析器为核心,以C/S三层结构框架来设计,在集成了杭州三汇语音板卡的基础上实现了语音合成、语音识别、呼... 设计并实现了一种基于VoiceXML(voice extensible markup language)的呼叫中心语音交互平台。该平台以OpenVXI开源项目的VoiceXML解析器为核心,以C/S三层结构框架来设计,在集成了杭州三汇语音板卡的基础上实现了语音合成、语音识别、呼叫处理等呼叫中心的基本功能。利用该平台,电信运营商不仅能方便地建立呼叫中心,而且可以联合SP/CP(service provider/content provider)推出各种语音增值业务。介绍了该平台的总体架构设计,并详细讲述关键技术的实现,最后给出了系统测试实例及其运行结果。 展开更多
关键词 语音扩展标记语言 呼叫中心 解析器 互动式语音应答 三汇语音
下载PDF
构建语音技术应用的基础平台
15
作者 马绍秋 陆汝占 高峰 《移动通信》 2004年第S2期124-128,共5页
本文概要介绍了整合语音扩展标示语言(VOICEXML)、自动语音识别(ASR)、文语转换(TTS)、计算机电话集成(CTI)技术的平台构建及其特点,同时举例说明了该平台的一些应用,最后展望了该平台的一些改进方向。
关键词 自动语音识别 文语转换 语音扩展标示语言 计算机电话集成
下载PDF
OpenVXI平台上VoiceXML呼叫中心语音系统的研究与开发 被引量:1
16
作者 李红 武晋 +1 位作者 陈舜儿 黄红斌 《电脑与电信》 2008年第1期46-48,共3页
本文提出并构建了一种在OpenVXI平台上实现的基于VoiceXML技术的呼叫中心语音系统。该系统在语音卡上编程,为OpenVXI平台提供低层支持,实现了放音、呼叫、识别、录音等相关接口,完成了流程控制服务器,实现了用VoiceXML文档来控制呼叫中... 本文提出并构建了一种在OpenVXI平台上实现的基于VoiceXML技术的呼叫中心语音系统。该系统在语音卡上编程,为OpenVXI平台提供低层支持,实现了放音、呼叫、识别、录音等相关接口,完成了流程控制服务器,实现了用VoiceXML文档来控制呼叫中心语音流程的功能。系统在实验环境下的测试结果基本符合设计目标,进一步的优化和开发研究工作正在进行中。 展开更多
关键词 OpenVXI 语音扩展标记语言 呼叫中心 计算机电话集成
下载PDF
基于麦克风阵列的语音增强算法研究 被引量:2
17
作者 于春和 马跃 《电脑与信息技术》 2021年第3期39-42,共4页
语音通信为最普通的一种通信模式,在我们的日常生活中发挥着极为关键的效果。然而,在客观场景内,声音势必会因噪音而产生影响。此类噪声与干扰不但会影响声音的可知性,还使声音处理系统的性能急剧恶化。但是,在现实环境中,声音受到噪音... 语音通信为最普通的一种通信模式,在我们的日常生活中发挥着极为关键的效果。然而,在客观场景内,声音势必会因噪音而产生影响。此类噪声与干扰不但会影响声音的可知性,还使声音处理系统的性能急剧恶化。但是,在现实环境中,声音受到噪音和干扰是不可避免的。这些噪声和干扰不仅影响声音的可知性,还使声音处理系统的性能急剧恶化。麦克风阵列语音增强为语音增强中最普遍的一种模式。文章具体讲解了几类比较普遍的麦克风阵列增强算法以及语音扩展算法的仿真处理结果,语音扩展算法可以从噪音声音中尽可能地提取清晰的声音,从而提高语音质量和主观舒适性。 展开更多
关键词 麦克风阵列 语音增强 语音扩展算法
下载PDF
中文语音应用技术实现重大突破——全球第一套中文语音浏览器通过国家鉴定
18
作者 刘启诚 《通信世界》 2001年第24期8-8,共1页
关键词 中文语音应用技术 语音浏览器 VOICEXML 语音扩展标记语言 移动通信
下载PDF
美国交互式语音应答系统的市场
19
作者 王昕 刘勇 《CTI世界(计算机与电信集成世界)》 2002年第2期X037-X039,共3页
关键词 美国 交互式 语音应答系统 市场 语音识别集成 语音扩展标记
下载PDF
基于多尺度特征融合的语音频带扩展
20
作者 许春冬 朱诚 +1 位作者 应冬文 董桂官 《华中科技大学学报(自然科学版)》 EI CAS CSCD 北大核心 2023年第9期132-139,共8页
针对现有的深度学习模型在语音频带扩展领域数据特征利用不充分、训练周期长以及生成语音质量不高等问题,提出了一种新型的端到端神经网络模型,该模型通过融合不同数据维度特征促使网络模型利用更少的数据特征量,获取更多的低高频映射... 针对现有的深度学习模型在语音频带扩展领域数据特征利用不充分、训练周期长以及生成语音质量不高等问题,提出了一种新型的端到端神经网络模型,该模型通过融合不同数据维度特征促使网络模型利用更少的数据特征量,获取更多的低高频映射关系解,从而减少模型的整体训练周期.为了提高长时序数据中关键特征的权重占比,设计了一种残差多头自注意力机制,从而达到数据特征利用率的最大化.此外,提出了一种基于时频域和Mel频谱的混合损失函数对模型进行优化.实验结果表明:该方法重构的宽带语音在主客观的评价中均优于传统方法和近年来的一些基于神经网络的语音频带扩展方法. 展开更多
关键词 语音频带扩展 深度学习 自注意力机制 时频感知损失函数
原文传递
上一页 1 2 下一页 到第
使用帮助 返回顶部