期刊文献+
共找到28篇文章
< 1 2 >
每页显示 20 50 100
Transmission Considerations with QoS Support to Deliver Real-Time Distributed Speech Recognition Applications
1
作者 Zhu Xiao-gang Zhu Hong-wen Rong Meng-tian 《Wuhan University Journal of Natural Sciences》 EI CAS 2002年第1期65-70,共6页
Distributed speech recognition (DSR) applications have certain QoS (Quality of service) requirements in terms of latency, packet loss rate, etc. To deliver quality guaranteed DSR application over wirelined or wireless... Distributed speech recognition (DSR) applications have certain QoS (Quality of service) requirements in terms of latency, packet loss rate, etc. To deliver quality guaranteed DSR application over wirelined or wireless links, some QoS mechanisms should be provided. We put forward a RTP/RSVP transmission scheme with DSR-specific payload and QoS parameters by modifying the present WAP protocol stack. The simulation result shows that this scheme will provide adequate network bandwidth to keep the real-time transport of DSR data over either wirelined or wireless channels. 展开更多
关键词 distributed speech recognition quality of service real-time transmission protocol resource reservation protocol wireless application protocol
下载PDF
基于Microsoft Speech SDK5.1实现中英文朗读 被引量:2
2
作者 李松 沈文轩 《鞍山科技大学学报》 2004年第6期436-438,442,共4页
对如何利用MicrosoftSpeechSDK5.1实现中英文混合文本朗读进行了研究,解决了中英文朗读时不能真正朗读英文的问题,提出了一种根据文本类型和系统消息实时切换中英文引擎的方法,实现了中英文朗读时引擎的自动平滑切换.朗读效果良好,对于... 对如何利用MicrosoftSpeechSDK5.1实现中英文混合文本朗读进行了研究,解决了中英文朗读时不能真正朗读英文的问题,提出了一种根据文本类型和系统消息实时切换中英文引擎的方法,实现了中英文朗读时引擎的自动平滑切换.朗读效果良好,对于实现人机之间人性化交流具有积极的意义. 展开更多
关键词 微软语音开发包 语音合成 中英文朗读 实时切换
下载PDF
基于实时交互数字人技术的融合智能终端设计与实现
3
作者 王丁 刘阳桢 陈嘉 《广播与电视技术》 2024年第9期24-27,共4页
本文重点介绍深圳广播电影电视集团推出的“机器人雇员智能终端”项目,该项目运用互动数字人、语音智能引导、VR技术和沉浸式体验等概念,将语音识别、自然语言处理、文本到语音转换技术以及广电虚拟主持人、裸眼3D成像技术同智能终端进... 本文重点介绍深圳广播电影电视集团推出的“机器人雇员智能终端”项目,该项目运用互动数字人、语音智能引导、VR技术和沉浸式体验等概念,将语音识别、自然语言处理、文本到语音转换技术以及广电虚拟主持人、裸眼3D成像技术同智能终端进行深度融合,可以提升政务服务的智能化水平,为智慧城市建设提供新思路和实践路径。 展开更多
关键词 实时交互数字人 广电虚拟主持人 语音识别 自然语言处理 文本到语音转换 智能终端
下载PDF
基于DSP的实时语音识别控制系统设计 被引量:4
4
作者 宋寿鹏 阙沛文 《电子器件》 EI CAS 2005年第2期338-341,共4页
语音信息的实时识别与控制在信息家电、工农业生产、机电产品以及国防领域等各行业有着广泛的应用前景。以TI公司的DSP芯片TMS320LC56为内核,结合该公司新近推出的编译码器TLCAD535设计了一种实时语音识别控制系统,主要针对其硬件结构... 语音信息的实时识别与控制在信息家电、工农业生产、机电产品以及国防领域等各行业有着广泛的应用前景。以TI公司的DSP芯片TMS320LC56为内核,结合该公司新近推出的编译码器TLCAD535设计了一种实时语音识别控制系统,主要针对其硬件结构特点以及通讯接口进行了分析。 展开更多
关键词 DSP 语音识别 控制 实时
下载PDF
基于分形维的连续语音实时分割技术 被引量:2
5
作者 阙大顺 李星星 胡慧玲 《电讯技术》 2008年第11期33-37,共5页
为能准确有效地判断出连续语音中各个音节的起止点,提出了一种改进的分形维计算方法,该算法将插值分形维的步长因子进一步精确到采样频率的数量级上,先求出语音分形维的最小二乘能量轨迹,再差分求其动态特征;在此基础上,设计了连续语音... 为能准确有效地判断出连续语音中各个音节的起止点,提出了一种改进的分形维计算方法,该算法将插值分形维的步长因子进一步精确到采样频率的数量级上,先求出语音分形维的最小二乘能量轨迹,再差分求其动态特征;在此基础上,设计了连续语音的两级搜索实时分割算法,并进行了基于DSP的硬件系统实验。结果证明,该算法较好地实现了语音段的实时分割和汉语音节切分,鲁棒性好,使得系统在信噪比为0 dB时音节分割准确率仍可保持在一个较高的水平上。最后开发了一个在线汉语语音标注器,借此阐述了论文工作在语音识别方面的应用。 展开更多
关键词 语音识别 语音分割 积分-差分分形维 两级搜索实时分割 在线语音标注
下载PDF
基于DSP的高速实时语音识别系统的设计与实现 被引量:4
6
作者 李邵梅 陈鸿昶 王凯 《现代电子技术》 2007年第15期109-111,共3页
识别正确率和抗噪性能固然是语音识别的研究重点,但是识别响应速度也是决定系统实用化的关键所在。以TMS320C6713为核心构建硬件平台,通过采用高效C语言和线性汇编混合编程的方式,结合硬件特点,对代码进行了优化,实现了以美尔频率倒谱... 识别正确率和抗噪性能固然是语音识别的研究重点,但是识别响应速度也是决定系统实用化的关键所在。以TMS320C6713为核心构建硬件平台,通过采用高效C语言和线性汇编混合编程的方式,结合硬件特点,对代码进行了优化,实现了以美尔频率倒谱系数为特征参数,采用动态时间弯折算法的高速语音实时识别系统,识别速率达0.29倍实时,可实现多路语音的并行识别。 展开更多
关键词 多路实时语音识别 数字信号处理器 美尔频率倒谱系数 动态时间弯折
下载PDF
语音人机界面标引系统的实现 被引量:9
7
作者 毕文军 高健 《微计算机信息》 北大核心 2005年第4期232-233,共2页
本文实现了一个媒体资产管理中的语音人机界面标引系统。系统以连续混合高斯隐马尔可夫模型为基础,采用分层构筑维特比算法进行训练和识别。为实现标引的实时性,采用实时计算的方法。为了减少计算量,并没有将状态持续时间分布引入Viterb... 本文实现了一个媒体资产管理中的语音人机界面标引系统。系统以连续混合高斯隐马尔可夫模型为基础,采用分层构筑维特比算法进行训练和识别。为实现标引的实时性,采用实时计算的方法。为了减少计算量,并没有将状态持续时间分布引入Viterbi译码,而是将其作为后处理部分。对于数字识别,以声调作为辅助判决。以此做了一个体育赛事的词库,测试表明,标引系统首选识别率达到93.5%,前五选识别率达到98%。 展开更多
关键词 人机界面 语音识别 实时算法
下载PDF
关键词语音标引系统的实现 被引量:6
8
作者 毕文军 高健 《微计算机信息》 北大核心 2005年第3期220-221,210,共3页
本文实现了一个电视台媒体资产管理中的关键词语音标引系统。系统以连续混合高斯隐马尔可夫模型为基础,采用分层构筑维特比算法进行训练和识别。为实现标引的实时性,采用实时计算的方法,录音和识别同时进行。为了减少计算量,并没有将状... 本文实现了一个电视台媒体资产管理中的关键词语音标引系统。系统以连续混合高斯隐马尔可夫模型为基础,采用分层构筑维特比算法进行训练和识别。为实现标引的实时性,采用实时计算的方法,录音和识别同时进行。为了减少计算量,并没有将状态持续时间分布引入Viterbi译码,而是将其作为后处理部分。对于汉语数字识别的一些易混词,采用声调作为辅助判决。以此做了一个体育赛事的词库,经测试表明,关键词标引首选识别率达到93.5%,前五选识别率达到98%。 展开更多
关键词 语音识别 分层构筑 实时算法
下载PDF
汉语浊音基频实时检测技术研究 被引量:1
9
作者 余水宝 张胜 陈希 《仪器仪表学报》 EI CAS CSCD 北大核心 2006年第z2期1713-1715,共3页
论述了语音基频实时检测机理,介绍了变异滤波技术和信号分离技术,提出了让语音信号工作在滤波器过渡带上的新方法,有效地抑制了高次谐波,实现了语音基频的精确实时提取。
关键词 隔离 基频 语音识别 实时 过零检测 变异滤波 高次谐波
下载PDF
嵌入式实时英语语音识别系统的设计与研究 被引量:13
10
作者 周晓武 《电子设计工程》 2017年第8期187-190,共4页
针对本次英语语音识别系统的设计之中,应用嵌入式技术,可以应用嵌入式DSP语音芯片,以连续隐含马尔可夫模型为基本识别框架,优化设计英语语音识别系统。结果证实,设计出基于嵌入式的实时英语语音识别系统,可以在实际应用中实时识别出不... 针对本次英语语音识别系统的设计之中,应用嵌入式技术,可以应用嵌入式DSP语音芯片,以连续隐含马尔可夫模型为基本识别框架,优化设计英语语音识别系统。结果证实,设计出基于嵌入式的实时英语语音识别系统,可以在实际应用中实时识别出不同的英语语音,而且也能够提升系统在应用中对于英语语音的识别率,提升29.0%,对于英语语音的识别速度也快,发挥积极应用效益。研究结论表明,设计嵌入式的实时英语语音识别系统,具有可行性,不仅可以提升系统识别英语语音的速度,也发挥积极的应用效益,可以在实践中推广该系统设计方法。 展开更多
关键词 语音识别 实时英语语音识别系统 嵌入式设计 设计语音系统
下载PDF
一种实时检测语音基频的新方法 被引量:3
11
作者 余水宝 《电子测量与仪器学报》 CSCD 1993年第3期37-42,共6页
汉语浊音基频的实时检测是语音识别的关键技术之一。本文介绍一种采用模拟滤波技术,使语音信号工作在滤波器的过渡带上,从而有效地抑制高次谐波,精确实时提取语音基频的新方法。文章还对其基频检测机理和采用“过零检测,信号分离”技术... 汉语浊音基频的实时检测是语音识别的关键技术之一。本文介绍一种采用模拟滤波技术,使语音信号工作在滤波器的过渡带上,从而有效地抑制高次谐波,精确实时提取语音基频的新方法。文章还对其基频检测机理和采用“过零检测,信号分离”技术提高基频量测精度作了较详细的论述。 展开更多
关键词 语音识别 基频实时检测 门限电压
下载PDF
实时识别中语音的时域─频域─能量表示
12
作者 罗万伯 张露 +3 位作者 李志蜀 罗霄峰 罗霄岚 Duanpei Wu 《应用声学》 CSCD 北大核心 2001年第3期31-33,10,共4页
本文提出了语音信号的一种时域─频域─能量表示,并给出了算法,可用于孤立词语音识别.这种时域─频域─能量表示有两个特点:基于短时能量梯度的非线性时间规正,可保留语音信号频域的过渡特性,丢掉其稳态特性;计算量小,适于实时... 本文提出了语音信号的一种时域─频域─能量表示,并给出了算法,可用于孤立词语音识别.这种时域─频域─能量表示有两个特点:基于短时能量梯度的非线性时间规正,可保留语音信号频域的过渡特性,丢掉其稳态特性;计算量小,适于实时应用. 展开更多
关键词 语音识别 语音信号 非线性时间规正 实时实现 时域 频域 能量
下载PDF
机器人手术网络遥控系统中的语音识别 被引量:1
13
作者 周振辉 富钢 陈文楷 《沈阳航空工业学院学报》 2004年第3期28-30,共3页
在广泛参考了国内外关于语音识别技术研究及其应用的优秀论文和著作后 ,简单介绍了语音识别技术及其算法。在熟悉了微软的语音开发工具包的基础上 ,汲取其中和本项目相关的部分 ,具体描述了完成机器人手术网络遥控系统中的语音识别部分... 在广泛参考了国内外关于语音识别技术研究及其应用的优秀论文和著作后 ,简单介绍了语音识别技术及其算法。在熟悉了微软的语音开发工具包的基础上 ,汲取其中和本项目相关的部分 ,具体描述了完成机器人手术网络遥控系统中的语音识别部分的方法和实现的步骤。利用开发工具MicrosoftVC ++6 .0和MicrosoftSpeechAPI 5 .1 。 展开更多
关键词 语音识别 SAPI 机器人手术 网络遥控系统 远程手术
下载PDF
一种提高基频实时提取精度的新方法 被引量:1
14
作者 余水宝 江伟丰 +1 位作者 邵居华 任德官 《浙江师大学报(自然科学版)》 1993年第1期85-89,共5页
提高汉语浊音基频实时提取精度是语音识别的关键技术之一。本文论述了汉语浊音基频实时提取的意义、难度和误差分析,提出—种“过零检测,信号分离”的新方法。它能有效地减小工频调制误差,振幅起落误差和背景噪声误差,从而达到提高基频... 提高汉语浊音基频实时提取精度是语音识别的关键技术之一。本文论述了汉语浊音基频实时提取的意义、难度和误差分析,提出—种“过零检测,信号分离”的新方法。它能有效地减小工频调制误差,振幅起落误差和背景噪声误差,从而达到提高基频量测精度之目的。 展开更多
关键词 基频 实时提取 汉语 元音识别
下载PDF
煤矿虚拟现实远程会议中实时翻译技术的应用研究 被引量:1
15
作者 陈超 白磊 李芙玲 《华北科技学院学报》 2016年第6期45-49,58,共6页
通过应用语音识别技术、实时翻译技术、语音朗读技术,构建出一个能适应不同口音、翻译准确、发音专业的虚拟现实远程会议实时翻译应用。在煤矿虚拟现实远程会议中,发言者的口授内容和识别后的文本内容会上传至"煤矿虚拟现实远程会... 通过应用语音识别技术、实时翻译技术、语音朗读技术,构建出一个能适应不同口音、翻译准确、发音专业的虚拟现实远程会议实时翻译应用。在煤矿虚拟现实远程会议中,发言者的口授内容和识别后的文本内容会上传至"煤矿虚拟现实远程会议云服务器",当其它与会者所持语种与发言者不同时,识别后的文本会自动翻译为对应语种文本并朗读出来,从而实现与会各方的无缝沟通。该技术已在煤矿虚拟现实远程会议中得到验证。 展开更多
关键词 虚拟现实会议 语音识别 实时翻译
下载PDF
试析英语口语语法的成因与特征 被引量:1
16
作者 张青 张华民 《科教文汇》 2011年第8期126-128,共3页
英语口语语法形成的主要因素有三个:口语语境、即时产生话语的限制以及口语的交互性/人际性。受这些因素的影响,口语语法呈现出如下主要特征:省略、代词、小品词、名词短语、相邻语对、共构单位、问句以及祈使句的高频使用;词汇密度小;... 英语口语语法形成的主要因素有三个:口语语境、即时产生话语的限制以及口语的交互性/人际性。受这些因素的影响,口语语法呈现出如下主要特征:省略、代词、小品词、名词短语、相邻语对、共构单位、问句以及祈使句的高频使用;词汇密度小;有限的词汇使用量;话语不流畅以及语法结构简单化。理解和掌握英语口语语法对于英语教学具有重要意义。 展开更多
关键词 英语口语语法 语境 即时性 交互性 特征
下载PDF
基于VC和Matlab的实时语音识别系统研究
17
作者 伊磊 刘任平 聂欢欢 《计算机时代》 2011年第9期32-33,共2页
介绍了一种基于VC和Matlab混合编程的实时语音识别系统。在VC环境下,通过借助Windows MultimediaAPI实现对信号的实时采集,并且通过Matlab强大的计算功能,实现对语音信号的端点检测、特征值提取和模板匹配,从而实现实时的语音识别。
关键词 VC MATLAB 实时语音识别 MFCC DTW 非特定人 MEX
下载PDF
基于Android平台的音视频监控系统的设计 被引量:10
18
作者 杨志勇 李卫锋 张盛 《计算机应用与软件》 北大核心 2018年第12期169-173,共5页
随着移动互联网和人工智能技术的快速发展,现有的监控系统已经无法满足人们的需求。为了提升监控系统的功能,设计并实现了一种基于Android平台的音视频监控系统。该系统采用RTMP协议进行音视频传输,实现了语音对话功能。借助云端服务器... 随着移动互联网和人工智能技术的快速发展,现有的监控系统已经无法满足人们的需求。为了提升监控系统的功能,设计并实现了一种基于Android平台的音视频监控系统。该系统采用RTMP协议进行音视频传输,实现了语音对话功能。借助云端服务器能够在数据采集端和手机APP监控端进行语音指令和消息的传递。方案解决了传统监控系统只能处于被动监控的状态,提高了监控系统的智能性和灵活性,特别是为家居类监控提供了一个非常实用的解决方案。 展开更多
关键词 视频监控 ANDROID 语音识别 流媒体服务器 实时消息传输协议
下载PDF
英语发音通过嵌入式实时系统的识别设计及功能实现
19
作者 赵丽娜 《中阿科技论坛(中英文)》 2021年第1期85-88,共4页
本文基于连续隐含马尔可夫模型完成识别框架的构建,对通过使用嵌入式DSP语音芯片实现英语发音识别功能,并且综合运用时频分析及提取关联信息熵特征完成系统发音误差自动检测进行探讨。研究发现通过使用该嵌入式实时英语发音识别系统可... 本文基于连续隐含马尔可夫模型完成识别框架的构建,对通过使用嵌入式DSP语音芯片实现英语发音识别功能,并且综合运用时频分析及提取关联信息熵特征完成系统发音误差自动检测进行探讨。研究发现通过使用该嵌入式实时英语发音识别系统可有效提高英语发音的识别效率、准确率,以及系统发音误差自动检测能力,具有较高应用价值,可为优化英语发音识别系统的功能及应用效益研究提供参考。 展开更多
关键词 实现路径 发音误差自动检测 实时英语发音识别系统
下载PDF
基于Socket和JMF的分布式语音识别前端处理系统 被引量:1
20
作者 王艳琴 梁钊 《电声技术》 北大核心 2003年第3期45-48,共4页
在介绍分布式语音识别技术及相关的几个前端处理标准的基础上,提出了一种基于Socket和JMF的分布式语音识别前端处理系统,并详细介绍了该实验系统的结构及实现的关键技术。
关键词 SOCKET JMF 分布式语音识别 前端处理 DSR Java多媒体框架 实时传输协议
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部