期刊文献+
共找到5篇文章
< 1 >
每页显示 20 50 100
语音-文本转换技术在手机软件开发中的应用
1
作者 杨颖 曹红兵 +1 位作者 吴方 杨晴龙 《安庆师范学院学报(自然科学版)》 2016年第3期73-77,共5页
语音-文本转换旨在将说话人语音中的词汇内容转换为计算机可读的文本输入,使计算机具有能够"听懂"人类语音的能力。基于Android智能手机平台,利用国内先进的语音-文本转换技术设计并实现了两款手机软件——商品订单查询和手... 语音-文本转换旨在将说话人语音中的词汇内容转换为计算机可读的文本输入,使计算机具有能够"听懂"人类语音的能力。基于Android智能手机平台,利用国内先进的语音-文本转换技术设计并实现了两款手机软件——商品订单查询和手机语音笔记。商品订单查询的语音功能提供了更为便捷的个性化操作。手机语音笔记的主要功能包括单人录音和多人协作录音,尤其是多人协作录音实现了多人语音交流的记录和分享。这两款手机软件具有一定的实际应用价值。 展开更多
关键词 手机应用软件开发 语音-文本转换 语音查询 语音笔记
下载PDF
汉语文本-可视语音转换的研究 被引量:9
2
作者 王志明 蔡莲红 +1 位作者 吴志勇 陶建华 《小型微型计算机系统》 CSCD 北大核心 2002年第4期474-477,共4页
本文通过对发音者可见器官动作的研究 ,从视觉方面抽取汉语发音的 2 6个基本口形 ,并利用 MPEG- 4所规定的面部动画参数 (FAP)来描述这些口形 ,从而获得了符合国际标准的描述汉语发音的视觉参数 .另外 ,我们研究了这些参数在连续语流中... 本文通过对发音者可见器官动作的研究 ,从视觉方面抽取汉语发音的 2 6个基本口形 ,并利用 MPEG- 4所规定的面部动画参数 (FAP)来描述这些口形 ,从而获得了符合国际标准的描述汉语发音的视觉参数 .另外 ,我们研究了这些参数在连续语流中的变化及协同发音对口形的影响 ,基于已有的汉语文语转换系统 (Sonic)和二维网格人脸模型(Plane Face)实现了一个汉语文本 -可视语音转换系统 (TTVS) 展开更多
关键词 视觉语音 汉语文本-可视语音转换系统 协同发音 汉字信息处理
下载PDF
动态文本-语音编程系统的研究与应用 被引量:2
3
作者 赵建洋 胡泽雄 《淮阴工学院学报》 CAS 2007年第3期36-39,共4页
为实现动态文本的动态发声,应用微软二次开发包Speech SDK 5.1提供的Speech API函数,结合VC动态链接库高级编程技术,在医院大厅的语音文字通告系统中,以划价收费模块为核心,实现了将文字实时动态转化为语音的信息管理系统的开发,该动态... 为实现动态文本的动态发声,应用微软二次开发包Speech SDK 5.1提供的Speech API函数,结合VC动态链接库高级编程技术,在医院大厅的语音文字通告系统中,以划价收费模块为核心,实现了将文字实时动态转化为语音的信息管理系统的开发,该动态语音文字编程系统还可以用于车站、证券交易等场合的信息播报。 展开更多
关键词 动态链接库 文本-语音转换 语音合成
下载PDF
汉语语音视位的研究 被引量:10
4
作者 王志明 蔡莲红 《应用声学》 CSCD 北大核心 2002年第3期29-34,共6页
MPEG-4首次作为国际标准正式定义了视位(Viseme)的概念,它是指与某一音位相对应的嘴、舌头、下腭等可视发音器官所处的状态。本文通过对汉语发音时各可见部分器官动作和发音规则的研究,将汉语发音分为28个基本静态视位。利用语音信息从... MPEG-4首次作为国际标准正式定义了视位(Viseme)的概念,它是指与某一音位相对应的嘴、舌头、下腭等可视发音器官所处的状态。本文通过对汉语发音时各可见部分器官动作和发音规则的研究,将汉语发音分为28个基本静态视位。利用语音信息从AVI文件中自动抽取出这些基本视位图像,从MPEG-4所规定的68个面部动画参数(FAP)中提取出28个来描述这些口形,并实现了部分FAP参数的自动测量。最后,我们给出一个视位研究应用的实例。 展开更多
关键词 汉语 语音视位 文本-语音转换系统 文本-可视语音转换系统 静态视位 MPEG-4 语音识别
下载PDF
一个嵌入式的盲人辅助系统音频模块的设计与实现
5
作者 李肋 《电脑知识与技术》 2010年第4X期3226-3227,共2页
基于WinCE的嵌入式盲人辅助系统采用高性能的嵌入式多媒体处理器iMX31,搭载高速的SDRAM、Wired LAN和WLAN模块、Audio CODEC、Bluetooth模块、DVD驱动器等。该系统采用矩阵键盘、遥控以及语音作为输入方式,用户通过听来获得系统的输出... 基于WinCE的嵌入式盲人辅助系统采用高性能的嵌入式多媒体处理器iMX31,搭载高速的SDRAM、Wired LAN和WLAN模块、Audio CODEC、Bluetooth模块、DVD驱动器等。该系统采用矩阵键盘、遥控以及语音作为输入方式,用户通过听来获得系统的输出结果。 展开更多
关键词 蓝牙 嵌入式系统 文本-语音转换
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部