-
题名语音-文本转换技术在手机软件开发中的应用
- 1
-
-
作者
杨颖
曹红兵
吴方
杨晴龙
-
机构
阜阳师范学院计算机与信息工程学院
-
出处
《安庆师范学院学报(自然科学版)》
2016年第3期73-77,共5页
-
基金
安徽省教育厅质量工程项目(2014jyxm224
2014sjjd077
+2 种基金
AH201410371004
2014zjjh024)
安徽省教育厅自然科学项目(KJ2013B192)
-
文摘
语音-文本转换旨在将说话人语音中的词汇内容转换为计算机可读的文本输入,使计算机具有能够"听懂"人类语音的能力。基于Android智能手机平台,利用国内先进的语音-文本转换技术设计并实现了两款手机软件——商品订单查询和手机语音笔记。商品订单查询的语音功能提供了更为便捷的个性化操作。手机语音笔记的主要功能包括单人录音和多人协作录音,尤其是多人协作录音实现了多人语音交流的记录和分享。这两款手机软件具有一定的实际应用价值。
-
关键词
手机应用软件开发
语音-文本转换
语音查询
语音笔记
-
Keywords
app development
speech-to-text
voice query
voice notes
-
分类号
TP311.52
[自动化与计算机技术—计算机软件与理论]
-
-
题名汉语文本-可视语音转换的研究
被引量:9
- 2
-
-
作者
王志明
蔡莲红
吴志勇
陶建华
-
机构
清华大学计算机科学与技术系
-
出处
《小型微型计算机系统》
CSCD
北大核心
2002年第4期474-477,共4页
-
基金
高校博士点基金 ( 2 0 0 10 0 0 30 49)资助项目
-
文摘
本文通过对发音者可见器官动作的研究 ,从视觉方面抽取汉语发音的 2 6个基本口形 ,并利用 MPEG- 4所规定的面部动画参数 (FAP)来描述这些口形 ,从而获得了符合国际标准的描述汉语发音的视觉参数 .另外 ,我们研究了这些参数在连续语流中的变化及协同发音对口形的影响 ,基于已有的汉语文语转换系统 (Sonic)和二维网格人脸模型(Plane Face)实现了一个汉语文本 -可视语音转换系统 (TTVS)
-
关键词
视觉语音
汉语文本-可视语音转换系统
协同发音
汉字信息处理
-
Keywords
visual speech
facial animation parameter(FAP)
text-to-speech(TTS)
text-to -audioVisual speech(TTVS)
coarticulation
-
分类号
TP391.12
[自动化与计算机技术—计算机应用技术]
-
-
题名动态文本-语音编程系统的研究与应用
被引量:2
- 3
-
-
作者
赵建洋
胡泽雄
-
机构
淮阴工学院计算机系
-
出处
《淮阴工学院学报》
CAS
2007年第3期36-39,共4页
-
基金
江苏省科技发展计划项目(BE2006357)
-
文摘
为实现动态文本的动态发声,应用微软二次开发包Speech SDK 5.1提供的Speech API函数,结合VC动态链接库高级编程技术,在医院大厅的语音文字通告系统中,以划价收费模块为核心,实现了将文字实时动态转化为语音的信息管理系统的开发,该动态语音文字编程系统还可以用于车站、证券交易等场合的信息播报。
-
关键词
动态链接库
文本-语音转换
语音合成
-
Keywords
dynamic link library
text - to - speech
speech synthetic
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名汉语语音视位的研究
被引量:10
- 4
-
-
作者
王志明
蔡莲红
-
机构
清华大学计算机系
-
出处
《应用声学》
CSCD
北大核心
2002年第3期29-34,共6页
-
基金
国家教育部高等学校博士学科点专项科研基金资助项目(20010003049)
-
文摘
MPEG-4首次作为国际标准正式定义了视位(Viseme)的概念,它是指与某一音位相对应的嘴、舌头、下腭等可视发音器官所处的状态。本文通过对汉语发音时各可见部分器官动作和发音规则的研究,将汉语发音分为28个基本静态视位。利用语音信息从AVI文件中自动抽取出这些基本视位图像,从MPEG-4所规定的68个面部动画参数(FAP)中提取出28个来描述这些口形,并实现了部分FAP参数的自动测量。最后,我们给出一个视位研究应用的实例。
-
关键词
汉语
语音视位
文本-语音转换系统
文本-可视语音转换系统
静态视位
MPEG-4
语音识别
-
Keywords
Viseme, Facial animation parameter, Text-to-speech, Text-to-visual speech
-
分类号
TN912.34
[电子电信—通信与信息系统]
TN919.81
[电子电信—通信与信息系统]
-
-
题名一个嵌入式的盲人辅助系统音频模块的设计与实现
- 5
-
-
作者
李肋
-
机构
东莞南博职业技术学院
-
出处
《电脑知识与技术》
2010年第4X期3226-3227,共2页
-
文摘
基于WinCE的嵌入式盲人辅助系统采用高性能的嵌入式多媒体处理器iMX31,搭载高速的SDRAM、Wired LAN和WLAN模块、Audio CODEC、Bluetooth模块、DVD驱动器等。该系统采用矩阵键盘、遥控以及语音作为输入方式,用户通过听来获得系统的输出结果。
-
关键词
蓝牙
嵌入式系统
文本-语音转换
-
Keywords
Windows CE
embedded system
TTS(text-to-speech)
bluetooth
-
分类号
TN912.2
[电子电信—通信与信息系统]
-