期刊文献+
共找到83篇文章
< 1 2 5 >
每页显示 20 50 100
基于XF-S4240的文本语音合成系统实现
1
作者 郑火国 苏晓路 +2 位作者 胡海燕 孟泓 刘世洪 《微计算机信息》 2009年第35期50-51,195,共2页
在我国,广播电视覆盖率已提高到98%以上,以广播为载体的信息服务具有覆盖面广、成本低、易于基层农民接受等特点。为了更好的发挥广播信息服务的作用,设计研发出基于XF-S4240模块的文本语音转换系统,便于基层广播电台扩充信息。
关键词 文本语音合成 XF-S4240 微电子技术
下载PDF
用VB6.0实现文本语音
2
作者 罗翠兰 《电脑学习》 2004年第1期30-31,共2页
利用VisualBasic6.0的Data数据控件和OLE控件,并且结合MicrosoftAccess2000的OLE对象字段实现多媒体语音的方法。
关键词 VB6.0 数据控件 OLE控件 文本语音
下载PDF
融合音素的缅甸语语音识别文本纠错
3
作者 陈璐 董凌 +3 位作者 王文君 王剑 余正涛 高盛祥 《计算机工程与科学》 CSCD 北大核心 2024年第6期1121-1127,共7页
缅甸语语音识别文本中包含大量的同音和空格错误,使用通用的文本语义信息纠正错误字符,对缅甸语空格和同音错误定位和纠正不准确。考虑到缅甸语是一种声调语言,并且音素中包含了声调信息,因此提出融合音素的缅甸语语音识别文本纠错方法... 缅甸语语音识别文本中包含大量的同音和空格错误,使用通用的文本语义信息纠正错误字符,对缅甸语空格和同音错误定位和纠正不准确。考虑到缅甸语是一种声调语言,并且音素中包含了声调信息,因此提出融合音素的缅甸语语音识别文本纠错方法。通过参数共享策略对转录文本及其音素进行联合建模,利用音素信息辅助检测并纠正缅甸语同音和空格错误。实验结果表明,本文所提方法相比基线方法ConvSeq2Seq,在缅甸语语音识别纠错任务中的F1值提升了85.97%,达到了79.15%。 展开更多
关键词 缅甸语 语音识别文本纠错 音素 共享参数 BERT
下载PDF
文本转语音工具对阅读障碍学生阅读理解的影响研究
4
作者 宋丽敏 毛荣建 《教育进展》 2024年第8期1008-1014,共7页
阅读障碍是一种神经发育性疾病,患有阅读障碍的学生无法完全克服该障碍,但可以通过教学中的辅助技术降低该障碍的影响程度。文本转语音(text-to-speech, TTS)技术和相关朗读工具的广泛运用,可以一定程度上帮助学生更好地理解书面材料。... 阅读障碍是一种神经发育性疾病,患有阅读障碍的学生无法完全克服该障碍,但可以通过教学中的辅助技术降低该障碍的影响程度。文本转语音(text-to-speech, TTS)技术和相关朗读工具的广泛运用,可以一定程度上帮助学生更好地理解书面材料。朗读工具实现文本转语音,使使用者能够一边听一边理解。但作为一种辅助工具,其应用也可能带来一些消极影响,如学生的注意力被分散。因此,文本转语音工具应用的有效性仍待进一步探索。目前尚不清楚文本转语音工具的使用是否有助于学生阅读理解能力的提升。本研究通过对文本转语音技术相关的研究进行回顾分析,探讨文本转语音工具对阅读障碍学生阅读理解的影响程度。结果发现文本转语音技术可能有助于学生的阅读理解,但对提高阅读理解能力的大小程度需要更多的研究来进一步探索。最后,讨论了未来研究的建议。Dyslexia is a neurodevelopmental disorder and students with dyslexia cannot fully overcome it, but the impact of dyslexia can be reduced through assistive technology. The extensive use of text- to-speech (TTS) technology can help students better understand written materials. The read- aloud tool enables text-to-speech conversion and enables users to understand while listening. But as an auxiliary tool, its application may also have some negative effects, for example, students’ attention may be distracted. Therefore, the effectiveness of text-to-speech applications still needs to be further explored. It is unclear whether the use of text-to-speech tools can help improve students’ reading comprehension. This study reviews the research on text-to-speech technology to explore the impact on reading comprehension of students with dyslexia. It was found that text-to- speech technology may help students’ reading comprehension, but more research is needed to further explore the extent to which reading comprehension can be achieved. Finally, recommendations for future research are discussed. 展开更多
关键词 阅读障碍 文本语音 阅读理解
下载PDF
语音文本对齐技术构建蒙古语语音识别语料库研究
5
作者 甄兆博 张晖 《中央民族大学学报(自然科学版)》 2024年第1期12-19,共8页
目前,适用于蒙古语的语音识别数据在规模上与英语、汉语的训练数据存在着巨大的差距。因此需要一种低成本的数据集构建方法,以补全数据来源上的短板。在生活交往中已生成了海量的蒙古语数据资源,其中很多都是语音文本粗略对照的形式,本... 目前,适用于蒙古语的语音识别数据在规模上与英语、汉语的训练数据存在着巨大的差距。因此需要一种低成本的数据集构建方法,以补全数据来源上的短板。在生活交往中已生成了海量的蒙古语数据资源,其中很多都是语音文本粗略对照的形式,本研究采用从这样的语料中提炼可供训练用的语料的技术路线,选择电视剧配音剧本和对应成片作为样例,将提炼工作看作是一个语音文本对齐问题。通过一系列自动化处理将剧本和对应的音频转换为适用于语音文本对齐处理的数据形式,利用迭代的对齐方法得到了语音文本对齐结果,利用这些结果生成了适用于蒙古语语音识别的逐句对齐的“语音—文本对”数据。通过对生成的数据进行抽样检查发现,生成的数据有较好的质量,与人工标注基本一致,节省了数据生产的成本。 展开更多
关键词 语音识别 蒙古语 生语料 语音文本对齐
下载PDF
国产游戏有声文字翻译的文化输出效果分析——以《原神》语音文本翻译为例
6
作者 魏义桥 常晓宏 《品位·经典》 2024年第11期78-81,共4页
近年来,随着我国游戏市场的快速发展,游戏已然成为对外文化输出方式的不二之选,国产游戏正以前所未有的势头走向海外,特别是日本市场。译者作为文化传播第一线的工作者,需要去发掘并探索这一新兴产业为翻译行业带来的机遇和影响,并站在... 近年来,随着我国游戏市场的快速发展,游戏已然成为对外文化输出方式的不二之选,国产游戏正以前所未有的势头走向海外,特别是日本市场。译者作为文化传播第一线的工作者,需要去发掘并探索这一新兴产业为翻译行业带来的机遇和影响,并站在自身角度去思考通过优质的本地化文本使我国文化得到高效传播。本文通过对游戏语音文本特性说明和例证分析,讨论我国游戏对外本地化和文化传播的效果。 展开更多
关键词 游戏 文化 本地化 语音文本
下载PDF
汉语文本-可视语音转换的研究 被引量:9
7
作者 王志明 蔡莲红 +1 位作者 吴志勇 陶建华 《小型微型计算机系统》 CSCD 北大核心 2002年第4期474-477,共4页
本文通过对发音者可见器官动作的研究 ,从视觉方面抽取汉语发音的 2 6个基本口形 ,并利用 MPEG- 4所规定的面部动画参数 (FAP)来描述这些口形 ,从而获得了符合国际标准的描述汉语发音的视觉参数 .另外 ,我们研究了这些参数在连续语流中... 本文通过对发音者可见器官动作的研究 ,从视觉方面抽取汉语发音的 2 6个基本口形 ,并利用 MPEG- 4所规定的面部动画参数 (FAP)来描述这些口形 ,从而获得了符合国际标准的描述汉语发音的视觉参数 .另外 ,我们研究了这些参数在连续语流中的变化及协同发音对口形的影响 ,基于已有的汉语文语转换系统 (Sonic)和二维网格人脸模型(Plane Face)实现了一个汉语文本 -可视语音转换系统 (TTVS) 展开更多
关键词 视觉语音 汉语文本-可视语音转换系统 协同发音 汉字信息处理
下载PDF
基于数据驱动方法的汉语文本-可视语音合成(英文) 被引量:16
8
作者 王志明 蔡莲红 艾海舟 《软件学报》 EI CSCD 北大核心 2005年第6期1054-1063,共10页
计算机文本-可视语音合成系统(TTVS)可以增强语音的可懂度,并使人机交互界面变得更为友好.给出一个基于数据驱动方法(基于样本方法)的汉语文本-可视语音合成系统,通过将小段视频拼接生成新的可视语音.给出一种构造汉语声韵母视觉混淆树... 计算机文本-可视语音合成系统(TTVS)可以增强语音的可懂度,并使人机交互界面变得更为友好.给出一个基于数据驱动方法(基于样本方法)的汉语文本-可视语音合成系统,通过将小段视频拼接生成新的可视语音.给出一种构造汉语声韵母视觉混淆树的有效方法,并提出了一个基于视觉混淆树和硬度因子的协同发音模型,模型可用于分析阶段的语料库选取和合成阶段的基元选取.对于拼接边界处两帧图像的明显差别,采用图像变形技术进行平滑并.结合已有的文本-语音合成系统(TTS),实现了一个中文文本-视觉语音合成系统. 展开更多
关键词 文-语转换系统(TTS) 文本-可视语音合成系统(TTVS) 视位 协同发音
下载PDF
文本-视觉语音合成综述 被引量:5
9
作者 王志明 陶建华 《计算机研究与发展》 EI CSCD 北大核心 2006年第1期145-152,共8页
视觉信息对于理解语音的内容非常重要·不只是听力有障碍的人,普通人在交谈过程中也存在着一定程度的唇读,尤其是在语音质量受损的噪声环境下·正如文语转换系统可以使计算机像人一样讲话,文本-视觉语音合成系统可以使计算机模... 视觉信息对于理解语音的内容非常重要·不只是听力有障碍的人,普通人在交谈过程中也存在着一定程度的唇读,尤其是在语音质量受损的噪声环境下·正如文语转换系统可以使计算机像人一样讲话,文本-视觉语音合成系统可以使计算机模拟人类语音的双模态性,让计算机界面变得更为友好·回顾了文本-视觉语音合成的发展·文本驱动的视觉语音合成的实现方法可以分为两类:基于参数控制的方法和基于数据驱动的方法·详细介绍了参数控制类中的几个关键问题和数据驱动类中的几种不同实现方法,比较了这两类方法的优缺点及不同的适用环境· 展开更多
关键词 文本-视觉语音合成(TTVS) 视位 协同发音 人脸模型 人脸动画
下载PDF
动态文本-语音编程系统的研究与应用 被引量:2
10
作者 赵建洋 胡泽雄 《淮阴工学院学报》 CAS 2007年第3期36-39,共4页
为实现动态文本的动态发声,应用微软二次开发包Speech SDK 5.1提供的Speech API函数,结合VC动态链接库高级编程技术,在医院大厅的语音文字通告系统中,以划价收费模块为核心,实现了将文字实时动态转化为语音的信息管理系统的开发,该动态... 为实现动态文本的动态发声,应用微软二次开发包Speech SDK 5.1提供的Speech API函数,结合VC动态链接库高级编程技术,在医院大厅的语音文字通告系统中,以划价收费模块为核心,实现了将文字实时动态转化为语音的信息管理系统的开发,该动态语音文字编程系统还可以用于车站、证券交易等场合的信息播报。 展开更多
关键词 动态链接库 文本-语音转换 语音合成
下载PDF
语音超文本系统中锚点标记方式的比较研究 被引量:1
11
作者 沈模卫 丁海杰 +1 位作者 白金华 苏辉 《心理科学》 CSSCI CSCD 北大核心 2004年第5期1027-1031,共5页
近年来 ,语音超文本系统中超链接锚点的标记方式成为该研究领域的一个热点问题。笔者在设计参数优化基础上对语音超文本系统中常见的两种超链接锚点标记方式———言语相关标记与非言语相关标记进行比较研究 ,旨在为语音超文本界面中超... 近年来 ,语音超文本系统中超链接锚点的标记方式成为该研究领域的一个热点问题。笔者在设计参数优化基础上对语音超文本系统中常见的两种超链接锚点标记方式———言语相关标记与非言语相关标记进行比较研究 ,旨在为语音超文本界面中超链接锚点标记的设计提供适宜的参数。实验在模拟的语音超文本系统中进行 ,以链接词检测率、句子理解正确率和主观评价作为评价绩效的指标 ,结果发现 ,(1 )男女声变调的言语相关标记方式下对链接词的检测率和主观评价均优于全词标记和尾字标记两种非言语相关标记方式 ,但上述三种标记方式对句子理解均无显著影响 ;(2 )采用非言语相关标记时 ,链接词在句中的位置显著影响其检测率。根据上述结果 ,笔者推荐男女声变调标记可作为语音超文本链接词标记的首选方式。 展开更多
关键词 语音文本系统 锚点标记方式 比较研究 语音超链接 言语相关标记 评价绩效
下载PDF
基于人工智能的中文语音文本智能编辑系统设计 被引量:1
12
作者 殷建立 冯一龙 《科技创新导报》 2020年第2期138-139,共2页
本文将利用人工智能技术,介绍中文语音文本智能编辑系统的设计思路,并对其中的语言识别以及系统的运行流程进行了分析.总体而言,本文所介绍的基于人工智能的中文语音文本编辑系统能够满足语音文本处理的要求,具有先进性.
关键词 人工智能 中文语音文本 文本智能编辑
下载PDF
HM-BERT:一种采用分级掩码的风电语音文本纠正方法
13
作者 高永兵 郑伟业 +1 位作者 李春灿 姜春光 《内蒙古科技大学学报》 CAS 2023年第4期367-371,共5页
采用一种基于分级掩码策略的文本纠正方法来提高语音识别后的文本质量.以风电相关的语音为数据集,将其通过公开的语音识别SDK转为文本数据,利用BERT中的MLM机制实现文本纠正,并采用分级掩码策略,针对不同的内容采用不同的掩码方法,改进... 采用一种基于分级掩码策略的文本纠正方法来提高语音识别后的文本质量.以风电相关的语音为数据集,将其通过公开的语音识别SDK转为文本数据,利用BERT中的MLM机制实现文本纠正,并采用分级掩码策略,针对不同的内容采用不同的掩码方法,改进后的模型称为HM-BERT.实验证明:HM-BERT在提升纠正效果的同时还加强了纠正模型的鲁棒性,该方法对其他领域的文本纠正也提供了解决思路. 展开更多
关键词 BERT MLM 分级掩码 语音文本纠正
下载PDF
语音-文本转换技术在手机软件开发中的应用
14
作者 杨颖 曹红兵 +1 位作者 吴方 杨晴龙 《安庆师范学院学报(自然科学版)》 2016年第3期73-77,共5页
语音-文本转换旨在将说话人语音中的词汇内容转换为计算机可读的文本输入,使计算机具有能够"听懂"人类语音的能力。基于Android智能手机平台,利用国内先进的语音-文本转换技术设计并实现了两款手机软件——商品订单查询和手... 语音-文本转换旨在将说话人语音中的词汇内容转换为计算机可读的文本输入,使计算机具有能够"听懂"人类语音的能力。基于Android智能手机平台,利用国内先进的语音-文本转换技术设计并实现了两款手机软件——商品订单查询和手机语音笔记。商品订单查询的语音功能提供了更为便捷的个性化操作。手机语音笔记的主要功能包括单人录音和多人协作录音,尤其是多人协作录音实现了多人语音交流的记录和分享。这两款手机软件具有一定的实际应用价值。 展开更多
关键词 手机应用软件开发 语音-文本转换 语音查询 语音笔记
下载PDF
蒙古语长音频语音文本自动对齐的研究 被引量:5
15
作者 牛米佳 飞龙 高光来 《中文信息学报》 CSCD 北大核心 2020年第1期51-57,共7页
目前,面向蒙古语的语音识别语音库资源相对稀缺,但存在较多的电视剧、广播等蒙古语音频和对应的文本。该文提出基于语音识别的蒙古语长音频语音文本自动对齐方法,实现蒙古语电视剧语音的自动标注,扩充了蒙古语语音库。在前端处理阶段,... 目前,面向蒙古语的语音识别语音库资源相对稀缺,但存在较多的电视剧、广播等蒙古语音频和对应的文本。该文提出基于语音识别的蒙古语长音频语音文本自动对齐方法,实现蒙古语电视剧语音的自动标注,扩充了蒙古语语音库。在前端处理阶段,使用基于高斯混合模型的语音端点检测技术筛选并删除噪音段;在语音识别阶段,构建基于前向型序列记忆网络的蒙古语声学模型;最后基于向量空间模型,将语音识别得到的假设序列和参考音素序列进行句子级别的动态时间归整算法匹配。实验结果表明,与基于Needleman-Wunsch算法的语音对齐比较,该文提出的蒙古语长音频语音文本自动对齐方法的对齐正确率提升了31.09%。 展开更多
关键词 蒙古语 语音端点检测 语音文本对齐 动态时间归整算法
下载PDF
不完全匹配的语音和文本语句级对齐 被引量:1
16
作者 徐锴 陶冶 李辉 《计算机系统应用》 2023年第4期300-307,共8页
语音文本自动对齐技术广泛应用于语音识别与合成、内容制作等领域,其主要目的是将语音和相应的参考文本在语句、单词、音素等级别的单元进行对齐,并获得语音与参考文本之间的时间对位信息.最新的先进对齐方法大多基于语音识别,一方面,... 语音文本自动对齐技术广泛应用于语音识别与合成、内容制作等领域,其主要目的是将语音和相应的参考文本在语句、单词、音素等级别的单元进行对齐,并获得语音与参考文本之间的时间对位信息.最新的先进对齐方法大多基于语音识别,一方面,准确率受限于语音识别效果,识别字错误率高时文语对齐精度明显下降,识别字错误率对对齐精度影响较大;另一方面,这种对齐方法不能有效处理不完全匹配的长篇幅语音和文本的对齐.该文提出一种基于锚点和韵律信息的文语对齐方法,通过基于边界锚点加权的片段标注将语料划分为对齐段和未对齐段,针对未对齐段使用双门限端点检测方法提取韵律信息,并检测语句边界,降低了基于语音识别的对齐方法对语音识别效果的依赖程度.实验结果表明,与目前先进的基于语音识别的文语对齐方法比较,即使在识别字错误率为0.52时,该文所提方法的对齐准确率仍能提升45%以上;在音频文本不匹配程度为0.5时,该文所提方法能提高3%. 展开更多
关键词 语音文本对齐 韵律信息 锚点 自动语音识别 端点检测
下载PDF
语音超文本界面设计中的工效学问题 被引量:3
17
作者 崔艳青 沈模卫 苏辉 《人类工效学》 2003年第2期48-50,共3页
语音超文本是利用超文本方式组织信息的语音系统。文章试图从工效学的角度对语音超文本系统中存在的问题进行分析 ,以总结语音超文本设计的工效学原则。在语音超文本设计中 ,语音和非语音信息都可以用于语音超文本的结构化和语音超链接... 语音超文本是利用超文本方式组织信息的语音系统。文章试图从工效学的角度对语音超文本系统中存在的问题进行分析 ,以总结语音超文本设计的工效学原则。在语音超文本设计中 ,语音和非语音信息都可以用于语音超文本的结构化和语音超链接的表征 ,但是它们表征对象的层次有所差异。在语音超文本系统的输入中 ,按键仍然是主流的方式 。 展开更多
关键词 语音文本 界面设计 工效学 语音超链接 节点选择 进程控制
下载PDF
电视天气预报文本转语音编辑制作系统设计方案 被引量:1
18
作者 邓正良 许伟彪 +1 位作者 杨涠洁 宋海玲 《科技风》 2011年第20期51-52,共2页
该文利用Excel公式制作天气预报文本录入的"可选数据输入输出表"工具,并结合微软speechSDK5.1提供的TTS语音开发包进行二次开发,在VB编程环境下实现了多文本窗口编辑和能快速输出文本转语音的功能,该系统集天气预报文本录入... 该文利用Excel公式制作天气预报文本录入的"可选数据输入输出表"工具,并结合微软speechSDK5.1提供的TTS语音开发包进行二次开发,在VB编程环境下实现了多文本窗口编辑和能快速输出文本转语音的功能,该系统集天气预报文本录入、天气预报编辑、天气预报语音输出于一体。为电视天气预报节目制作提供一种新的制作方案。 展开更多
关键词 EXCEL TTS技术 VB编程 文本语音
下载PDF
Balabolka和拼音文本转语音系统比较及其对外汉语语音教学应用 被引量:1
19
作者 吴荣顺 Saiful Nizam Warris 《国际汉语学报》 2016年第1期217-227,共11页
对外汉语学生在会话上对于自己的语音表现需要有所指导和示范。文本转语音系统可以提供这方面的需要,并且协助补偿课堂教学中教师不能够给予的个人化的语音指导。本文比较两个文本转语音系统在协助提高对外汉语学生语音能力上的辅助。... 对外汉语学生在会话上对于自己的语音表现需要有所指导和示范。文本转语音系统可以提供这方面的需要,并且协助补偿课堂教学中教师不能够给予的个人化的语音指导。本文比较两个文本转语音系统在协助提高对外汉语学生语音能力上的辅助。这两种文本转语音系统为Balabolka和我们所开发的拼音文本转语音系统(http://terengganul.uitm.edu.my/mandarin/index2.php)。研究结果显示着两种文本转语音系统都有助于对外汉语学生的语音学习。 展开更多
关键词 Balabolka 文本语音系统 对外汉语语音教学 拼音 汉字
下载PDF
风电检修语音记录转译文本的纠错技术研究
20
作者 运佳恩 高永兵 《智能城市》 2023年第12期1-4,共4页
在风电自动检修服务中,语音转文字和文本纠错技术是关键的步骤。由于语音识别技术的限制,常出现文本错误,可能导致检修结果的误判,进而影响风电系统的检修效率。为了提高风电自动检修系统的效率,文章提出了一种BERT-BiLSTM-CRF模型,结合... 在风电自动检修服务中,语音转文字和文本纠错技术是关键的步骤。由于语音识别技术的限制,常出现文本错误,可能导致检修结果的误判,进而影响风电系统的检修效率。为了提高风电自动检修系统的效率,文章提出了一种BERT-BiLSTM-CRF模型,结合了BERT预训练模型、双向LSTM (BiLSTM)和条件随机场(CRF) 3种不同的模型。该模型利用目标化的分类掩盖方法将文本中的各种错误进行归类,可以更准确地识别文本中的错误,提高BERT模型在文本纠错工作中的效率。 展开更多
关键词 语音转译文本 BERT-BiLSTM-CRF模型 文本纠错
下载PDF
上一页 1 2 5 下一页 到第
使用帮助 返回顶部