期刊文献+
共找到39篇文章
< 1 2 >
每页显示 20 50 100
语音文本对齐技术构建蒙古语语音识别语料库研究
1
作者 甄兆博 张晖 《中央民族大学学报(自然科学版)》 2024年第1期12-19,共8页
目前,适用于蒙古语的语音识别数据在规模上与英语、汉语的训练数据存在着巨大的差距。因此需要一种低成本的数据集构建方法,以补全数据来源上的短板。在生活交往中已生成了海量的蒙古语数据资源,其中很多都是语音文本粗略对照的形式,本... 目前,适用于蒙古语的语音识别数据在规模上与英语、汉语的训练数据存在着巨大的差距。因此需要一种低成本的数据集构建方法,以补全数据来源上的短板。在生活交往中已生成了海量的蒙古语数据资源,其中很多都是语音文本粗略对照的形式,本研究采用从这样的语料中提炼可供训练用的语料的技术路线,选择电视剧配音剧本和对应成片作为样例,将提炼工作看作是一个语音文本对齐问题。通过一系列自动化处理将剧本和对应的音频转换为适用于语音文本对齐处理的数据形式,利用迭代的对齐方法得到了语音文本对齐结果,利用这些结果生成了适用于蒙古语语音识别的逐句对齐的“语音—文本对”数据。通过对生成的数据进行抽样检查发现,生成的数据有较好的质量,与人工标注基本一致,节省了数据生产的成本。 展开更多
关键词 语音识别 蒙古语 生语料 语音文本对齐
下载PDF
一种构建自适应蒙古语语音识别声学模型的方法 被引量:1
2
作者 马志强 李图雅 +1 位作者 闫瑞 张力 《计算机应用与软件》 北大核心 2018年第2期167-171,234,共6页
蒙古语语言中非词首音节短元音位置不确定产生了一词多音、构词音变、协同发音以及口语语流等现象,导致声学模型自适应性差。通过使用小规模的自适应数据集,结合MLLR和MAP建模方法,从τ值的选取和自适应声学模型建模的训练过程两方面对... 蒙古语语言中非词首音节短元音位置不确定产生了一词多音、构词音变、协同发音以及口语语流等现象,导致声学模型自适应性差。通过使用小规模的自适应数据集,结合MLLR和MAP建模方法,从τ值的选取和自适应声学模型建模的训练过程两方面对基本蒙古语声学模型的自适应性开展研究,给出了一种适合构建自适应蒙古语语音识别声学模型的MLLR-MAP方法。在Sphinx语音识别实验平台上进行建模实验,使用声学模型识别率与系统识别率评价指标对MAP、MLLR、MAP-MLLR和MLLR-MAP等建模方法进行评价。实验结果表明,在声学模型的总正确率、错误率和准确率三个评价指标上都得到了提升,明显优于基线模型。 展开更多
关键词 MLLRMAP 声学模型 自适应性 蒙古语 语音识别
下载PDF
基于词汇的蒙古语文语转换的实验 被引量:2
3
作者 高光来 孟和吉雅 姗丹 《内蒙古大学学报(自然科学版)》 CAS CSCD 2000年第1期121-124,共4页
蒙古语是一种很有影响的语言, 较中文和西文有许多独特的方面.本文介绍了一个基于词汇的蒙古语文语转换系统的设计与实现.
关键词 语音合成 文语转换 蒙古语 词汇 计算机语音处理
下载PDF
融合形态特征的最大熵蒙古文词性标注模型 被引量:10
4
作者 张贯虹 斯.劳格劳 乌达巴拉 《计算机研究与发展》 EI CSCD 北大核心 2011年第12期2385-2390,共6页
最大熵模型以其能够较好地包容各种约束信息及与自然语言模型相适应等优点在词性标注研究中取得了良好的效果.因此,将其作为基本框架,提出了一种融合语言特征的最大熵蒙古文词性标注模型.首先,根据蒙古文构词特点及统计分析结果,定义并... 最大熵模型以其能够较好地包容各种约束信息及与自然语言模型相适应等优点在词性标注研究中取得了良好的效果.因此,将其作为基本框架,提出了一种融合语言特征的最大熵蒙古文词性标注模型.首先,根据蒙古文构词特点及统计分析结果,定义并选取特征模板,利用训练语料提取了大量的候选特征集合,针对错误或者无效的特征通过设置一些规则筛选特征.然后,训练最大熵概率模型参数.实验结果表明,融合蒙古文形态特征的最大熵模型可以较好地标注蒙古文. 展开更多
关键词 形态特征 最大熵模型 蒙古文 词性标注 参数估计
下载PDF
基于语音特征比较的蒙古语标准音测试系统研究 被引量:2
5
作者 孟和吉雅 白音门德 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2008年第4期461-464,共4页
在蒙古语标准音的水平测试过程中,人们对测试结果存在一些分歧.为了消除测试结果的这些分歧,提出了用基于语音特征比较的蒙古语标准音测试软件来辅助测试的思路.通过对输入的测试语音进行分析,提取语音特征并与参考的标准音进行匹配比较... 在蒙古语标准音的水平测试过程中,人们对测试结果存在一些分歧.为了消除测试结果的这些分歧,提出了用基于语音特征比较的蒙古语标准音测试软件来辅助测试的思路.通过对输入的测试语音进行分析,提取语音特征并与参考的标准音进行匹配比较,根据相似程度大小给出测试结果.软件在屏幕上绘制出语音的波形,共振峰等图形,可以更直接的反映出被比较的两个语音间的差别. 展开更多
关键词 蒙古语 波形 共振峰 标准音
下载PDF
基于端点检测的蒙藏维语音片段数据集 被引量:1
6
作者 韦向峰 袁毅 +1 位作者 张全 吐尔逊·卡得 《中国科学数据(中英文网络版)》 CSCD 2019年第4期108-118,共11页
在“中国少数民族地区蒙藏维言语录音2015数据集”的语音数据基础上,采用短时能量和短时过零率的双门限端点检测方法,得到一个句子语音的多个语音片段文件。本语音片段数据集包含蒙古语语音片段1657个、藏语语音片段666个、维吾尔语语... 在“中国少数民族地区蒙藏维言语录音2015数据集”的语音数据基础上,采用短时能量和短时过零率的双门限端点检测方法,得到一个句子语音的多个语音片段文件。本语音片段数据集包含蒙古语语音片段1657个、藏语语音片段666个、维吾尔语语音片段756个,数据总量大小约为111 MB。通过软件自动切分和语言专家的多重审核校对得到高质量的蒙藏维多语种的语音片段数据,可应用于少数民族的语音识别、端点检测、语音增强、语音合成和语言教学等领域。 展开更多
关键词 语音片段 端点检测 蒙古语 藏语 维吾尔语 语音数据
下载PDF
蒙古语语音合成语料库的设计及韵律标注规范的建立 被引量:2
7
作者 郭淑妮 图雅 斯琴高娃 《电脑与电信》 2012年第3期22-25,共4页
以蒙古语中的察哈尔方言为研究对象,结合了蒙古语自身的音节结构特点,对蒙语语音合成语料库的构建进行了介绍,同时设计了一套韵律标注规则。语料来源于新闻语料(蒙文版)、蒙文网站以及蒙文书籍等,语料的设计考虑了蒙语的音节结构。韵律... 以蒙古语中的察哈尔方言为研究对象,结合了蒙古语自身的音节结构特点,对蒙语语音合成语料库的构建进行了介绍,同时设计了一套韵律标注规则。语料来源于新闻语料(蒙文版)、蒙文网站以及蒙文书籍等,语料的设计考虑了蒙语的音节结构。韵律标注的准则在参照汉语C-ToBI的基础上进行设计,采用PRAAT语音分析软件,标注包括拉丁转写、音节结构类型、重音类型以及停顿指数。 展开更多
关键词 蒙语 语音合成 语料库 韵律标注
下载PDF
基于CRF模型的蒙古文分词及词性标注的研究 被引量:3
8
作者 那日松 淑琴 齐力格尔 《内蒙古大学学报(哲学社会科学版)》 2016年第2期23-28,共6页
为了探讨蒙古文自动词切分及词性标注的问题,可以首先对20万词级蒙古文语料的词切分和词性标注情况进行统计和分析,并对其切分和标注错误进行二次修正,然后再采用条件随机场模型(CRF),进行自动"分词"、"词性标注"... 为了探讨蒙古文自动词切分及词性标注的问题,可以首先对20万词级蒙古文语料的词切分和词性标注情况进行统计和分析,并对其切分和标注错误进行二次修正,然后再采用条件随机场模型(CRF),进行自动"分词"、"词性标注"、分词及词性标注"统一实现"的研究。开放测试的结果表明,蒙古文自动分词准确率在98%以上,蒙古文分词和词性标注"统一实现"实验结果的准确率比分词和词性标注"两步走"实验结果的准确率高出3.55%,"统一实现"实验在考虑"上下文"和特征"连写的附加成分"后所得准确率可以达到93.38%,这在一定程度上解决了蒙古文分词及词性标注问题。 展开更多
关键词 蒙古文分词 蒙古文词性标注 条件随机场
下载PDF
蒙古语词性标注系统的设计 被引量:1
9
作者 赵斯琴 《内蒙古师范大学学报(自然科学汉文版)》 CAS 2006年第2期186-188,共3页
介绍了蒙古语词性标注系统的设计思想、实现方法及标注系统的主要功能.该系统采用基于规则和统计相结合的方法对蒙古语句子进行分类,并对已分类的句子进行词性自动标注.
关键词 蒙古语 分类 词性 自动标注
下载PDF
2015年中国少数民族地区蒙藏维言语录音数据集 被引量:2
10
作者 韦向峰 袁毅 +1 位作者 张全 池哲洁 《中国科学数据(中英文网络版)》 2016年第2期62-68,共7页
本文介绍了2015年采集的来自内蒙古、青海、西藏和新疆的蒙古语、藏语和维吾尔语言语数据集,使用客户端/服务器架构的言语数据远程采集系统,实现了蒙藏维少数民族言语数据的低成本高效采集,公开共享的言语数据集大小为136 MB近800句。... 本文介绍了2015年采集的来自内蒙古、青海、西藏和新疆的蒙古语、藏语和维吾尔语言语数据集,使用客户端/服务器架构的言语数据远程采集系统,实现了蒙藏维少数民族言语数据的低成本高效采集,公开共享的言语数据集大小为136 MB近800句。该数据集对于少数民族言语分析研究与教学、语音识别与合成具有重要的研究价值和应用价值,本文的言语数据采集系统仅需少许改动也可以应用于其他语种或者方言的言语数据采集,具有操作简单、部署方便、成本低等特点。 展开更多
关键词 言语数据 少数民族 蒙藏维 录音 远程采集
下载PDF
统计模型中附加语言学规则的蒙古语词法分析
11
作者 张聪品 赵理莉 《计算机工程与设计》 CSCD 北大核心 2011年第8期2861-2864,共4页
蒙古词法分析是蒙古语信息处理的基础性问题,是蒙古语信息处理工作的第一步。通过对统计模型和蒙古语构词规则进行深入研究,提出了一种融合统计和规则技术的蒙古语词切分和词性标注的方法。该方法以统计模型作为基本框架,采用树形结构... 蒙古词法分析是蒙古语信息处理的基础性问题,是蒙古语信息处理工作的第一步。通过对统计模型和蒙古语构词规则进行深入研究,提出了一种融合统计和规则技术的蒙古语词切分和词性标注的方法。该方法以统计模型作为基本框架,采用树形结构描述系统的解空间,并加入了蒙古语语言学规则和词干、词缀词典。实验结果表明,该系统分词和词性标注的词级准确率为95.1%,词干/词缀级准确率为94.6%,较已有蒙古语词法分析系统的准确率有所提高。 展开更多
关键词 蒙古语信息处理 蒙古语词法分析 蒙古语分词 蒙古语词性标注 联合切分和词性标注
下载PDF
蒙古语语音库中动词词缀分库的建立
12
作者 包春梅 敖其尔 +1 位作者 马占新 阿日木扎 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2009年第6期734-737,共4页
针对蒙古语语音合成系统中合成出来的语音相对自然蒙古语音生硬、缓慢、机器味重等问题,建立了有效的整词音库和动词词缀语音库,即将动词词干词缀作为语音合成的基元.所选语音基元对合成高效的蒙古语语音合成系统起到决定性作用.应用该... 针对蒙古语语音合成系统中合成出来的语音相对自然蒙古语音生硬、缓慢、机器味重等问题,建立了有效的整词音库和动词词缀语音库,即将动词词干词缀作为语音合成的基元.所选语音基元对合成高效的蒙古语语音合成系统起到决定性作用.应用该语音库可以合成出更自然、更流畅、发音更完整的语音,并且可以实现蒙古语中无限词全部组合发音的目标. 展开更多
关键词 信息处理 语音合成 语音库 词缀 蒙古语
下载PDF
从生成语法角度看蒙古语引语归类问题
13
作者 苏日娜 《内蒙古民族大学学报(社会科学版)》 2008年第3期73-75,共3页
传统语法里,习惯把蒙古语引语当作句子成分在句法里研究。但经笔者观察发现,其实对引语的归属问题还有很多分歧,甚至有些书籍内部就出现了自相矛盾的解释情况。根据上述情况,笔者试图从生成语法的角度对传统语法在引语的归属问题上不太... 传统语法里,习惯把蒙古语引语当作句子成分在句法里研究。但经笔者观察发现,其实对引语的归属问题还有很多分歧,甚至有些书籍内部就出现了自相矛盾的解释情况。根据上述情况,笔者试图从生成语法的角度对传统语法在引语的归属问题上不太明确的现象进行分析并解决。 展开更多
关键词 生成语法 蒙古语 引语
下载PDF
蒙古文词性标注研究
14
作者 那日松 淑琴 《内蒙古大学学报(哲学社会科学版)》 2015年第2期26-32,共7页
笔者基于条件随机场(Conditional Random Field,CRF)和支持向量机(Support Vector Machine,SVM)模型,通过增加上下文、附加成分和蒙古文字母等特征,对蒙古文句长为8到25的将近4万个句子进行了词性标注的研究。研究表明,CRF模型和SVM模... 笔者基于条件随机场(Conditional Random Field,CRF)和支持向量机(Support Vector Machine,SVM)模型,通过增加上下文、附加成分和蒙古文字母等特征,对蒙古文句长为8到25的将近4万个句子进行了词性标注的研究。研究表明,CRF模型和SVM模型在标注蒙古文词性方面都有比较好的结果,其中在考虑上下文和特征"连写的构形附加成分"的情况下,SVM模型标注蒙古文词性的准确率可以达到99%以上。 展开更多
关键词 蒙古文 词性标注 CRF模型 SVM模型
下载PDF
双重语言传播态度的实证研究
15
作者 邬美丽 《语言文化研究辑刊》 2014年第2期46-56,共11页
本研究的调查点是一个蒙古族聚居言语社区:展旦召嘎查一社。本文从语言状况的感知、语言传承态度、语言保护态度、对语言重要性的认识、语言推广的能愿性五个层面,调查受试的语言传播态度。调查发现,展旦召嘎查一社蒙古族居民的语言... 本研究的调查点是一个蒙古族聚居言语社区:展旦召嘎查一社。本文从语言状况的感知、语言传承态度、语言保护态度、对语言重要性的认识、语言推广的能愿性五个层面,调查受试的语言传播态度。调查发现,展旦召嘎查一社蒙古族居民的语言传播态度是受多方面因素影响的双重态度。 展开更多
关键词 蒙古族言语社区 展旦召嘎查 双重语言传播态度
下载PDF
基于HMM的蒙古语语音合成技术研究 被引量:6
16
作者 赵建东 高光来 飞龙 《计算机科学》 CSCD 北大核心 2014年第1期80-82,104,共4页
基于隐马尔科夫模型的语音合成方法是当今语音合成的主流方法,它已被广泛应用于英语、汉语、日语等语音合成系统中。然而基于隐马尔科夫模型的蒙古语的语音合成技术研究还处于空白状态。首次将基于隐马尔科夫模型的语音合成方法用于蒙... 基于隐马尔科夫模型的语音合成方法是当今语音合成的主流方法,它已被广泛应用于英语、汉语、日语等语音合成系统中。然而基于隐马尔科夫模型的蒙古语的语音合成技术研究还处于空白状态。首次将基于隐马尔科夫模型的语音合成方法用于蒙古语语音合成,并进行了语音合成实验。从最终合成系统的效果来看,合成的语音整体稳定流畅,可懂度高,而且节奏感比较强,主观平均得分为3.80。这为进一步研究基于隐马尔科夫模型的蒙古语语音合成技术奠定了基础。 展开更多
关键词 隐马尔科夫模型 蒙古语 标注 语音合成
下载PDF
蒙古语电话语音语料库的建立 被引量:4
17
作者 飞龙 高光来 鲍玉来 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2013年第3期320-323,共4页
蒙古语电话语音的研究刚刚起步,建立规模较大的、通用的电话语音语料库成为了重要的基础工作.本次建立的蒙古语电话语音语料库是以自然口语的对话形式进行录制,并且体现了不同电话信道、不同方言、不同年龄段说话人的特点.本文详细讨论... 蒙古语电话语音的研究刚刚起步,建立规模较大的、通用的电话语音语料库成为了重要的基础工作.本次建立的蒙古语电话语音语料库是以自然口语的对话形式进行录制,并且体现了不同电话信道、不同方言、不同年龄段说话人的特点.本文详细讨论了语料库的录制整理、语音切分和语音标注等几个问题.本次建立的语料库为蒙古语电话语音的语音识别、语音检索、语音监控和说话人识别等技术的研究提供了真实的实验数据. 展开更多
关键词 蒙古语 电话语音 语音语料库 语音标注
下载PDF
蒙古语语言-文字的自动化处理 被引量:6
18
作者 伊.达瓦 张玉洁 +4 位作者 上园一知 大川茂树 章森 井佐原均 白井克彦 《中文信息学报》 CSCD 北大核心 2006年第4期56-62,93,共8页
本文首先叙述了蒙文电子化的意义以及蒙文电子化数据的现状。然后重点讨论了在不同地区和国家使用的蒙文书面语以及口语的不同和蒙文在计算机处理时所面临的问题。最后,介绍了我们在日本建设的针对蒙古语语言信息处理的两种语言资源:蒙... 本文首先叙述了蒙文电子化的意义以及蒙文电子化数据的现状。然后重点讨论了在不同地区和国家使用的蒙文书面语以及口语的不同和蒙文在计算机处理时所面临的问题。最后,介绍了我们在日本建设的针对蒙古语语言信息处理的两种语言资源:蒙古语多方言口语语料库和蒙文多文种-多语言并行语法标注电子词典,后者得到了2005年中日蒙韩国际合作课题“蒙文自然语言处理技术的研究”的资助。 展开更多
关键词 计算机应用 中文信息处理 蒙文语言文字信息处理 文本-口语语料库 多文种-多语言电子词典
下载PDF
基于TDNN-FSMN的蒙古语语音识别技术研究 被引量:6
19
作者 王勇和 飞龙 高光来 《中文信息学报》 CSCD 北大核心 2018年第9期28-34,共7页
为了提高蒙古语语音识别性能,该文首先将时延神经网络融合前馈型序列记忆网络应用于蒙古语语音识别任务中,通过对长序列语音帧建模来充分挖掘上下文相关信息;此外研究了前馈型序列记忆网络"记忆"模块中历史信息和未来信息长... 为了提高蒙古语语音识别性能,该文首先将时延神经网络融合前馈型序列记忆网络应用于蒙古语语音识别任务中,通过对长序列语音帧建模来充分挖掘上下文相关信息;此外研究了前馈型序列记忆网络"记忆"模块中历史信息和未来信息长度对模型的影响;最后分析了融合的网络结构中隐藏层个数及隐藏层节点数对声学模型性能的影响。实验结果表明,时延神经网络融合前馈型序列记忆网络相比深度神经网络、时延神经网络和前馈型序列记忆网络具有更好的性能,单词错误率与基线深度神经网络模型相比降低22.2%。 展开更多
关键词 蒙古语 语音识别 时延神经网络 前馈型序列记忆网络
下载PDF
蒙古语文语转换系统的研究与实现 被引量:1
20
作者 何敏 高光来 赵斯琴 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第1期100-104,共5页
介绍了一个基于PSOLA合成技术的蒙古语文语转换系统.系统针对蒙古语自身的特点,采用了语音合成领域比较成熟的波形编辑合成技术.也建立了实用的蒙古语语音合成音库,音库基元都进行了基音标记,在韵律修改中也做了尝试.
关键词 蒙古语 文语转换 音库 TTS PSOLA
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部