期刊文献+
共找到35篇文章
< 1 2 >
每页显示 20 50 100
Performance Analysis of Optimized Content Extraction for Cyrillic Mongolian Learning Text Materials in the Database
1
作者 Bat-Erdene Nyandag Ru Li G. Indruska 《Journal of Computer and Communications》 2016年第10期79-89,共12页
This paper had developed and tested optimized content extraction algorithm using NLP method, TFIDF method for word of weight, VSM for information search, cosine method for similar quality calculation from learning doc... This paper had developed and tested optimized content extraction algorithm using NLP method, TFIDF method for word of weight, VSM for information search, cosine method for similar quality calculation from learning document at the distance learning system database. This test covered following things: 1) to parse word structure at the distance learning system database documents and Cyrillic Mongolian language documents at the section, to form new documents by algorithm for identifying word stem;2) to test optimized content extraction from text material based on e-test results (key word, correct answer, base form with affix and new form formed by word stem without affix) at distance learning system, also to search key word by automatically selecting using word extraction algorithm;3) to test Boolean and probabilistic retrieval method through extended vector space retrieval method. This chapter covers: to process document content extraction retrieval algorithm, to propose recommendations query through word stem, not depending on word position based on Cyrillic Mongolian language documents distinction. 展开更多
关键词 Cyrillic mongolian Language Content Extraction Formatting Learning text Materials Style
下载PDF
语音文本对齐技术构建蒙古语语音识别语料库研究
2
作者 甄兆博 张晖 《中央民族大学学报(自然科学版)》 2024年第1期12-19,共8页
目前,适用于蒙古语的语音识别数据在规模上与英语、汉语的训练数据存在着巨大的差距。因此需要一种低成本的数据集构建方法,以补全数据来源上的短板。在生活交往中已生成了海量的蒙古语数据资源,其中很多都是语音文本粗略对照的形式,本... 目前,适用于蒙古语的语音识别数据在规模上与英语、汉语的训练数据存在着巨大的差距。因此需要一种低成本的数据集构建方法,以补全数据来源上的短板。在生活交往中已生成了海量的蒙古语数据资源,其中很多都是语音文本粗略对照的形式,本研究采用从这样的语料中提炼可供训练用的语料的技术路线,选择电视剧配音剧本和对应成片作为样例,将提炼工作看作是一个语音文本对齐问题。通过一系列自动化处理将剧本和对应的音频转换为适用于语音文本对齐处理的数据形式,利用迭代的对齐方法得到了语音文本对齐结果,利用这些结果生成了适用于蒙古语语音识别的逐句对齐的“语音—文本对”数据。通过对生成的数据进行抽样检查发现,生成的数据有较好的质量,与人工标注基本一致,节省了数据生产的成本。 展开更多
关键词 语音识别 蒙古语 生语料 语音文本对齐
下载PDF
基于B-DMM的蒙医药文本数据聚类算法研究 被引量:1
3
作者 包启明 裴志利 +1 位作者 姜明洋 熊露 《内蒙古民族大学学报(自然科学版)》 2023年第2期124-128,共5页
为能够更好地了解蒙医药领域研究的热点和前沿,在GPU-DMM主题模型聚类算法的基础上构建一种基于背景主题的B-DMM聚类模型来获取蒙医药文本当中的隐含主题,给未来蒙医药相关研究提供参考。B-DMM模型利用外部知识以及优化生成过程来克服... 为能够更好地了解蒙医药领域研究的热点和前沿,在GPU-DMM主题模型聚类算法的基础上构建一种基于背景主题的B-DMM聚类模型来获取蒙医药文本当中的隐含主题,给未来蒙医药相关研究提供参考。B-DMM模型利用外部知识以及优化生成过程来克服蒙医药短文本数据中存在的单词稀疏性问题。实验中采用主题语义一致性作为模型的评价标准,将结果与LDA、DMM、GPU-DMM、BTM等模型进行对比分析。实验结果表明,B-DMM模型在蒙医药热点主题挖掘方面的表现均优于基线算法,可以为相关研究者提供更有价值的信息。 展开更多
关键词 B-DMM模型 GPU-DMM模型 蒙医药文本
下载PDF
基于贝叶斯算法的蒙古文文本自动校对研究 被引量:4
4
作者 郝莉 敖登巴拉 +1 位作者 巩政 图雅 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2010年第4期440-442,共3页
对蒙古文输入过程中出现的拼写错误进行了分析和归类,给出了用贝叶斯算法校正蒙古文单词拼写错误的实现方法.通过对新闻语料进行纠错验证,在实验条件下,该方法的拼写纠错率可达89%以上.
关键词 蒙古文 文本校对 贝叶斯算法
下载PDF
基于N-Gram模型的蒙古语文本语种识别算法的研究 被引量:3
5
作者 马志强 张泽广 +3 位作者 闫瑞 刘利民 冯永祥 苏依拉 《中文信息学报》 CSCD 北大核心 2016年第1期133-139,共7页
互联网上蒙古语文本正在不断地增加,如何让网络中的蒙古语内容为搜索引擎和舆情分析等应用提供服务引起了社会的高度关注。首先要解决如何采集网络中蒙古语文本数据,核心是准确识别网络中蒙古语文本的问题。该文提出了基于N-Gram模型的... 互联网上蒙古语文本正在不断地增加,如何让网络中的蒙古语内容为搜索引擎和舆情分析等应用提供服务引起了社会的高度关注。首先要解决如何采集网络中蒙古语文本数据,核心是准确识别网络中蒙古语文本的问题。该文提出了基于N-Gram模型的平均距离识别算法,建立了一个能够对目标语种识别的实验平台。实验结果表明,识别算法能够很好地从中文、英文、蒙古文以及混合语言文本中识别出蒙古语文本,准确率达到99.5%以上。 展开更多
关键词 语种识别 N-GRAM模型 平均距离识别算法 蒙古语文本
下载PDF
《三字经》满、蒙文本及仿制本述论 被引量:4
6
作者 肖朗 王鸣 《浙江大学学报(人文社会科学版)》 CSSCI 2008年第1期156-166,共11页
《三字经》历来被公认为中国古代流传最广、影响最大的幼学启蒙教材之一。清朝建立后,《三字经》满、蒙文本相继问世,对满、蒙民族居住地区教育的发展以及满、蒙民族的文化与汉民族文化的交流起到了很大的促进作用。鸦片战争前后出现了... 《三字经》历来被公认为中国古代流传最广、影响最大的幼学启蒙教材之一。清朝建立后,《三字经》满、蒙文本相继问世,对满、蒙民族居住地区教育的发展以及满、蒙民族的文化与汉民族文化的交流起到了很大的促进作用。鸦片战争前后出现了多种类型的《三字经》仿制本,其中既有外国来华传教士编撰的基督教《三字经》仿制本,又有太平天国刊印的通过宣传基督教来号召推翻清王朝的《三字经》仿制本,还有医学版等专题性质的《三字经》仿制本。此外,日本在江户时代及明治维新后也出现了多种版本的《三字经》仿制本,产生了广泛的影响。因此,《三字经》不但是文化教育史上的重要文献,而且是文化教育交流史上的重要文献。 展开更多
关键词 《三字经》 蒙文本 仿制本 文化教育交流
下载PDF
《清实录》的文献价值与文本解析 被引量:3
7
作者 谢贵安 《河南大学学报(社会科学版)》 CSSCI 北大核心 2013年第4期1-7,共7页
《清实录》汉文本所具有的原始性和特殊性的分析,证明了该书是一部不可多得的历史文献著作,对于研究清代历史、清代历史文献学及史学,都具有不可轻视的史料和文献价值;其满文本和蒙文本,更是研究少数民族历史文献学和史学的重要资料,也... 《清实录》汉文本所具有的原始性和特殊性的分析,证明了该书是一部不可多得的历史文献著作,对于研究清代历史、清代历史文献学及史学,都具有不可轻视的史料和文献价值;其满文本和蒙文本,更是研究少数民族历史文献学和史学的重要资料,也是用以考证汉文本实录和清代历史事实的独特依据。《清实录》具有重要的历史文献价值,受到了当代学者的重视,摘录、改编和应用其史料的学术活动方兴未艾。 展开更多
关键词 《清实录》 历史文献 满文本 蒙文本
下载PDF
基于词汇的蒙古语文语转换的实验 被引量:2
8
作者 高光来 孟和吉雅 姗丹 《内蒙古大学学报(自然科学版)》 CAS CSCD 2000年第1期121-124,共4页
蒙古语是一种很有影响的语言, 较中文和西文有许多独特的方面.本文介绍了一个基于词汇的蒙古语文语转换系统的设计与实现.
关键词 语音合成 文语转换 蒙古语 词汇 计算机语音处理
下载PDF
莫高窟北区出土回鹘蒙古文卖身契约残片 被引量:1
9
作者 敖特根 《敦煌研究》 CSSCI 北大核心 2010年第1期111-116,共6页
编号B127:11文书出自莫高窟北区第127窟。文书残宽12.1厘米,残高14.0厘米,残存墨书草体文字8行,内容为一件卖身契约末尾处的证明部分。这是目前所发现的唯一一件蒙古文买卖人口文书。其书写年代有可能为14世纪中后期,至于其性质,应为&qu... 编号B127:11文书出自莫高窟北区第127窟。文书残宽12.1厘米,残高14.0厘米,残存墨书草体文字8行,内容为一件卖身契约末尾处的证明部分。这是目前所发现的唯一一件蒙古文买卖人口文书。其书写年代有可能为14世纪中后期,至于其性质,应为"私契"。 展开更多
关键词 莫高窟 北区 蒙古文 卖身契 写本
下载PDF
《满蒙汉三文合璧教科书》的翻译颁行(上) 被引量:3
10
作者 李勤璞 《满语研究》 2014年第1期34-42,共9页
清末,荣德以蒋维乔、庄俞合编《最新初等小学文教科书》为原本,翻译《满蒙汉三文合璧教科书》,由东三省蒙务局颁行于奉天省所属哲里木盟十旗、奉天八旗官学及吉林、黑龙江两省的满蒙文学堂。此举实为废科举、兴学堂,推进蒙古地区教育的... 清末,荣德以蒋维乔、庄俞合编《最新初等小学文教科书》为原本,翻译《满蒙汉三文合璧教科书》,由东三省蒙务局颁行于奉天省所属哲里木盟十旗、奉天八旗官学及吉林、黑龙江两省的满蒙文学堂。此举实为废科举、兴学堂,推进蒙古地区教育的良策。 展开更多
关键词 三文合璧教科书 哲里木盟 东北三省 满文古籍
下载PDF
透过文本看蒙古化的藏语诵经音乐 被引量:1
11
作者 楚高娃 《民族艺术研究》 CSSCI 2016年第5期52-59,共8页
蒙古佛教音乐除了口头传承以外也有丰富的经书文本和音乐理论文本。本文笔者通过三种文本;乐谱文本——央移谱,理论文本——《乐论》与《蒙古佛教音乐之起源》,历史文本——清朝《奏案》《雍和宫志略》等文本资料进行深入分析的基础上阐... 蒙古佛教音乐除了口头传承以外也有丰富的经书文本和音乐理论文本。本文笔者通过三种文本;乐谱文本——央移谱,理论文本——《乐论》与《蒙古佛教音乐之起源》,历史文本——清朝《奏案》《雍和宫志略》等文本资料进行深入分析的基础上阐释:蒙古佛教寺院为什么多用藏语来诵唱经文?蒙古佛教藏语诵经音乐的蒙古化特征的具体表现,以及与藏区佛教寺院诵经音乐的不同特点。 展开更多
关键词 蒙古佛教 文本 藏语诵经音乐 蒙古化
下载PDF
试论蒙古族史诗的文学禳灾功能 被引量:1
12
作者 王艳凤 阿婧斯 《内蒙古师范大学学报(哲学社会科学版)》 2013年第6期58-61,共4页
蒙古族史诗的禳灾功能是其多元价值中的一个重要组成。蒙古族史诗的文本就可以概括为对一个民族消除灾祸的诗意表达,包括英雄不败的母题,以及大量的祝赞词都对现实生活具有鲜明的禳灾意义。而讲唱史诗的过程则完成了一个禳灾仪式,但为... 蒙古族史诗的禳灾功能是其多元价值中的一个重要组成。蒙古族史诗的文本就可以概括为对一个民族消除灾祸的诗意表达,包括英雄不败的母题,以及大量的祝赞词都对现实生活具有鲜明的禳灾意义。而讲唱史诗的过程则完成了一个禳灾仪式,但为了保持史诗消灾的神力也在讲唱过程中伴随着诸多的禁忌。 展开更多
关键词 蒙古族史诗 禳灾 文本 讲唱
下载PDF
蒙古文复杂文本布局引擎的标准符合性测试 被引量:1
13
作者 呼斯勒 白双成 确精扎布 《广西科学院学报》 2018年第1期63-67,共5页
以蒙古文编码国家标准的研制及其系统实现方面的工作为基础,针对蒙古文复杂文本布局引擎(CTL Engine)及其OpenType字库的系统结构,提出蒙古文复杂文本布局引擎的标准符合性测试(Conformance Test for Standards)方案,定义蒙古文复杂文... 以蒙古文编码国家标准的研制及其系统实现方面的工作为基础,针对蒙古文复杂文本布局引擎(CTL Engine)及其OpenType字库的系统结构,提出蒙古文复杂文本布局引擎的标准符合性测试(Conformance Test for Standards)方案,定义蒙古文复杂文本布局引擎的测试点及其测试实例,并以关键软件系统为依托测试和分析Uniscribe和HarfBuzz等支持蒙古文的复杂文本布局引擎。 展开更多
关键词 蒙古文编码 复杂文本布局引擎 标准符合性测试 国家标准
下载PDF
蒙古语传媒语言文本语料库的构建 被引量:2
14
作者 包敏娜 《内蒙古师范大学学报(哲学社会科学版)》 2016年第4期70-74,共5页
传媒语言语料库是一项重要的语言资源和必要的现代化研究手段。目前,我们初步建立了一个以汉蒙影视剧语料库(80万字/词)和蒙古语新闻语料库(95万字)为主的蒙古语传媒语言文本语料库。本文主要介绍了该语料库的构建工作,包括总体规划、... 传媒语言语料库是一项重要的语言资源和必要的现代化研究手段。目前,我们初步建立了一个以汉蒙影视剧语料库(80万字/词)和蒙古语新闻语料库(95万字)为主的蒙古语传媒语言文本语料库。本文主要介绍了该语料库的构建工作,包括总体规划、语料采集、加工标注、词典建设以及软件开发等。该工作的开展和深入将促进蒙古语传媒语言语料库的开发和利用,从而推动相关理论研究和应用技术的不断发展。 展开更多
关键词 蒙古语 传媒语言 文本 语料库
下载PDF
从蒙汉文化交流互动看元代蒙古族散曲文本意义 被引量:1
15
作者 康勇 《北方民族大学学报(哲学社会科学版)》 CSSCI 2012年第3期96-101,共6页
元散曲产生和发展于多元文化背景之下。蒙古族散曲文本的意义有待于以蒙汉文化交流互动的视角来阐释,并以此为视角,探讨了辞官归隐、拟古怀古和闺情怨别及其他主题的蒙古族散曲文本的文化涵义和文化交流意义。
关键词 蒙古族散曲 蒙汉文化交流互动 文本意义
下载PDF
蒙古语语言-文字的自动化处理 被引量:6
16
作者 伊.达瓦 张玉洁 +4 位作者 上园一知 大川茂树 章森 井佐原均 白井克彦 《中文信息学报》 CSCD 北大核心 2006年第4期56-62,93,共8页
本文首先叙述了蒙文电子化的意义以及蒙文电子化数据的现状。然后重点讨论了在不同地区和国家使用的蒙文书面语以及口语的不同和蒙文在计算机处理时所面临的问题。最后,介绍了我们在日本建设的针对蒙古语语言信息处理的两种语言资源:蒙... 本文首先叙述了蒙文电子化的意义以及蒙文电子化数据的现状。然后重点讨论了在不同地区和国家使用的蒙文书面语以及口语的不同和蒙文在计算机处理时所面临的问题。最后,介绍了我们在日本建设的针对蒙古语语言信息处理的两种语言资源:蒙古语多方言口语语料库和蒙文多文种-多语言并行语法标注电子词典,后者得到了2005年中日蒙韩国际合作课题“蒙文自然语言处理技术的研究”的资助。 展开更多
关键词 计算机应用 中文信息处理 蒙文语言文字信息处理 文本-口语语料库 多文种-多语言电子词典
下载PDF
MonTTS:完全非自回归的实时、高保真蒙古语语音合成模型 被引量:5
17
作者 刘瑞 康世胤 +2 位作者 高光来 李劲东 飞龙 《中文信息学报》 CSCD 北大核心 2022年第7期86-97,共12页
针对现有基于Tacotron模型的蒙古语语音合成系统存在的两个问题:①合成效率较低;②合成语音保真度较低,该文基于FastSpeech2模型提出了完全非自回归的实时、高保真蒙古语语音合成模型MonTTS。为了提高MonTTS模型合成蒙古语语音的韵律自... 针对现有基于Tacotron模型的蒙古语语音合成系统存在的两个问题:①合成效率较低;②合成语音保真度较低,该文基于FastSpeech2模型提出了完全非自回归的实时、高保真蒙古语语音合成模型MonTTS。为了提高MonTTS模型合成蒙古语语音的韵律自然度/保真度,根据蒙古语声学特点提出以下三点创新改进:①使用蒙古文音素序列来表征蒙古文发音信息;②提出音素级的声学调节器以学习长时韵律变化;③提出基于蒙古语语音识别和自回归语音合成两种时长对齐方法。同时,该文构建了一个当前最大规模的蒙古语语音合成数据库:MonSpeech。实验结果表明,MonTTS在韵律自然度方面的主观平均意见分数(Mean Opinion Score,MOS)达到4.53,显著优于当前最优的基于Tacotron的蒙古语语音合成基线系统和基线FastSpeech2模型;MonTTS合成实时率达3.63×10^(-3),满足实时高保真合成要求。最后,文中涉及的训练脚本和预训练模型全部开源(https://github.com/ttslr/MonTTS)。 展开更多
关键词 蒙古语语音合成 非自回归声学建模 非自回归神经声码器 实时 高保真
下载PDF
蒙古语文语转换系统的研究与实现 被引量:1
18
作者 何敏 高光来 赵斯琴 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2004年第1期100-104,共5页
介绍了一个基于PSOLA合成技术的蒙古语文语转换系统.系统针对蒙古语自身的特点,采用了语音合成领域比较成熟的波形编辑合成技术.也建立了实用的蒙古语语音合成音库,音库基元都进行了基音标记,在韵律修改中也做了尝试.
关键词 蒙古语 文语转换 音库 TTS PSOLA
下载PDF
田野视野下的演述型说书艺人及其演述文本特征研究
19
作者 斯钦巴图 《满语研究》 2017年第1期104-111,共8页
学界以往对蒙古族说书艺人的研究,多以说唱型艺人为对象,而忽略了演述型艺人及其表演文本。从田野的角度审视蒙古族说书艺人中的演述型艺人,探讨其在蒙古族说书传统中的地位、作用,以及其民间称号的文化含义,与说唱型艺人的区别,演述文... 学界以往对蒙古族说书艺人的研究,多以说唱型艺人为对象,而忽略了演述型艺人及其表演文本。从田野的角度审视蒙古族说书艺人中的演述型艺人,探讨其在蒙古族说书传统中的地位、作用,以及其民间称号的文化含义,与说唱型艺人的区别,演述文本的体裁归属和语言特点等问题,可发现演述型艺人的存在,使说唱型艺人研究有了参照对象,因而对于说书艺人以及蒙古族说书传统研究有重要意义和价值。 展开更多
关键词 蒙古族 说书艺人 演述文本
下载PDF
主动支持向量机的研究及其在蒙文文本分类中的应用 被引量:2
20
作者 贺慧 王俊义 《内蒙古大学学报(自然科学版)》 CAS CSCD 北大核心 2006年第5期560-563,共4页
介绍了一种用支持向量机(SVM)进行主动学习的方法,解决在某些机器学习问题中,训练样本获取代价过大带来的问题.与普通的SVM方法相比,该方法所需的样本量大大降低,而且可能达到更好的推广能力,在蒙文文本分类中的应用说明了该算法的有效性.
关键词 支持向量机(SVM) 主动学习 蒙文文本分类
下载PDF
上一页 1 2 下一页 到第
使用帮助 返回顶部