基于规则和统计相结合的西里尔蒙古文到传统蒙古文转换方法被引量：3

Combining of Rules and Statistics for Cyrillic Mongolian to Traditional Mongolian Conversion

下载PDF

导出

摘要西里尔蒙古文与传统蒙古文分别是蒙古国与中国使用的蒙古文,西里尔蒙古文到传统蒙古文的转换工作不仅给两国同胞的交流带来更多的便利,而且对蒙古族的科学、文化和教育发展具有重要意义。本文结合规则与统计模型的优点,研究了西里尔蒙古文到传统蒙古文的转换方法。本文首先采用基于规则的方法对西里尔蒙古文集内词进行转换,其次对集外词的转换采用了基于联合序列模型的方法,并采用N-gram语言模型解决了一个西里尔蒙古文单词对应多个传统蒙古文单词的问题。实验结果表明,该系统单词转换错误率低至4.12%,基本达到了实用要求。 Cyrillic Mongolian and Traditional Mongolian are used in Mongolia and China, respectively. Cyrillic Mongolian to Traditional Mongolian conversion not only will bring more convenience to exchanges between the two countries, but also has great significance for scientific, cultural and educational development of Mongolian. This paper proposes a highly efficient Cyrillic Mongolian to Traditional Mongolian conversion method. It adopts the rule based approach to convert the words in the vocabulary, and the statistical model to convert the out of-vocabulary words. A large part of Cyrillic Mongolian words correspond more than one candidates in Traditional Mongolian, which is solved by the N-gram language model. Experimental results show that the word error rate is as low as 4. 12%, meeting the practical requirement.

作者飞龙高光来王洪伟路敏

机构地区内蒙古大学计算机学院

出处《中文信息学报》 CSCD 北大核心 2017年第3期156-162,共7页 Journal of Chinese Information Processing

基金国家自然科学基金(61563040) 内蒙古自然科学基金(2016D06) 内蒙古大学高层次人才引进科研项目资助

关键词西里尔蒙古文传统蒙古文转换规则联合序列模型 Cyrillic Mongolian Traditional Mongolian conversion rules joint sequence model

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1高红霞,马小蕾.西里尔蒙古文网页向传统蒙古文自动转换系统的文字转换研究[J].内蒙古民族大学学报,2012,18(5):17-18. 被引量：3
2飞龙,高光来,闫学亮,魏宏喜.传统蒙古文与西里尔蒙古文相互转换方法的研究[J].计算机工程与应用,2014,50(23):206-211. 被引量：4

二级参考文献14

1清格尔泰．蒙古语语法[M]．呼和浩特：内蒙古人民出版社，1992．
2中玄致え.モンゴlレ語電子化計画.[2009-01-21].http://texa.human.is.tohoku.ac.jp/-chigenlmd_cnt.J.htm#contents.
3DulaMan.传统蒙古文在线文本数据库的构造法与在文本检索系统中的应用.[2011-01-30].http://www.docin.com/p-44530763.html.
4Li Hao,Sarina B.The study of comparison and conversion about traditional Mongolian and Cyrillic Mongolian[C]//2011 4th International Conference on Intelligent Networks and Intelligent Systems,2011:199-202.
5Zhao Lili,Men Jia,Zhang Congpin,et al.A combination of statistical and rule-based approach for Mongolian lexical analysis[C]//2010 International Conference on Asian Language Processing,Harbin,2010:7-10.
6Bisani M,Ney H.Joint sequence models for grapheme-tophoneme conversion[J].Speech Communication,2008,50(5):434-451.
7Wang D.Out-of-vocabulary spoken term detection[D].[S.l.]:University of Edinburgh,2010:85-110.
8嘎拉桑朋斯格.基立尔蒙古文学习读本[M].呼和浩特:内蒙古教育出版社,2006.
9图门吉日嘎拉.现代蒙古语[M].呼和浩特:内蒙古大学出版社,2009.
10舍·却玛.蒙古文、基里尔文正字法比较研究[M].呼和浩特:内蒙古教育出版社,2010.

共引文献5

1高红霞.西里尔蒙古文网页向传统蒙古文自动转换系统之网页排版格式转换[J].内蒙古民族大学学报（社会科学版）,2013,39(5):113-116. 被引量：1
2飞龙,高光来,闫学亮,魏宏喜.传统蒙古文与西里尔蒙古文相互转换方法的研究[J].计算机工程与应用,2014,50(23):206-211. 被引量：4
3王春荣,王贵荣,霍日查.西里尔蒙古文语料库收集研究[J].语文学刊,2016,36(7):76-78.
4鲍玉来,白淑霞,飞龙,王炜华.汉蒙跨语言检索系统设计与实现[J].情报理论与实践,2017,40(4):128-132. 被引量：5
5温子潇,包飞龙,高光来,王勇和,苏向东.蒙古文信息检索系统的设计与实现[J].中文信息学报,2018,32(7):44-51. 被引量：10

同被引文献16

1廖海生,赵跃龙.基于MD5算法的重复数据删除技术的研究与改进[J].计算机测量与控制,2010,18(3):635-638. 被引量：16
2杨勇,张治中,贾会林.移动网络信令处理平台精准营销分析的研究[J].电视技术,2014,38(7):108-111. 被引量：1
3李铁萌,侯文军,陈冬庆.对移动互联网产品交互设计中控制感的研究[J].北京邮电大学学报（社会科学版）,2014,16(4):7-11. 被引量：12
4飞龙,高光来,闫学亮,魏宏喜.传统蒙古文与西里尔蒙古文相互转换方法的研究[J].计算机工程与应用,2014,50(23):206-211. 被引量：4
5丁亦喆,魏刃佳,刘博,吴振强.移动互联网中一种移动学习方案的设计与原型实现[J].计算机工程与科学,2015,37(2):288-293. 被引量：6
6姬一鸣,李云霞,石磊,东晨,蒙文,王宇帅.基于量子差分相移系统的混合编码设计方案[J].量子电子学报,2015,32(3):321-327. 被引量：1
7索娅,阿拉坦仓.基于蒙古文数字图书馆建设蒙古文文献共享域之探讨[J].大学图书馆学报,2015,33(4):90-92. 被引量：7
8王福,毕强.复杂网络视角下的蒙古文资源共建共享保障体系研究[J].图书情报工作,2015,59(15):56-61. 被引量：9
9包萨仁图雅,达胡白乙拉.蒙古语句法结构分析中句子的自动识别和分类[J].内蒙古民族大学学报（社会科学版）,2015,41(5):102-106. 被引量：1
10崔波,王崴,瞿珏,王超.自适应显示界面的三维交互图像仿真分析[J].计算机仿真,2016,33(12):229-232. 被引量：4

引证文献3

1温子潇,包飞龙,高光来,王勇和,苏向东.蒙古文信息检索系统的设计与实现[J].中文信息学报,2018,32(7):44-51. 被引量：10
2郁涯.移动互联网中蒙文界面设计[J].现代电子技术,2018,41(20):179-181.
3袁菁菁.论传统蒙古文字体的设计方法[J].中国民族博览,2019(1):90-91. 被引量：2

二级引证文献12

1高亭,艾斯卡尔·艾木都拉,阿布都萨拉木·达吾提.改进Harris特征的印刷体图像检索[J].中国图象图形学报,2020,0(2):294-302. 被引量：6
2李进,高静,陈俊杰,王永军.基于条件生成对抗网络的蒙古文字体风格迁移模型[J].中文信息学报,2020,34(4):55-59. 被引量：5
3李麟霞.基于多元混合准则模糊算法的高校教育信息推荐系统设计[J].现代电子技术,2020,43(4):97-99. 被引量：3
4王玉荣,张树钧,林民,宝美荣.基于云架构的蒙古文硕士论文检索系统的设计与实现[J].内蒙古师范大学学报（自然科学汉文版）,2020,49(3):194-200. 被引量：3
5伊克萨尼·普尔凯提,阿布都萨拉木·达吾提,艾斯卡尔·艾木都拉.带后缀印刷体维吾尔文映射关系检索[J].中国图象图形学报,2020,25(4):688-696. 被引量：1
6刘亚静.基于MapReduce的档案信息数据库快速检索系统设计[J].电子设计工程,2020,28(13):45-49. 被引量：5
7乌兰图雅,孟根巴根.呼市地区高校图书馆蒙古文文献资源建设的影响因素分析[J].内蒙古科技与经济,2020(13):160-161. 被引量：1
8马爽.民族文字网络搜索引擎现状研究[J].内蒙古科技与经济,2020(22):153-154.
9王月.基于TRS信息检索的文献资源均衡配置算法设计[J].计算机仿真,2020,37(12):440-444. 被引量：1
10贾晓霞.Lucene的网络资源索引信息动态检索系统设计[J].微型电脑应用,2021,37(1):55-58. 被引量：3

1第15届NOC赛项培训暨包头组委会成立仪式举行[J].中国信息技术教育,2016(24):48-48.
2陈冰,沈琳.从五“通”看论坛丰硕成果[J].新民周刊,2017,0(21):16-17.
3童小光,郭超,康洪晶.短中文分词算法优化研究[J].软件导刊,2017,16(5):42-44.

中文信息学报

2017年第3期

浏览历史

内容加载中请稍等...

基于规则和统计相结合的西里尔蒙古文到传统蒙古文转换方法被引量：3

参考文献2

二级参考文献14

共引文献5

同被引文献16

引证文献3

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于规则和统计相结合的西里尔蒙古文到传统蒙古文转换方法 被引量：3

参考文献2

二级参考文献14

共引文献5

同被引文献16

引证文献3

二级引证文献12

相关作者

相关机构

相关主题

浏览历史

基于规则和统计相结合的西里尔蒙古文到传统蒙古文转换方法被引量：3