维汉机器翻译用电子词典的设计被引量：3

Design of a Dictionary for Uighur-Chinese Machine Translation System

下载PDF

导出

摘要电子词典是在机器翻译系统中包含的信息量最大的一个部件,电子词典包的质量和容量直接限定机器翻译的质量和应用范围。与一般的电子词典不同,机器翻译词典每个词条都要比一般的电子词典增加词类信息、语义类别信息和成语等。文章以频率统计和频率分布统计作为维汉机器翻译词典的词条收录原则,统计维吾尔文中常用的单词数目,论述维汉机器翻译词典的设计思想,用BNF形式语言和Jackson图描述维汉机器翻译词典应包含的词条信息,最后介绍词典的具体构造方法、词条排序原则、索引表和属性库的数据结构和词典信息的查找方法。试验表明该词典在解决维吾尔语词汇歧义、结构歧义、提高汉语译文准确率等方面较为有效。 Electronic Dictionary is the largest component of a Machine Translation system in the terms of the information it holds.The quality and size of the electronic dictionary limits the scope and coverage of a Machine Translation system.What makes the MT dictionary different from the generic dictionary is that each word contained in MT dictionary should have corresponding information for part of speech,semantics and idioms in which this word occurs.This paper statistics the number of commonly used Uighur words using word frequency statistics and frequency distribution statistics,discusses the design principal,describes the structure of the word information contained in the MT dictionary using BNF formation and Jackson chart,finally introduces construction and data structure,word sorting method,structure of index table and attribute library and search method of an electronic dictionary for Uighur-Chinese MT system.Experimental evidence indicates that this lexicon has obvious efficiency in lexical disambiguation,syntactical disambiguation,and improvement of accuracy of target language translation.

作者阿里甫.库尔班阿布力米提.阿不都热依木吐尔根.依布拉音

机构地区新疆大学信息科学与工程学院

出处《计算机工程与应用》 CSCD 北大核心 2006年第20期76-78,共3页 Computer Engineering and Applications

基金国家自然科学基金资助项目(编号:60263004)

关键词维吾尔文汉文机器翻译电子词典 Uighur,Chinese,machine translation,dictionary

分类号 TP391.2 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献5

1李生,赵铁军.机器词典的信息表示及在汉英机器翻译中的实现[J].中文信息学报,1994,8(1):45-55. 被引量：3
2雍殿书,胡海文,陈家骏,王启祥.日汉机器翻译系统中的词典讨论[J].中文信息学报,1998,12(3):15-20. 被引量：4
3江红,吴立德,沙新时.机器翻译系统中概念词典的设计与实现[J].计算机研究与发展,1995,32(3):13-18. 被引量：4
4刘志杰,刘倬.英汉机器翻译系统中基本词典与专业词典的关系[J].语言文字应用,1997(3):107-110. 被引量：1
5任桢.电子词典的设计研究[J].计算机与数字工程,2003,31(1):62-64. 被引量：3

二级参考文献13

1周斌,吴立德,沙新时.中心词驱动的汉语语义解释器[J].计算机学报,1994,17(9):708-712. 被引量：1
2孙宏林，1991年
3鲁川，汉语研究与探索.5，1991年
4周行健，实用汉语用法词典，1990年
5章振邦，新编英语语法教程，1983年
6朱德熙，语法讲义，1982年
7吕淑湘，现代汉语八百词，1980年
8江红，1991年
9李卫华，人工智能引论，1986年
10雍殿书，中文信息学报，1994年，8卷，1期

共引文献10

1LI Li.A Study on Improving Word-Segmentation Accuracy in Automatic Chinese Text Processing[J].Journal of Shanghai University(English Edition),2001,5(z1):225-228.
2刘军万,刘飞飞.基于关系图的篇章分析方法及算法设计[J].中南林学院学报,2004,24(5):93-97.
3赵铁军,高文,李生.机器翻译通用电子词典的实现构想[J].情报科学,1993,14(6):52-57.
4吐尔根.伊布拉音,阿不里米提.阿不都热依木.维汉机器翻译词典的结构设计与实现(英文)[J].新疆大学学报（自然科学版）,2005,22(3):258-262. 被引量：4
5MA Weiyin.Effective Analysis of Chinese Word-Segmentation Accuracy[J].现代电子技术,2007,30(4):108-110.
6韦雄观,吴立德,王文欣.基于关系图的篇章分析方法[J].模式识别与人工智能,1997,10(2):112-117. 被引量：5
7刘小虎,李生,赵铁军.词典的模糊查询和单词的快速录入[J].哈尔滨工业大学学报,1997,29(5):28-31. 被引量：1
8黄萱菁,吴立德,叶丹瑾.基于超文本的概念词典管理系统[J].计算机应用与软件,1998,15(4):1-7.
9牟莉莉,王曙光.基于VB的C++双语课程专业电子词典的设计与开发[J].考试周刊,2014(18):115-116. 被引量：1
10王斯日古楞,敖其尔,斯琴图.英—蒙机器翻译系统中机器词典的建立[J].内蒙古大学学报（自然科学版）,2002,33(5):580-582. 被引量：2

同被引文献61

1陈海艳.新中国成立以来的维吾尔语研究概述[J].民族翻译,2021(1):88-96. 被引量：1
2肖桐,朱靖波.《机器翻译:基础与模型》[J].中文信息学报,2021,35(12):167-167. 被引量：1
3维尼拉.木沙江,木合塔尔.日——维机器翻译中粘着性特点的应用[J].新疆大学学报（社会科学版）,2005,33(1):129-134. 被引量：3
4周明,黄昌宁.面向语料库标注的汉语依存体系的探讨[J].中文信息学报,1994,8(3):35-52. 被引量：39
5淑琴,那顺乌日图.面向EBMT系统的汉蒙双语语料库的构建[J].内蒙古社会科学,2006,27(1):140-144. 被引量：5
6吐尔根.伊布拉音,阿不里米提.阿不都热依木.维汉机器翻译词典的结构设计与实现(英文)[J].新疆大学学报（自然科学版）,2005,22(3):258-262. 被引量：4
7维尼拉.木沙江,米尔夏提.力提甫,木合塔尔.日-维机器翻译系统中词典的研究[J].新疆大学学报（哲学社会科学版）,2006,34(1):149-153. 被引量：1
8许亚梅,张立臣.基于实例的机器翻译方法及其优化策略探讨[J].福建电脑,2006(5):48-49. 被引量：1
9木仕华.纳西东巴象形文字辞典说略[R].北京:中国社科院民族研究所,1994:117-121.
10SUMITA E, IIDA H. Experiments and prospects of example-based machine translation[C]//Proceed of the sACL'29. Morristown, New Jersey : Association for Computational Linguistics, 1991.

引证文献3

1赵芳婷,余正涛,线岩团,郭剑毅,毛存礼,候波.纳-汉双语语料库构建及双语语料对齐[J].广西师范大学学报（自然科学版）,2009,27(1):161-164. 被引量：2
2赛依旦.阿不力米提,买合木提.买买提,艾山.吾买尔,吐尔根.依布拉音.基于WCF的维汉机器翻译系统的设计与实现[J].新疆大学学报（自然科学版）,2012,29(4):466-470. 被引量：1
3哈里旦木·阿布都克里木,侯钰涛,姚登峰,阿布都克力木·阿布力孜,陈吉尚.维吾尔语机器翻译研究综述[J].计算机工程,2024,50(1):1-16.

二级引证文献3

1张睿.基于短语相似度的统计机器翻译系统设计[J].自动化与仪器仪表,2017(8):66-67. 被引量：6
2黄水清,王东波.国内语料库研究综述[J].信息资源管理学报,2021,11(3):4-17. 被引量：37
3常宝宝,詹卫东,张华瑞.面向汉英机器翻译的双语语料库的建设及其管理[J].术语标准化与信息技术,2003(1):28-31. 被引量：19

1冯韵.浅析搜索引擎排序原则[J].技术与市场,2010,17(12):3-3.
2吐尔根.伊布拉音,阿不里米提.阿不都热依木.维汉机器翻译词典的结构设计与实现(英文)[J].新疆大学学报（自然科学版）,2005,22(3):258-262. 被引量：4
3刘章,陈小平.联合无监督词聚类的递归神经网络语言模型[J].计算机系统应用,2014,23(5):101-106. 被引量：1
4蔡东华,张素芬,肖志成.探究嵌入式软件测试技术[J].数字技术与应用,2015,33(10):228-228.
5李艳娇,杨尔弘.树库中的歧义组合考察[J].中文信息学报,2012,26(2):23-27. 被引量：1
6任胜兵,陈松乔,喻寿益.基于事件序列的用例描述形式化及分析[J].计算机工程与应用,2004,40(23):12-14. 被引量：5
7詹志建,梁丽娜,杨小平.基于百度百科的词语相似度计算[J].计算机科学,2013,40(6):199-202. 被引量：20
8王梅,鄢珞青,雷霆.长江资源数据库信息处理的设计思路[J].现代情报,2001,21(2):79-80. 被引量：3
9王罡.一种基于单词分类和字间距统计的文本数字水印算法[J].科协论坛（下半月）,2007(9):21-22. 被引量：1
10黄立新.工程等值曲线的绘制方法探讨[J].石油工业计算机应用,1998,6(2):46-49.

计算机工程与应用

2006年第20期

浏览历史

内容加载中请稍等...

维汉机器翻译用电子词典的设计被引量：3

参考文献5

二级参考文献13

共引文献10

同被引文献61

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

维汉机器翻译用电子词典的设计 被引量：3

参考文献5

二级参考文献13

共引文献10

同被引文献61

引证文献3

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

维汉机器翻译用电子词典的设计被引量：3