一类基于平行语料统计的汉法机译解决方案被引量：1

A Novel Solution to Chinese-French Machine Translation Based on Aligned Corpus

下载PDF

导出

摘要针对目前国内外汉法机器翻译系统较少,且研究的汉语语例基本为简单短句的情况,利用《人民日报》中、法文网络版的部分文章建立了一个小型的汉法平行语料库,并基于此,利用改进的Yamada算法构建了一个汉法机器翻译系统。系统通过对汉法平行语料的统计结果,把汉语句型大致归为单谓和多谓两大类,并提炼出4096个汉法对齐基本句型,将之应用于汉法机译中;并首次提出了三词序列出现概率的概念,用于解决词语搭配的问题。试验表明系统在处理多谓语的汉语长句上有明显的优势。 The study puts forward a corpus-based statistical solution to the rare Chinese-French machine transhtion system, with which by now can only deal short sentence. A Chinese-French machine translation system, then, is established by applying 4096 aligned Chinese-French basic sentence types obtained within the aligned Chinese-French corpus. For the first time, 3-word-sequence appearing probability, a new concept by which the difficulty of collocation may be untied, is introduced also. Finally, a test provides evidence of the conclusion that the system given in this article does have advantage in translating Chinese multi-predicate, and long customarily, sentence into French.

作者刘粤钳姚红玉

机构地区中国传媒大学应用语言学系安徽师范大学教育科学学院

出处《计算机技术与发展》 2008年第4期114-117,共4页 Computer Technology and Development

关键词三词序列出现概率汉法对齐基本句型多谓句语料库 3-word-sequence appearing probability aligned Chinese-French basic sentence type multi-predicate sentence corpus

分类号 TP391.2 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1祁依虹,茅于杭.汉法机器翻译的难点分析[J].计算机工程,2002,28(9):235-237. 被引量：3
2祁依虹,董清富,茅于杭.汉法机器翻译系统初探[J].计算机工程与应用,2002,38(18):114-116. 被引量：1
3孙良明.汉语单复句划分标准评析[J].山东师范大学学报（人文社会科学版）,2000,45(1):88-92. 被引量：16
4Yamada K, Knight K. A syntax - based statistical translation model[C]//In: Proceedings of the 39th Annual Meeting of the ACL. [s.l.]:[s.n. ],2001:523 ,530.
5Boons J P, Guillet A, Leclere C. La Structure des Phrases Simples en Frane, ais[ M]//Constructions Intransitives. Droz, Geneve: [s.n.],1976.
6Guillet A, Leclere C. La structure des phrases simples en francois[ M]//Constructions transitives locatives. Droz,Geneve:[s.n.],1992.

二级参考文献9

1邢福义.汉语复句与单句的对立和纠结[J].世界汉语教学,1993,7(1):11-19. 被引量：36
2郑杰.英汉机译系统中的难点分析.1999年计算语言学全国联合学术会议论文集[M].北京:清华大学出版社,1999..
3严浩.基于句法语义层次分析的汉英机器翻译系统（硕士学位论文）[M].北京:清华大学,1998..
4张民李生等.CEMT－Ⅲ汉英机器翻译系统的设计与实现.计算机语言学研究与应用[M].北京:北京语言学院出版社,1993.237－242.
5严浩.基于句法语义层次分析的汉英机器翻译系统：硕士学位论文[M].北京:清华大学,1998..
6孙良明.论汉语语法无单句、复句之分[J].香港:语文建设通讯,1997,(9).
7[5]王维贤等．现代汉语复句新解[M]．华东师范大学出版社，1984．
8邢福义.从基本流向综观现代汉语语法研究四十年[J].中国语文,1992,(6).
9陈振尧.新编法语语法[M].外语教学与研究出版社,2000..

共引文献17

1张雪涛,唐爱华.汉语单复句区分问题的理论困惑与解决策略[J].语言教学与研究,2005(4):21-30. 被引量：16
2孙良明.研究汉语单复句划分应当明了的问题[J].语言教学与研究,2007(2):56-63. 被引量：18
3孙良明.谈古注释书表现的联合结构、联合结构项句式相互转换——兼说汉语语法无单句复句之分[J].山东师范大学学报（人文社会科学版）,2009,54(1):26-31. 被引量：2
4李莉亚.论主从句的归属[J].语文学刊（高等教育版）,2009(3):71-73.
5刘云.复句自动分析的目标和意义[J].宁夏大学学报（人文社会科学版）,2009,31(3):40-44. 被引量：2
6赵云涛.现代汉语单复句划界问题探讨[J].阿坝师范高等专科学校学报,2009,26(2):84-85. 被引量：1
7孙良明.历代注释书句法逻辑语义关系分析——兼说汉语语法单复句区分自身存在的“破绽”和建立“并列语法结构”[J].山东师范大学学报（人文社会科学版）,2010,55(1):3-10. 被引量：5
8郭燕妮.试评《再谈〈马氏文通〉无单句、复句之分*》[J].盐城师范学院学报（人文社会科学版）,2011,31(2):101-104.
9张雪涛,张德岁.“句法结构、语义关系分析”献疑[J].宿州学院学报,2011,26(4):45-50. 被引量：1
10荣丽华.汉语单复句基本问题研究概观[J].语文学刊（高等教育版）,2011(5):50-53. 被引量：1

同被引文献48

1王子颖.法律语篇中shall和may的翻译对比研究[J].上海翻译,2013(4):52-57. 被引量：18
2柯飞.翻译中的隐和显[J].外语教学与研究,2005,37(4):303-307. 被引量：276
3张艳,柏冈秀纪.基于长度的扩展方法的汉英句子对齐[J].中文信息学报,2005,19(5):31-36. 被引量：24
4刘鹏远,赵铁军,李生,杨沭昀.利用语义相似度解决双语词汇知识获取的错误累计问题[J].哈尔滨工程大学学报,2006,27(B07):575-579. 被引量：1
5安纪霞,李锡祚,宋冰,曾伟.服务于词典编纂的特定领域专业术语自动抽取[J].计算机与数字工程,2007,35(11):53-56. 被引量：3
6吴晓昱,王安民.平行语料库与汉英词典编纂的对接[J].译林:学术版,2012(2):173.
7英汉双语平行语料库.检索页面[EB/OL]. http://www.luweixmu.com/ec-corpus/query.asp,2015-11-15.
8北京大学中国语言学研究中心.CCL汉英双语语料库[EB/OL]. http://ccl.pku.edu.cn:8080/ccl_corpus/,2015-11-15.
9北外语料库语言学.语料库语言学年表[EB/OL]. http://www.bfsu-corpus.org/content/chronology-corpus-linguistics-yu-liao-ku-yu-yan-xue-nian-biao,2015-11-15.
10《红楼梦》汉英平行语料库[EB/OL]. http://corpus.usx.edu.cn/hongloumeng/,2015-11-15.

引证文献1

1司莉,何依.2000年以来我国多语言语料库研究进展[J].现代情报,2016,36(6):165-170. 被引量：2

二级引证文献2

1葛晓帅,翟红华.平行语料库检索软件SDAU-ParaConc设计与实现[J].软件导刊,2019,18(9):112-115. 被引量：2
2原伟.面向计算机辅助翻译的乌兹别克语-汉语平行语料库构建与应用[J].电脑知识与技术,2019,15(10X):101-103. 被引量：2

1唐泓英,姚天顺,王宝库.关于汉语句型[J].中文信息学报,1993,7(1):1-6. 被引量：1
2祁依虹,董清富,茅于杭.汉法机器翻译系统初探[J].计算机工程与应用,2002,38(18):114-116. 被引量：1
3阮滢瑛.试比较汉法动物词汇的文化内涵[J].科技视界,2015(7):149-149.
4高波.基于语料统计树的专业信息库生成算法[J].常州工学院学报,2009,22(1):15-18.
5陈优阳.汉盲翻译中的分词连写处理算法研究[J].网络安全技术与应用,2014(2):154-154. 被引量：1
6排忧解难 CHIP专家诊室[J].新电脑,2004(9):158-161.
7Mbarki Aymen Ammari Abdelaziz Sghaier Halim Hassen Maaref.Hidden Markov Models for Automatic Speech Recognition[J].Journal of Mechanics Engineering and Automation,2011,1(1):68-73.
8姚天昉,林莉,玉素甫.艾白都拉.基于德语语料库词性标注和统计方法的研究[J].上海交通大学学报,1996,30(6):35-40. 被引量：1
9刘朝涛,李祖枢,杜子学.汉语句型形式化及语义计算[J].西南师范大学学报（自然科学版）,2014,39(1):120-125.
10祁依虹,茅于杭.汉法机器翻译的难点分析[J].计算机工程,2002,28(9):235-237. 被引量：3

计算机技术与发展

2008年第4期

浏览历史

内容加载中请稍等...

一类基于平行语料统计的汉法机译解决方案被引量：1

参考文献6

二级参考文献9

共引文献17

同被引文献48

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一类基于平行语料统计的汉法机译解决方案 被引量：1

参考文献6

二级参考文献9

共引文献17

同被引文献48

引证文献1

二级引证文献2

相关作者

相关机构

相关主题

浏览历史

一类基于平行语料统计的汉法机译解决方案被引量：1