词汇化调序模型中融合语言特性的层次短语翻译方法研究被引量：3

A Lexicalized Reordering Model of Integrating with Language Features for Hierarchical Phrase-based Translation

下载PDF

导出

摘要针对越南语语言特性,提出在词汇化调序模型中融合语言差异特性的汉语-越南语的统计机器翻译方法。该方法首先分析汉语与越南语语法不同,提取越南语在定语位置、状语位置及修饰词词语顺序上与汉语的差异,然后形式化定义这些差异规则,以对数线性模型的形式融入进词汇化调序模型中。在训练过程,通过融合语言差异特性的词汇化调序模型对符合特性的规则进行权重调优,从而在解码过程中指导候选翻译的选择。实验结果表明,在词汇化模型里融合语言特性的汉语-越南语的层次短语机器翻译模型比基准系统提高了0.6~2.1个BLUE值。 According to the language characteristics of Vietnamese,this paper proposed a new lexicalized reordering modelwhere language features were integrated for Chinese-Vietnamese statistical machine translation. Firstly,the grammar differences be-tween Chinese and Vietnamese were analyzed,and the sequence differences in attribute,adverbial modifier and adjuncts were ex-tracted. Secondly,the extracted difference rulers were formally defined and be integrated in the lexicalized reordering model via thelog-linear model. In the training processing,the proposed model would optimize the weight for these rules that conform to the lin-guistic features Finally,it would guide the translation selection in the decoding. The experiment had verified that our reorderingmodel achieved a 0.6-2.1 BLEU point improvements for Chinese-to-Vietnamese translation over a baseline hierarchicalphrase-based system.

作者张阳余正涛周珂

机构地区昆明理工大学信息科学与自动化学院昆明理工大学智能信息处理重点实验室

出处《计算机与数字工程》 2017年第12期2389-2392,2427,共5页 Computer & Digital Engineering

关键词统计机器翻译词汇化调序模型汉语越南语语言特性 statistical machine translation lexicalized reordering model chinese vietnamese language features

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献6

1闫丹辉,毕玉德.基于规则的越南语命名实体识别研究[J].中文信息学报,2014,28(5):198-205. 被引量：15
2肖欣延,刘洋,刘群,林守勋.面向层次短语翻译的词汇化调序方法研究[J].中文信息学报,2012,26(1):37-41. 被引量：6
3俞士汶,段慧明,朱学锋,孙斌.北京大学现代汉语语料库基本加工规范[J].中文信息学报,2002,16(5):49-64. 被引量：126
4武氏春蓉.略论汉语对越南语的影响[J].济南大学学报（社会科学版）,2001,11(5):56-57. 被引量：7
5范青钏.汉越状语语序比较分析[J].云南师范大学学报（对外汉语教学与研究版）,2007,5(6):79-85. 被引量：3
6武氏河.越南语与汉语的句法语序比较[J].云南师范大学学报（对外汉语教学与研究版）,2005,3(6):65-68. 被引量：11

二级参考文献35

1俞鸿魁,张华平,刘群,吕学强,施水才.基于层叠隐马尔可夫模型的中文命名实体识别[J].通信学报,2006,27(2):87-94. 被引量：156
2[1]阮有琼.现代越语[Z].河内:越南百科全书出版社,1994.
3[3]阮文修.现代越语词汇[Z].河内:越南大学与中专出版社,1978.
4[4]爱德华·萨丕尔.语言论[M].陆卓元译.北京:商务印书馆,1977.
5David Chiang. A hierarchical phrase-based model for statistical machine translation [C]//Proceedings of the 43rd Annual Meeting of the Association for Computa- tional Linguistics. 2005.. 263-270.
6David Chiang. Hierarchical phrase-based translation [J]. Computational Linguistics. 2007, 33(2) : 201-228.
7Philipp Koehn, Franz Joseph Och, Daniel Marcu. Sta- tistical Phrase-Based Translation [C]//Proeeedings of NAACL 2003. 2003.
8Christoph Tillman. A unigram orientation model for statistical maeh[ne translation [C]//Proeeedings of HLT-NAACL 2004: Short Papers. 2004: 101-104.
9Philipp Koehn, Amittai Axelrod, Alexandra Birch Mayne, et al. Edinburgh System Description for the 2005 IWSLT Speech Translation Evaluation[C]//Pro- ceedings of IWSLT 2005, 2005.
10Philipp Koehn, Hieu Hoang, Alexandra Birch, et al. Moses: Open Source Toolkit for Statistical Machine Translation[C]//Proceeding of ACL 2007, demon- stration session. 2007.

共引文献161

1杨丽姣,肖航,刘智颖.《信息处理用现代汉语词类标记规范》修订研究[J].语言文字应用,2021(3):111-120. 被引量：1
2吴先,胡俊峰.基于历时语料库的在线词典编纂系统设计[J].中文信息学报,2020(5):27-35. 被引量：1
3程勇,徐德宽,董军.基于多元语言特征与深度特征融合的中文文本阅读难度自动分级研究[J].中文信息学报,2020(4):101-110. 被引量：10
4谭晓平.现代汉语文本语料库建设及应用现状研究[J].对外汉语研究,2018,0(1):20-29.
5姚露露,李云岭,宋凯丽.中文地名地址标注方法研究[J].测绘地理信息,2021,46(S01):182-184. 被引量：1
6化振红.建立中古汉语语料库分词规范的若干问题[J].语言研究集刊,2021(2):151-167. 被引量：2
7刘亮.现代汉语广义助词知识库构建与应用[J].光盘技术,2008(4):14-16. 被引量：2
8杨芸,周昌乐,王雪梅,戴帅湘.基于机器理解的汉语隐喻分类研究初步[J].中文信息学报,2004,18(4):31-36. 被引量：15
9高定国,索郎桑姆.大型藏语平衡语料库建设中样本类别号的研究[J].西藏大学学报（社会科学版）,2013,28(4):54-58. 被引量：1
10朱学锋,张化瑞,段慧明,俞士汶.《汉语高频词语法信息词典》的研制[J].语言文字应用,2004(3):98-104. 被引量：2

同被引文献40

1戴新宇,尹存燕,陈家骏,郑国梁.机器翻译研究现状与展望[J].计算机科学,2004,31(11):176-179. 被引量：28
2董人菘,王华,张晓钟,余正涛,张涛.依存句法语言模型对短语统计机器翻译性能的影响[J].计算机科学,2014,41(2):99-101. 被引量：4
3余正红,伍永豪,邓娟,王俊.基于Hadoop与XMPP的云翻译系统的研究与实现[J].计算机与数字工程,2014,42(2):239-242. 被引量：2
4刘智颖,郭艳波,晋耀红.汉英机器翻译中格式转换研究[J].计算机工程与应用,2014,50(6):192-196. 被引量：2
5任众,侯宏旭,武静,王洪彬,李金廷,樊文婷,申志鹏.基于统计和神经网络的蒙汉机器翻译研究[J].中文信息学报,2018,32(11):1-7. 被引量：6
6何彦青,刘建辉,屈鹏,李颖,徐红姣.基于机器翻译的专利术语翻译获取方法研究[J].图书情报工作,2014,58(19):25-30. 被引量：3
7艾孜孜.吐尔逊,杨雅婷,吐尔洪.吾司曼,周俊林,李晓.维-汉统计机器翻译中维吾尔语预处理研究[J].计算机工程与设计,2014,35(11):4034-4039. 被引量：3
8赵博,黄书剑,戴新宇,袁春风,黄宜华.基于分布内存的层次短语机器翻译并行化算法[J].计算机研究与发展,2014,51(12):2724-2732. 被引量：3
9孙水华,丁鹏,黄德根.利用句法短语改善统计机器翻译性能[J].中文信息学报,2015,29(2):95-102. 被引量：5
10蒋锐滢,崔磊,何晶,周明,潘志庚.基于主题模型和统计机器翻译方法的中文格律诗自动生成[J].计算机学报,2015,38(12):2426-2436. 被引量：16

引证文献3

1姚兰.基于改进短语翻译模型的计算机智能化校对系统研究[J].电子设计工程,2020,28(18):52-55. 被引量：10
2董斌.基于改进编码/解码模型的中英机器翻译方法[J].计算机与数字工程,2021,49(6):1253-1257. 被引量：5
3李宁.弱化语法规则下英文机器翻译准确度对比测试[J].信息技术,2021,45(11):31-37.

二级引证文献15

1刘艳茹.智能化计算机网络监控系统设计[J].技术与教育,2020,34(3):24-26.
2王小迁.基于计算机智能的英语译文语境化自动校准系统[J].微型电脑应用,2021,37(11):158-160. 被引量：2
3赵石楠,杜文.基于改进短语翻译模型的外语数据库智能校对系统[J].自动化与仪器仪表,2022(2):90-93. 被引量：5
4王惠.基于短语译文组合的智能化自动翻译设计研究[J].自动化与仪器仪表,2022(2):163-166. 被引量：1
5李静.基于人工智能技术的计算机辅助翻译软件设计[J].信息技术与信息化,2022(3):70-73. 被引量：5
6刘渝.融合语言特征和神经网络的英语机器翻译研究[J].自动化与仪器仪表,2022(5):142-145. 被引量：3
7付敏.基于特征提取的英汉机器自动转换翻译系统设计[J].自动化与仪器仪表,2022(5):166-169. 被引量：1
8梁栋.基于互联网数据的公共英语自动翻译系统设计[J].信息技术,2022,46(6):139-144.
9杨冰.基于深度学习的英语短语译文智能校对系统[J].自动化与仪器仪表,2022(8):185-188. 被引量：1
10杨雪晴.基于语音识别的英语翻译器设计[J].自动化与仪器仪表,2022(8):221-225. 被引量：4

1周珂,余正涛,高盛祥.融合主题的汉越冶金领域统计机器翻译方法[J].计算机工程,2017,43(12):179-183. 被引量：2
2李桦.基于Android的国外旅游翻译小助手软件设计[J].自动化与仪器仪表,2017,0(11):1-4. 被引量：1
3王璞.看经典动画学地道英语[J].小学生必读（高年级版）,2017,0(10):36-37.
4郑丹青.日语形容词移动研究述评[J].长春理工大学学报（高教版）,2011(9):83-84.
5林燕.陈寅恪的语言思想研究[J].西南交通大学学报（社会科学版）,2016,17(5):55-62. 被引量：1
6王强,杜权,肖桐,朱靖波.基于Transfer和Triangulation融合的中介语统计机器翻译方法[J].中文信息学报,2017,31(4):36-43. 被引量：3
7金婷.“一时”和“暂时”[J].汉语应用语言学研究,2016(1):186-197.
8刘梦眙,姚亮,洪宇,刘昊,姚建民.译文语序的领域性思考:一种融合主题信息的领域自适应调序模型[J].中文信息学报,2017,31(5):50-58.
9意大利街头壁画反映环境污染[J].公共艺术,2017,0(5):106-106.
10景霞,周传敬.从《化学文摘》对摘要的修改看英文摘要撰写的常见问题[J].编辑学报,2001,13(z1):41-42. 被引量：10

计算机与数字工程

2017年第12期

浏览历史

内容加载中请稍等...

词汇化调序模型中融合语言特性的层次短语翻译方法研究被引量：3

参考文献6

二级参考文献35

共引文献161

同被引文献40

引证文献3

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

词汇化调序模型中融合语言特性的层次短语翻译方法研究 被引量：3

参考文献6

二级参考文献35

共引文献161

同被引文献40

引证文献3

二级引证文献15

相关作者

相关机构

相关主题

浏览历史

词汇化调序模型中融合语言特性的层次短语翻译方法研究被引量：3