机器翻译系统中词类搭配规则的自动获取方法

Automatic Acquisition Method of Part of Speech Collocation Rules in Machine Translation

下载PDF

导出

摘要讨论了词类搭配的特点和形式描述问题·提出了一种机器翻译系统中词类搭配规则的自动获取方法，称为ＣＲＡＭ·该方法利用词类的相关性并引入机器学习技术，构造二叉树形式的分类决策树，能够从带有词类和语义标注的语料中获取用于词类有序消岐的搭配规则，与汉英机译系统（ＣＥＴＲＡＮ）的结合应用表明了此方法的有效性· The part of speech collocation characteristics and formalization problem are discuseeed. An automatic acquisition method of part of speech collocation rules in the machine translation,named as CRAM is presented. In this method,the coherence of the part of speech between words is used and the machine leaning technology is introduced to build the classification decision tree of the binary tree form. By means of this method,the collocation rules which are used to eliminate the part of speech order ambiguity can be acquired from the corpus which contains the part of speech and semantic tag. An application in combination with the machine translation system (CETRAN) showed that this method is effective.

作者孙杰李晶皎张俐姚天顺

机构地区东北大学信息科学与工程学院

出处《东北大学学报（自然科学版）》 EI CAS CSCD 北大核心 1999年第2期140-143,共4页 Journal of Northeastern University(Natural Science)

基金国家自然科学基金

关键词知识获取词类搭配规则机器翻译系统自动获取 knowledge acquisition,machine learning,computational linguistics.

分类号 TP391.2 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献3

1吴立德，大规模中文文本处理，1997年，8页
2姚天顺，自然语言理解.一种让机器懂得人类语言的研究，1995年，233页
3Liu W Z，Machine Learning，1994年，15卷，25页

1卫刚,叶晨洲.数据发掘在服装设计中的应用[J].微型电脑应用,2000,16(3):31-33.
2张磊.堆栈在构造二叉树中的应用[J].微机发展,2002,12(1):43-47.
3侯胜宇,冯锋.一种改进的二叉树型RFID防碰撞算法[J].计算机工程与应用,2013,49(4):129-133. 被引量：6
4汪海锐,李伟.基于关联规则的决策树算法[J].计算机工程,2011,37(9):104-106. 被引量：13
5郭四稳.基于决策树分类器的归纳并行算法[J].计算机与数字工程,2006,34(9):25-26.
6佘正炜,钱松荣.基于神经网络的情感词汇自动获得方法[J].微型电脑应用,2011(11):33-36. 被引量：1
7李逍遥.七残剑获得方法[J].家庭电脑世界,2004(04S):69-69.
8赵素萍.构造二叉树的两个改进算法[J].现代计算机,2006,12(10):99-101. 被引量：2
9倪卫涛.机器人小尖兵——美国CRAM蟑螂型机器人[J].轻兵器,2016,0(11):48-50.
10脆薯条.新闻资讯[J].游戏机实用技术,2010(21):19-19.

东北大学学报（自然科学版）

1999年第2期

浏览历史

内容加载中请稍等...

机器翻译系统中词类搭配规则的自动获取方法

参考文献3

相关作者

相关机构

相关主题

浏览历史