-
题名基于汉语二元同现的统计词义消歧方法研究
被引量:4
- 1
-
-
作者
荀恩东
李生
赵铁军
-
机构
哈尔滨工业大学计算机系
-
出处
《高技术通讯》
EI
CAS
CSCD
1998年第10期21-25,共5页
-
基金
863计划资助项目
国家自然科学基金
-
文摘
采用《汉语同义词词林》和英汉双语语料库,通过“双语对齐”扩充了英汉词典的单词译文;对大规模汉语语料库以B+树算法为骨架统计了汉语词组二元同现频次。在英汉机器翻译中,针对翻译的英语句子应用汉语词组二元同现的统计结果形成词义消歧矩阵,再针对消歧矩阵提出了一种贪心的选择算法,以此完成译文选择。
-
关键词
词义消歧
机器翻译
二元同现
汉语词组
-
Keywords
work sense disambiguation(wsd), machine translation, bigram
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-
-
题名一种基于语料库的词义消歧策略
被引量:4
- 2
-
-
作者
郭池
陈家骏
王启祥
-
机构
南京大学计算机科学与技术系
南京大学计算机软件新技术国家重点实验室
-
出处
《计算机工程与应用》
CSCD
北大核心
2003年第35期33-36,65,共5页
-
基金
国家863高技术研究发展计划项目经费资助(编号:2001AA114102)
-
文摘
词义消歧一直是一个难点,同时,也是很多领域都需解决的一个环节。该文首先介绍了目前基于语料库进行词义消歧方法的研究进展和各自的特点,在此基础上探讨了一种基于实例和基于统计的方法(即基于语料库的两种主流方法)相结合的混合策略,并对其可能性和优越性进行了讨论。
-
关键词
词义消歧
机器翻译
语料库
基于实例
基于统计
混合策略
-
Keywords
Word sense disambiguation(wsd),machine translation(MT ),Corpus,Example -based,Statistical,Combined method
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-