-
题名基于汉语二元同现的统计词义消歧方法研究
被引量:4
- 1
-
-
作者
荀恩东
李生
赵铁军
-
机构
哈尔滨工业大学计算机系
-
出处
《高技术通讯》
EI
CAS
CSCD
1998年第10期21-25,共5页
-
基金
863计划资助项目
国家自然科学基金
-
文摘
采用《汉语同义词词林》和英汉双语语料库,通过“双语对齐”扩充了英汉词典的单词译文;对大规模汉语语料库以B+树算法为骨架统计了汉语词组二元同现频次。在英汉机器翻译中,针对翻译的英语句子应用汉语词组二元同现的统计结果形成词义消歧矩阵,再针对消歧矩阵提出了一种贪心的选择算法,以此完成译文选择。
-
关键词
词义消歧
机器翻译
二元同现
汉语词组
-
Keywords
Work Sense Disambiguation(WSD), Machine translation, Bigram
-
分类号
TP391.2
[自动化与计算机技术—计算机应用技术]
-
-
题名基于词二元接续的中文文本自动查错研究
被引量:3
- 2
-
-
作者
王虹
张仰森
-
机构
贵州大学计算中心
山西大学计算机科学系
-
出处
《贵州大学学报(自然科学版)》
2001年第1期16-21,共6页
-
文摘
运用语料库语言学统计方法对中文文本自动查错的有关问题进行探讨 ,运用词二元接续关系进行查错 ,主要依据词二元同现概率、互信息、t -测试差 .其中 ,t-测试差是首次被应用于查错 .
-
关键词
中文文本自动查错
二元接续关系
互信息
t-测试差
MARKOV模型
二元同现概率
-
Keywords
Chinese text automatic checking, neighborship, mutual information, the difference of t-test, Markov model
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-