期刊文献+
共找到1篇文章
< 1 >
每页显示 20 50 100
面向机器辅助翻译的汉语语块自动抽取研究 被引量:12
1
作者 姜柄圭 张秦龙 +1 位作者 谌贻荣 常宝宝 《中文信息学报》 CSCD 北大核心 2007年第1期9-16,共8页
本文提出了一种统计和规则相结合的语块抽取方法。本文使用Nagao串频统计算法进行基于词语的串频统计,进一步分别利用统计方法、语块边界过滤规则对2-gram到10-gram语块进行过滤,得到候选语块,取得了令人满意的结果。通过实验发现,在统... 本文提出了一种统计和规则相结合的语块抽取方法。本文使用Nagao串频统计算法进行基于词语的串频统计,进一步分别利用统计方法、语块边界过滤规则对2-gram到10-gram语块进行过滤,得到候选语块,取得了令人满意的结果。通过实验发现,在统计方法中互信息和信息熵相结合的方法较单一的互信息方法好;在语块边界规则过滤方法中语块左右边界规则和停用词对语块抽取的结果有较大影响。实验结果表明统计和过滤规则相结合的方法要优于纯粹的统计方法。应用本文方法,再辅以人工校对,可以方便地获取重复出现的多词语块。在机器辅助翻译系统中,使用现有的语块抽取方法抽取重复的语言单位,就可以方便地建设翻译记忆库,提高翻译的工作效率。 展开更多
关键词 人工智能 机器翻译 语块抽取 串频统计 内部结合 紧密度 信息熵 语块组合规则
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部