-
题名基于挖掘Web双语词汇关联度的无指导译文消歧
- 1
-
-
作者
刘鹏远
赵铁军
-
机构
北京大学信息科学与技术学院计算语言学研究所
哈尔滨工业大学计算机科学与技术学院
-
出处
《高技术通讯》
EI
CAS
CSCD
北大核心
2010年第4期349-354,共6页
-
基金
973计划(2004CB318102)
国家自然科学基金(60903063)
中国博士后科学基金(20090450007)资助项目
-
文摘
为缓解译文消歧任务中消歧知识获取困难及数据稀疏问题,提出了一种基于Web的挖掘双语词汇相关关系的无指导译文消歧方法。该方法将双语词汇在语料库中的间接相关拓展到Web,提出了基于Web的双语词汇间接相关模型,在此基础上又提出了一种基于Web的双语词汇相关度的消歧方法,通过构造不同queries并利用搜索引擎抽取返回页面的page counts,最后利用点式互信息来计算词汇间的相关度并用于消歧决策。该方法最好性能(P_(mar)=0.464)超过了国际语义评测Semeval-2007的Task #5上可比较的最好无指导系统TorMd。
-
关键词
无指导译文消歧
双语词汇相关
页面计数
间接相关
基于WEB
-
Keywords
unsupervised translation disambiguation, bilingual word relatedness, page count, indirect association, web based
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-