期刊文献+
共找到2篇文章
< 1 >
每页显示 20 50 100
基于网络的跨语言信息检索中OOV译文挖掘研究 被引量:2
1
作者 葛运东 梁颖红 +2 位作者 孙常龙 房璐 姚建民 《微电子学与计算机》 CSCD 北大核心 2009年第10期185-188,共4页
查询翻译是影响跨语言信息检索(CLIR)性能的关键因素之一.查询中未登录词(OOV)译文的挖掘对改进CLIR性能具有重要意义.利用主题词译文查询扩展方法从搜索引擎自动获取有效双语摘要资源;采用频度变化信息和邻接信息从双语摘要资源中抽取... 查询翻译是影响跨语言信息检索(CLIR)性能的关键因素之一.查询中未登录词(OOV)译文的挖掘对改进CLIR性能具有重要意义.利用主题词译文查询扩展方法从搜索引擎自动获取有效双语摘要资源;采用频度变化信息和邻接信息从双语摘要资源中抽取多词候选单元,并与常见的基于统计的多词单元抽取方法进行了比较.实验中译文挖掘方法取得了TOP 1包含率62.02%,TOP 10包含率95.35%的效果. 展开更多
关键词 跨语言信息检索 OOV 查询翻译 多词单元抽取 译文挖掘
下载PDF
基于维基百科的未登录词译文挖掘 被引量:2
2
作者 孙常龙 洪宇 +2 位作者 葛运东 姚建民 朱巧明 《计算机研究与发展》 EI CSCD 北大核心 2011年第6期1067-1076,共10页
未登录词(out of vocabulary,OOV)的查询翻译是影响跨语言信息检索(cross-language information retrieval,CLIR)性能的关键因素之一.它根据维基百科(Wikipedia)的数据结构和语言特性,将译文环境划分为目标存在环境和目标缺失环境.针对... 未登录词(out of vocabulary,OOV)的查询翻译是影响跨语言信息检索(cross-language information retrieval,CLIR)性能的关键因素之一.它根据维基百科(Wikipedia)的数据结构和语言特性,将译文环境划分为目标存在环境和目标缺失环境.针对目标缺失环境下的译文挖掘难点,它采用频度变化信息和邻接信息实现候选单元抽取,并建立基于频度-距离模型、表层匹配模板和摘要得分模型的混合译文挖掘策略.实验将基于搜索引擎的未登录词挖掘技术作为baseline,并采用TOP1进行评测.实验验证基于维基百科的混合译文挖掘方法可达到0.6822的译文正确率,相对baseline取得6.98%的改进. 展开更多
关键词 未登录词 维基百科 跨语言信息检索 译文挖掘 目标缺失环境
下载PDF
上一页 1 下一页 到第
使用帮助 返回顶部