期刊文献+
共找到20篇文章
< 1 >
每页显示 20 50 100
Query Expansion Using Wikipedia and a Concept Base in Cross-language Information Retrieval
1
作者 Pham Huy Anh Yukawa Takashi 《Computer Technology and Application》 2013年第10期522-531,共10页
The present paper describes the use of online free language resources for translating and expanding queries in CLIR (cross-language information retrieval). In a previous study, we proposed method queries that were t... The present paper describes the use of online free language resources for translating and expanding queries in CLIR (cross-language information retrieval). In a previous study, we proposed method queries that were translated by two machine translation systems on the Language Gridem. The queries were then expanded using an online dictionary to translate compound words or word phrases. A concept base was used to compare back translation words with the original query in order to delete mistranslated words. In order to evaluate the proposed method, we constructed a CLIR system and used the science documents of the NTCIR1 dataset. The proposed method achieved high precision. However~ proper nouns (names of people and places) appear infrequently in science documents. In information retrieval, proper nouns present unique problems. Since proper nouns are usually unknown words, they are difficult to find in monolingual dictionaries, not to mention bilingual dictionaries. Furthermore, the initial query of the user is not always the best description of the desired information. In order to solve this problem, and to create a better query representation, query expansion is often proposed as a solution. Wikipedia was used to translate compound words or word phrases. It was also used to expand queries together with a concept base. The NTCIRI and NTCIR 6 datasets were used to evaluate the proposed method. In the proposed method, the CLIR system was implemented with a high rate of precision. The proposed syst had a higher ranking than the NTCIRI and NTCIR6 participation systems. 展开更多
关键词 cross-language inlbrmation retrieval clir language resources concept base language grid Wikipedia.
下载PDF
Research on Cross-Language Retrieval Using Bilingual Word Vectors in Different Languages
2
作者 Yulong Li Dong Zhou 《国际计算机前沿大会会议论文集》 2019年第1期462-465,共4页
Bilingual word vectors have been exploited a lot in cross-language information retrieval research. However, most of the research is currently focused on similar language pairs. There are very few studies exploring the... Bilingual word vectors have been exploited a lot in cross-language information retrieval research. However, most of the research is currently focused on similar language pairs. There are very few studies exploring the impact of using bilingual word vectors for cross-language information retrieval in long-distance language pairs. In this paper, it systematically analyzes the retrieval performance of various European languages (English, German, Italian, French, Finnish, Dutch) as well as Asian languages (Chinese, Japanese) in the adhoc task of CLEF 2002–2003 campaign. Genetic proximity was used to visually represent the relationships between languages and compare their crosslingual retrieval performance in various settings. The results show that the differences in language vocabulary would dramatically affect the retrieval performance. At the same time, the term by term translation retrieval method performs slightly better than the simple vector addition retrieval methods. It proves that the translation-based retrieval model can still maintain its advantage under the new semantic scheme. 展开更多
关键词 cross-language information retrieval BILINGUAL word EMBEDDING Genetic PROXIMITY Language PAIRS
下载PDF
跨语言信息检索研究进展 被引量:17
3
作者 张俊林 曲为民 +1 位作者 杜林 孙玉芳 《计算机科学》 CSCD 北大核心 2004年第7期16-19,共4页
随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研究领域。本文介绍了该领域为解决语言间的翻译障碍而研究的各种解决方法并且对汉英跨语言信息检索所面对的独特难点进行了分析,同时本文对国际... 随着互联网资源的多语言性和用户所使用语言的日益多样性,跨语言信息检索成为越来越重要的研究领域。本文介绍了该领域为解决语言间的翻译障碍而研究的各种解决方法并且对汉英跨语言信息检索所面对的独特难点进行了分析,同时本文对国际上重要的跨语言信息检索系统评测会议进行了简单介绍。 展开更多
关键词 跨语言信息检索 汉英跨语言检索 中文信息处理 受控词汇检索
下载PDF
跨语言信息检索技术应用与进展研究 被引量:12
4
作者 吴丹 李瑞芬 《情报科学》 CSSCI 北大核心 2006年第9期1435-1440,共6页
本文介绍了跨语言信息检索技术的基本方法和相关的重要国际会议,并对跨语言信息检索的研究热点难点、应用概况、最新的中文的跨语言信息检索系统的研究情况进行了分析,最后提出其发展趋势和应用前景。
关键词 跨语言信息检索 交叉语言信息检索 clir 信息检索
下载PDF
跨语言信息检索理论与应用研究 被引量:9
5
作者 郭宇锋 黄敏 《图书与情报》 CSSCI 2006年第2期79-81,84,共4页
随着互联网的全球化发展趋势,跨语言信息检索日益成为信息检索领域中的重要课题,跨语言检索可用一种提问语言检索出用另一种语言书写的信息。文章主要对跨语言信息检索理论应用研究进行了探讨,并对其在专业领域数据库中的应用提出一种... 随着互联网的全球化发展趋势,跨语言信息检索日益成为信息检索领域中的重要课题,跨语言检索可用一种提问语言检索出用另一种语言书写的信息。文章主要对跨语言信息检索理论应用研究进行了探讨,并对其在专业领域数据库中的应用提出一种思路。 展开更多
关键词 跨语言 信息检索 查询翻译 机器人信息数据库
下载PDF
基于Lucene的英汉跨语言信息检索 被引量:12
6
作者 陈士杰 张玥杰 《计算机工程》 EI CAS CSCD 北大核心 2005年第13期62-64,共3页
描述了一个英汉跨语言检索系统的设计与实现,其主要研究目的在于寻找更为有效的英汉查询翻译方法,以及提高汉语检索系统的性能。在英汉查询翻译方面,以英汉双语词典为基础,建立了查询翻译算法。在汉语检索方面,分析不同索引单元对于检... 描述了一个英汉跨语言检索系统的设计与实现,其主要研究目的在于寻找更为有效的英汉查询翻译方法,以及提高汉语检索系统的性能。在英汉查询翻译方面,以英汉双语词典为基础,建立了查询翻译算法。在汉语检索方面,分析不同索引单元对于检索性能的影响,基于Lucene全文索引工具包建立了搜索引擎。在系统评测方面,提出了一种根据主题,快速构建评测数据的方法。 展开更多
关键词 信息检索 跨语言信息检索 自然语言处理 机器翻译
下载PDF
跨语言信息检索研究与应用 被引量:9
7
作者 郭华庚 赵英 《现代情报》 北大核心 2008年第9期142-145,共4页
本文在介绍跨语言信息检索(CLIR)的相关概念、实现步骤和方式的基础上,重点阐述CLIR的关键问题和对策以及相关翻译技术,并就其在元搜索引擎中的应用进行探讨,将CLIR的技术平台与元搜索引擎的系统结构相结合,设计出基于CLIR的元搜索引擎... 本文在介绍跨语言信息检索(CLIR)的相关概念、实现步骤和方式的基础上,重点阐述CLIR的关键问题和对策以及相关翻译技术,并就其在元搜索引擎中的应用进行探讨,将CLIR的技术平台与元搜索引擎的系统结构相结合,设计出基于CLIR的元搜索引擎系统模型。 展开更多
关键词 跨语言信息检索 clir 元搜索引擎
下载PDF
跨语言信息检索中的询问翻译方法及其研究进展 被引量:14
8
作者 王妙娅 赖茂生 《现代图书情报技术》 CSSCI 北大核心 2005年第4期37-41,9,共6页
主要介绍了跨语言文本信息检索的三类基本方法:询问翻译、文献翻译和不翻译,并且对目前最常用的询问翻译方法所涉及的一些基本问题及其研究进展进行了阐述,最后总结出跨语言信息检索的现状和动向。
关键词 跨语言信息检索 研究进展
下载PDF
多语言本体构建及其在跨语言信息检索中的应用 被引量:7
9
作者 刘伟成 孙吉红 《武汉科技大学学报(社会科学版)》 2008年第4期73-76,98,共5页
多语言本体是本体在不同语种中的具体表示形式,是实现跨语言信息检索的一个重要工具;其关键特征是,不同语种的本体库对应的概念内涵是一致的。用于跨语言信息检索的多语言本体,由于引入了跨语言同义词规范,因而使不同语种的概念之间能... 多语言本体是本体在不同语种中的具体表示形式,是实现跨语言信息检索的一个重要工具;其关键特征是,不同语种的本体库对应的概念内涵是一致的。用于跨语言信息检索的多语言本体,由于引入了跨语言同义词规范,因而使不同语种的概念之间能够相互对照,并将检索提问式与文献的匹配提升到语义层面,从而消除了不同语言的转换带来的歧异性。 展开更多
关键词 本体 跨语言信息检索 信息检索 多语言本体
下载PDF
基于跨语言信息检索的数字图书馆系统模型 被引量:10
10
作者 王昊 《情报科学》 CSSCI 北大核心 2005年第10期1573-1578,共6页
本文主要论述跨语言信息检索(CLIR)技术与数字图书馆(D-Lib)技术相结合的系统模型。首先介绍CLIR和D-Lib的概念及涉及的相关技术;然后讨论CLIR技术在D-Lib中应用的必然性和可行性;将CLIR的技术平台与D-Lib的系统结构相结合,设计基于CLIR... 本文主要论述跨语言信息检索(CLIR)技术与数字图书馆(D-Lib)技术相结合的系统模型。首先介绍CLIR和D-Lib的概念及涉及的相关技术;然后讨论CLIR技术在D-Lib中应用的必然性和可行性;将CLIR的技术平台与D-Lib的系统结构相结合,设计基于CLIR的D-Lib系统模型;最后关于CLIR技术和D-Lib相结合的应用目前存在的问题提出自己见解。 展开更多
关键词 跨语言信息检索 数字图书馆 多语种 系统模型 相关技术 系统结构 技术平台 问题提出 可行性 应用
下载PDF
本体驱动的跨语言信息检索研究 被引量:11
11
作者 吴丹 《现代图书情报技术》 CSSCI 北大核心 2006年第5期22-26,85,共6页
分析跨语言信息检索技术的翻译歧异性问题,指出多语本体的引入可以提高语义排歧的准确性,详细分析两个国外的跨语言信息检索系统,并在此基础上提出一个基于双语本体的中英跨语言信息检索模型及实现方案。
关键词 本体 跨语言信息检索 信息检索 多语本体
下载PDF
基于Web的跨语言信息检索研究综述 被引量:5
12
作者 赵欣 邓明星 《计算机与现代化》 2009年第2期35-38,共4页
回顾了近年来基于Web的跨语言信息检索技术的理论研究和发展现状,针对跨语言信息检索中基于语料库的方法,就其中语料库的构建和使用问题进行了阐述。比较分析和总结了两方面的技术:一是利用互联网上丰富的双语资源来建立大规模双语语料... 回顾了近年来基于Web的跨语言信息检索技术的理论研究和发展现状,针对跨语言信息检索中基于语料库的方法,就其中语料库的构建和使用问题进行了阐述。比较分析和总结了两方面的技术:一是利用互联网上丰富的双语资源来建立大规模双语语料库的技术,二是目前运用较多的几种查询翻译模型构建技术。最后,展望了该领域的研究前景和发展方向。 展开更多
关键词 跨语言信息检索 基于WEB 平行网页 统计翻译模型
下载PDF
一种基于语义扩展的跨语言自动检索方法的设计 被引量:3
13
作者 宁琳 《现代情报》 CSSCI 2014年第1期155-158,共4页
跨语言检索是一种重要的信息检索手段之一。为了提高跨语言检索效率,采用语义扩展的方法,通过分析其设计思想和工作流程,构建出一种基于语义扩展的跨语言自动检索模型,重点对其语义扩展、知识库和结果聚类等设计进行了阐述,提出了语义... 跨语言检索是一种重要的信息检索手段之一。为了提高跨语言检索效率,采用语义扩展的方法,通过分析其设计思想和工作流程,构建出一种基于语义扩展的跨语言自动检索模型,重点对其语义扩展、知识库和结果聚类等设计进行了阐述,提出了语义理解切分法的分词方法,采用了Single-Pass算法进行聚类,实验结果表明,该模型能有效提高跨语言检索的查全率和查准率。 展开更多
关键词 跨语言信息检索 语义扩展 分词
下载PDF
基于维基百科的未登录词译文挖掘 被引量:2
14
作者 孙常龙 洪宇 +2 位作者 葛运东 姚建民 朱巧明 《计算机研究与发展》 EI CSCD 北大核心 2011年第6期1067-1076,共10页
未登录词(out of vocabulary,OOV)的查询翻译是影响跨语言信息检索(cross-language information retrieval,CLIR)性能的关键因素之一.它根据维基百科(Wikipedia)的数据结构和语言特性,将译文环境划分为目标存在环境和目标缺失环境.针对... 未登录词(out of vocabulary,OOV)的查询翻译是影响跨语言信息检索(cross-language information retrieval,CLIR)性能的关键因素之一.它根据维基百科(Wikipedia)的数据结构和语言特性,将译文环境划分为目标存在环境和目标缺失环境.针对目标缺失环境下的译文挖掘难点,它采用频度变化信息和邻接信息实现候选单元抽取,并建立基于频度-距离模型、表层匹配模板和摘要得分模型的混合译文挖掘策略.实验将基于搜索引擎的未登录词挖掘技术作为baseline,并采用TOP1进行评测.实验验证基于维基百科的混合译文挖掘方法可达到0.6822的译文正确率,相对baseline取得6.98%的改进. 展开更多
关键词 未登录词 维基百科 跨语言信息检索 译文挖掘 目标缺失环境
下载PDF
基于词典的英汉双向跨语言信息检索方法 被引量:3
15
作者 杨辉 张玥杰 张涛 《计算机工程》 CAS CSCD 北大核心 2009年第16期273-274,277,共3页
基于文本检索会议关于英汉跨语言信息检索的任务评价,分别以英汉双向查询翻译和英汉查询为主导策略与翻译对象,采用英汉电子词典作为获取翻译知识的知识源,结合构建的英汉单语信息检索系统,实现完整的英汉双向跨语言信息检索过程。实验... 基于文本检索会议关于英汉跨语言信息检索的任务评价,分别以英汉双向查询翻译和英汉查询为主导策略与翻译对象,采用英汉电子词典作为获取翻译知识的知识源,结合构建的英汉单语信息检索系统,实现完整的英汉双向跨语言信息检索过程。实验结果验证了该系统的有效性。 展开更多
关键词 跨语言信息检索 查询翻译 电子词典 汉语分词
下载PDF
基于LSI的代码-文档可追溯关联挖掘研究 被引量:1
16
作者 杨雪敏 张毅坤 +2 位作者 崔颖安 张保卫 夏辉 《计算机工程》 CAS CSCD 北大核心 2011年第8期34-36,共3页
软件过程产品间可追溯关联挖掘对软件维护及需求跟踪等众多领域至关重要。基于此,提出一种基于潜在语义索引提取程序代码和中文文档关联信息的方法,该方法是对向量空间模型的改进,通过分析文本间隐含的语义结构来确定关联度,而不依赖于... 软件过程产品间可追溯关联挖掘对软件维护及需求跟踪等众多领域至关重要。基于此,提出一种基于潜在语义索引提取程序代码和中文文档关联信息的方法,该方法是对向量空间模型的改进,通过分析文本间隐含的语义结构来确定关联度,而不依赖于词项的匹配。实验结果表明,该方法不依赖于代码和文档预先定义的同义词库和知识库,并能一定程度上提高查全率和查准率。 展开更多
关键词 软件维护 可追溯关联挖掘 隐含语义索引 信息检索 跨语言信息检索
下载PDF
英汉平行语料库在跨语言信息检索中的应用分析 被引量:1
17
作者 郭华伟 张帆 +1 位作者 杨小敏 侯露露 《医学信息学杂志》 CAS 2012年第3期39-43,共5页
介绍跨语言信息检索的内涵、发展历程、检索过程及主要技术方法,详细阐述平行语料库的工作原理、优势、取得的成果,分析其在跨库语言检索中应用存在的问题和对策,比较平行语料库、机器翻译和词典翻译方法的优缺点,提出应促使3者相结合,... 介绍跨语言信息检索的内涵、发展历程、检索过程及主要技术方法,详细阐述平行语料库的工作原理、优势、取得的成果,分析其在跨库语言检索中应用存在的问题和对策,比较平行语料库、机器翻译和词典翻译方法的优缺点,提出应促使3者相结合,推动跨语言信息检索的发展。 展开更多
关键词 平行语料库 跨语言信息检索 翻译 消歧
下载PDF
跨语言交互式检索在数字图书馆中的应用 被引量:1
18
作者 朱榕 纪希禹 《图书馆学研究》 CSSCI 北大核心 2009年第6期51-53,共3页
在现有数字图书馆信息检索系统的基础上,针对检索结果的查准率和查全率偏低等问题,将智能交互式检索技术与CLIR技术相结合,设计基于跨语言交互式检索模型,并将其引入到数字图书馆系统进行应用。
关键词 跨语言信息检索 智能交互式检索 数字图书馆 系统模型
下载PDF
本体在跨语言信息检索中的应用机制研究 被引量:17
19
作者 吴丹 王惠临 《图书情报工作》 CSSCI 北大核心 2006年第9期10-13,共4页
解释多语本体的含义,指出其在不同语言中所对应的领域知识,分析多语本体在查询扩展、语义标注、基于概念索引3方面对改善跨语言信息检索的作用,并通过介绍EuroWorldNet和Cindor系统的多语本体概念的对应方法,探讨本体应用于跨语言信息... 解释多语本体的含义,指出其在不同语言中所对应的领域知识,分析多语本体在查询扩展、语义标注、基于概念索引3方面对改善跨语言信息检索的作用,并通过介绍EuroWorldNet和Cindor系统的多语本体概念的对应方法,探讨本体应用于跨语言信息检索最关键的多语本体库的映射方法,认为采用中间语言作为概念表示、并通过词典翻译对照与不同语种的词汇建立链接关系是多语本体映射的一种良好方法。 展开更多
关键词 本体 多语本体 信息检索 跨语言信息检索
原文传递
情报检索发展的几个前沿问题 被引量:6
20
作者 屈鹏 李璐 张丽丽 《图书情报工作》 CSSCI 北大核心 2008年第3期19-24,共6页
介绍现阶段情报检索研究中的几个前沿问题,包括自然语言检索、跨语言检索、智能信息检索、基于语义的图像和视频检索及检索系统评价研究的最新发展情况。语言、智能和语义等问题相互关联,近年来又一同推动着信息检索的发展。检索评价研... 介绍现阶段情报检索研究中的几个前沿问题,包括自然语言检索、跨语言检索、智能信息检索、基于语义的图像和视频检索及检索系统评价研究的最新发展情况。语言、智能和语义等问题相互关联,近年来又一同推动着信息检索的发展。检索评价研究也有针对性地引导着情报检索的发展方向。结语部分论述这些问题在情报检索前沿发展中的本质联系及未来的发展方向。 展开更多
关键词 自然语言检索 跨语言检索 智能检索 基于语义的检索 检索系统评价
原文传递
上一页 1 下一页 到第
使用帮助 返回顶部