期刊文献+
共找到43篇文章
< 1 2 3 >
每页显示 20 50 100
面向稠密检索的伪相关反馈方法 被引量:1
1
作者 胡文浩 罗景 涂新辉 《计算机应用》 CSCD 北大核心 2023年第4期1036-1042,共7页
伪相关反馈(PRF)机制是一种自动化的查询扩展(QE)技术,它利用原始查询和初次检索中前N篇文档蕴含的信息构建更加准确的查询,从而进一步提高信息检索系统的性能。但是,现有的面向稠密检索的PRF方法由于对文本的截断处理容易造成语义信息... 伪相关反馈(PRF)机制是一种自动化的查询扩展(QE)技术,它利用原始查询和初次检索中前N篇文档蕴含的信息构建更加准确的查询,从而进一步提高信息检索系统的性能。但是,现有的面向稠密检索的PRF方法由于对文本的截断处理容易造成语义信息的缺失,而且在检索阶段的空间复杂度较高。针对上述问题,提出了一种基于段落级粒度且适用于长文本稠密检索的PRF方法 Dense-PRF。首先,通过计算语义距离从初次检索的前N篇文档中获得相关段落的向量;其次,对相关段落向量进行平均池化以得到QE项向量;然后,按照权重结合原始查询向量和QE项向量构建新的查询向量;最后,根据新的查询向量得到最终检索结果。在Robust04和WT2G两个经典长文本测试集上将Dense-PRF与基线模型进行了对比实验,相较于模型RepBERT+BM25,Dense-PRF在前20篇文档的准确率和归一化折现累计效益(NDCG)指标上分别提升了1.66、1.32个百分点和2.30、1.91个百分点。实验结果表明Dense-PRF能有效缓解查询与文档词汇不匹配的问题,并提升检索精度。 展开更多
关键词 伪相关反馈 查询扩展 信息检索 稠密检索 长文本
下载PDF
基于ConceptNet语义的伪相关反馈信息检索方法 被引量:1
2
作者 潘敏 刘宇 +1 位作者 裴全力 李腾 《湖北师范大学学报(自然科学版)》 2023年第2期28-37,共10页
伪相关性反馈技术在信息检索领域应用广泛,在考虑词频和逆文档频率等重要特征时,传统的信息检索方法容易忽略查询词本身的语义信息。提出了一种基于语义的伪相关性反馈信息检索方法SPRF(Semantic Pseudo-Relevance Feedback),充分利用Co... 伪相关性反馈技术在信息检索领域应用广泛,在考虑词频和逆文档频率等重要特征时,传统的信息检索方法容易忽略查询词本身的语义信息。提出了一种基于语义的伪相关性反馈信息检索方法SPRF(Semantic Pseudo-Relevance Feedback),充分利用ConceptNet获取语义信息,不仅考虑了查询词在文档中的词频重要性,还将查询词的语义信息整合到伪相关反馈框架中,以改善查询扩展词的选择。在6个TREC数据集上实验结果表明:SPRF方法对比较强基线模型和几种基于神经网络的方法在P@10和MAP两个指标上具有显著提升。 展开更多
关键词 ConceptNet 伪相关反馈 查询扩展 信息检索
下载PDF
Strength Pareto fitness assignment for pseudo-relevance feedback: application to MEDLINE 被引量:1
3
作者 Ilyes KHENNAK Habiba DRIAS 《Frontiers of Computer Science》 SCIE EI CSCD 2018年第1期163-176,共14页
Because of users' growing utilization of unclear and imprecise keywords when characterizing their informa- tion need, it has become necessary to expand their original search queries with additional words that best ca... Because of users' growing utilization of unclear and imprecise keywords when characterizing their informa- tion need, it has become necessary to expand their original search queries with additional words that best capture their actual intent. The selection of the terms that are suitable for use as additional words is in general dependent on the degree of relatedness between each candidate expansion term and the query keywords. In this paper, we propose two criteria for evaluating the degree of relatedness between a candidate expansion word and the query keywords: (1) co-occurrence frequency, where more importance is attributed to terms oc- curring in the largest possible number of documents where the query keywords appear; (2) proximity, where more im- portance is assigned to terms having a short distance from the query terms within documents. We also employ the strength Pareto fitness assignment in order to satisfy both criteria si- multaneously. The results of our numerical experiments on MEDLINE, the online medical information database, show that the proposed approach significantly enhances the re- trieval performance as compared to the baseline. 展开更多
关键词 information retrieval query expansion pseudo-relevance feedback PROXIMITY multi-objective optimization Pareto dominance MEDLINE
原文传递
基于矩阵加权关联规则挖掘的伪相关反馈查询扩展 被引量:70
4
作者 黄名选 严小卫 张师超 《软件学报》 EI CSCD 北大核心 2009年第7期1854-1865,共12页
提出一种面向查询扩展的矩阵加权关联规则挖掘算法,给出与其相关的定理及其证明过程.该算法采用4种剪枝策略,挖掘效率得到极大提高.实验结果表明,其挖掘时间比原来的平均时间减少87.84%.针对现有查询扩展的缺陷,将矩阵加权关联规则挖掘... 提出一种面向查询扩展的矩阵加权关联规则挖掘算法,给出与其相关的定理及其证明过程.该算法采用4种剪枝策略,挖掘效率得到极大提高.实验结果表明,其挖掘时间比原来的平均时间减少87.84%.针对现有查询扩展的缺陷,将矩阵加权关联规则挖掘技术应用于查询扩展,提出新的查询扩展模型和更合理的扩展词权重计算方法.在此基础上提出一种伪相关反馈查询扩展算法——基于矩阵加权关联规则挖掘的伪相关反馈查询扩展算法,该算法能够自动地从前列n篇初检文档中挖掘与原查询相关的矩阵加权关联规则,构建规则库,从中提取与原查询相关的扩展词,实现查询扩展.实验结果表明,该算法的检索性能确实得到了很好的改善.与现有查询扩展算法相比,在相同的查全率水平级下,其平均查准率有了明显的提高. 展开更多
关键词 信息检索 伪相关反馈 查询扩展 关联规则 矩阵加权
下载PDF
基于伪相关反馈的跨语言查询扩展 被引量:19
5
作者 吴丹 何大庆 王惠临 《情报学报》 CSSCI 北大核心 2010年第2期232-239,共8页
相关反馈是一种重要的查询重构技术,本文分析了两类相关反馈技术,一是按用户是否参与可分为伪相关反馈和交互式相关反馈,二是按作用于查询的方式可分为查询扩展与检索词重新加权。在此基础上,本文重点探讨了将相关反馈技术应用于跨... 相关反馈是一种重要的查询重构技术,本文分析了两类相关反馈技术,一是按用户是否参与可分为伪相关反馈和交互式相关反馈,二是按作用于查询的方式可分为查询扩展与检索词重新加权。在此基础上,本文重点探讨了将相关反馈技术应用于跨语言信息检索,提出了翻译前查询扩展、翻译后查询扩展、翻译前与翻译后相结合的查询扩展三种方法。最后,本文通过伪相关反馈实验对这三种方法进行了比较,实验结果显示,三种跨语言查询扩展方法都能够有效地提高检索结果的精度,其中翻译后查询扩展方法相对更优越。此外,查询式的长度对不同跨语言查询扩展方法产生着不同程度的影响。 展开更多
关键词 相关反馈 伪相关反馈 跨语言信息检索 查询扩展
下载PDF
基于URL主题的查询分类方法 被引量:14
6
作者 张宇 宋巍 +1 位作者 刘挺 李生 《计算机研究与发展》 EI CSCD 北大核心 2012年第6期1298-1305,共8页
互联网上很多资源蕴含人类群体智慧.分类网站目录人工地对网站按照主题进行组织.基于网站目录中具有主题标注的URL设计URL主题分类器,结合伪相关反馈技术以及搜索引擎查询日志,提出了自动、快速、有效的查询主题分类方法.具体地,方法为... 互联网上很多资源蕴含人类群体智慧.分类网站目录人工地对网站按照主题进行组织.基于网站目录中具有主题标注的URL设计URL主题分类器,结合伪相关反馈技术以及搜索引擎查询日志,提出了自动、快速、有效的查询主题分类方法.具体地,方法为2种策略的结合.策略1通过计算搜索结果中URL的主题分布预测查询主题,策略2基于查询日志点击关系,利用具有主题标注的URL,对查询进行标注获取数据并训练统计分类器预测查询主题.实验表明,方法可获得比当前最好算法更好的准确率,更好的在线处理效率并且可基于查询日志自动获取训练数据,具有良好的可扩展性. 展开更多
关键词 查询分类 URL分类 查询日志 伪相关反馈 统计学习
下载PDF
一种基于排序学习方法的查询扩展技术 被引量:7
7
作者 徐博 林鸿飞 +1 位作者 林原 王健 《中文信息学报》 CSCD 北大核心 2015年第3期155-161,共7页
查询扩展作为一门重要的信息检索技术,是以用户查询为基础,通过一定策略在原始查询中加入一些相关的扩展词,从而使得查询能够更加准确地描述用户信息需求。排序学习方法利用机器学习的知识构造排序模型对数据进行排序,是当前机器学习与... 查询扩展作为一门重要的信息检索技术,是以用户查询为基础,通过一定策略在原始查询中加入一些相关的扩展词,从而使得查询能够更加准确地描述用户信息需求。排序学习方法利用机器学习的知识构造排序模型对数据进行排序,是当前机器学习与信息检索交叉领域的研究热点。该文尝试利用伪相关反馈技术,在查询扩展中引入排序学习算法,从文档集合中提取与扩展词相关的特征,训练针对于扩展词的排序模型,并利用排序模型对新查询的扩展词集合进行重新排序,将排序后的扩展词根据排序得分赋予相应的权重,加入到原始查询中进行二次检索,从而提高信息检索的准确率。在TREC数据集合上的实验结果表明,引入排序学习算法有助于提高伪相关反馈的检索性能。 展开更多
关键词 信息检索 查询扩展 伪相关反馈 排序学习
下载PDF
基于深度学习的查询扩展研究 被引量:12
8
作者 余传明 蔡林 +1 位作者 胡莎莎 安璐 《情报学报》 CSSCI CSCD 北大核心 2019年第10期1066-1077,共12页
通过在查询扩展中引入深度学习框架,并结合局部和全局查询扩展模型,从而解决查询扩展中伪相关反馈引起的查询漂移问题。选择eBay于2017年发布的查询短语和商品名称作为实验数据,在伪相关反馈的基础上提出基于深度学习的查询扩展模型(dee... 通过在查询扩展中引入深度学习框架,并结合局部和全局查询扩展模型,从而解决查询扩展中伪相关反馈引起的查询漂移问题。选择eBay于2017年发布的查询短语和商品名称作为实验数据,在伪相关反馈的基础上提出基于深度学习的查询扩展模型(deep learning based query expansion model,DLQEM),以实现更准确有效的查询扩展,并将其应用到信息检索任务中。实验结果表明,DLQEM的precision@10值在伪相关反馈(PRF)的基础上分别提高了3.5%和3.7%,验证了本文所提出假设(通过概念相关扩展词与反馈信息扩展词取交集能够有效地控制反馈相关扩展词造成的查询漂移)的有效性。深度学习能够解决监督学习在短文本集上难以获得好的分类效果的问题,将其与传统查询扩展模型进行结合,解决了传统查询扩展中需要用户参与和检索速度迟缓两大弊端,控制了查询漂移。 展开更多
关键词 信息检索 查询扩展 深度学习 伪相关反馈
下载PDF
基于重排序融合的社会图书检索系统 被引量:4
9
作者 李岩 张博文 +1 位作者 陈松路 郝红卫 《计算机应用研究》 CSCD 北大核心 2017年第3期781-784,790,共5页
用图书的出版信息和用户生成的社会信息从社会媒体中搜索出相关的图书已成为信息检索系统的一个研究热点。大部分的信息检索系统都是由单一的检索方法构成,随着用户需求的不断增加,这些系统难以满足用户需求。针对上述问题,提出了一种... 用图书的出版信息和用户生成的社会信息从社会媒体中搜索出相关的图书已成为信息检索系统的一个研究热点。大部分的信息检索系统都是由单一的检索方法构成,随着用户需求的不断增加,这些系统难以满足用户需求。针对上述问题,提出了一种基于重排序融合的图书检索系统。使用伪相关反馈技术对用户查询内容进行扩展,并将检索结果作为初排序结果;再使用用户生成的社会信息特征对初排序结果进行重排序,最后采用排序学习模型对多种重排序策略得到的结果进行融合。在INEX 2012—2014 Social Book Search公开数据集上针对其他先进检索系统进行了对比实验,实验结果表明,系统的性能(NDCG@10)优于其他方法构成的图书检索系统。 展开更多
关键词 社会图书检索 伪相关反馈 重排序 排序学习
下载PDF
利用URL-Key进行查询分类 被引量:2
10
作者 李雪伟 吕学强 +1 位作者 董志安 刘克会 《北京大学学报(自然科学版)》 EI CAS CSCD 北大核心 2015年第2期220-226,共7页
针对查询分类问题,借助互联网中人工组织的分类网站领域URL,利用URL-key在各个类别中使用的频度,提出基于方差的领域URL-key识别方法,利用机器翻译、拼音翻译和搜索结果反馈等技术对URL-key进行过滤,构建领域URL-key。然后结合伪相关反... 针对查询分类问题,借助互联网中人工组织的分类网站领域URL,利用URL-key在各个类别中使用的频度,提出基于方差的领域URL-key识别方法,利用机器翻译、拼音翻译和搜索结果反馈等技术对URL-key进行过滤,构建领域URL-key。然后结合伪相关反馈技术,选取URL-key为特征,构建URL-key向量,利用SVM对查询串进行分类。实验结果表明,该方法不仅F值比对比方法提高7%,而且资源的使用也远远小于对比方法,提高了系统的时效性。 展开更多
关键词 查询分类 URL URL-key 伪相关反馈
下载PDF
一种基于统计语义聚类的查询语言模型估计 被引量:3
11
作者 蒲强 何大庆 杨国纬 《计算机研究与发展》 EI CSCD 北大核心 2011年第2期224-231,共8页
如何有效生成文档聚类并使用聚类信息提高检索效果是信息检索中的重要研究课题.如果假设文档中存在若干隐含的独立主题,那么文档可以看成是由这些隐含的独立主题混合噪声相互作用的结果.基于这个假设提出了一种基于独立分量分析的语义... 如何有效生成文档聚类并使用聚类信息提高检索效果是信息检索中的重要研究课题.如果假设文档中存在若干隐含的独立主题,那么文档可以看成是由这些隐含的独立主题混合噪声相互作用的结果.基于这个假设提出了一种基于独立分量分析的语义聚类技术,试图借助于独立分量分析的良好主题区分能力,将一组文档按照实际隐含的主题在语义空间上聚类.在语言模型的框架下,语义主题聚类将由用户初始查询按照一定的度量方式激活.利用激活语义聚类的信息估计一个反馈语义主题模型,并与初始查询模型一起形成新的查询模型.在5个TREC数据集上的实验结果表明:基于统计语义聚类估计的查询模型相比传统的查询模型以及其他基于聚类的语言模型在检索性能上有显著性提高.其主要原因是应用了和用户查询最相似的语义聚类信息来估计查询模型. 展开更多
关键词 语义聚类 独立分量分析 查询模型 相关模型 语言模型 伪相关反馈
下载PDF
基于深度强化学习的查询扩展模型研究 被引量:5
12
作者 余传明 胡莎莎 +1 位作者 叶鹏昊 安璐 《情报理论与实践》 CSSCI 北大核心 2019年第9期146-153,共8页
文章在传统的伪相关反馈基础上引入深度强化学习的查询扩展方法来改善信息检索中由词不匹配造成的检索效果不佳问题。选择eBay于2017年发布的用户查询与商品名称作为实验数据,利用深度学习框架抽取词的抽象特征,并把召回率作为奖励,使... 文章在传统的伪相关反馈基础上引入深度强化学习的查询扩展方法来改善信息检索中由词不匹配造成的检索效果不佳问题。选择eBay于2017年发布的用户查询与商品名称作为实验数据,利用深度学习框架抽取词的抽象特征,并把召回率作为奖励,使用强化学习方法对扩展词进行选择。当使用召回率、精度和平均精度均值三个指标对模型进行评价时,文章提出的基于深度强化学习的查询扩展方法明显优于基线方法(原始查询、基于TF-IDF的查询扩展、基于余弦相似度的查询扩展和基于深度学习的查询扩展),扩展后的查询检索效果在召回率上比原始查询高1.32%。实验结果表明基于深度强化学习的查询扩展模型能够改善词不匹配带来的问题,提高系统检索效果。 展开更多
关键词 深度强化学习 查询扩展 伪相关反馈 信息检索
下载PDF
基于伪文档的伪相关反馈方法 被引量:2
13
作者 闫蓉 高光来 《中文信息学报》 CSCD 北大核心 2016年第6期156-163,172,共9页
传统的伪相关反馈(Pseudo Relevance Feedback,PRF)方法通常是以文档作为扩展源单元提取扩展词,提取粒度过大造成扩展源质量下降,使得检索结果鲁棒性差。该文研究利用主题分析技术,尝试将文本语义内容作为扩展源单元,缓解扩展源质量不... 传统的伪相关反馈(Pseudo Relevance Feedback,PRF)方法通常是以文档作为扩展源单元提取扩展词,提取粒度过大造成扩展源质量下降,使得检索结果鲁棒性差。该文研究利用主题分析技术,尝试将文本语义内容作为扩展源单元,缓解扩展源质量不高的问题。提出并实现了对文本集中各文档内容的伪文档描述,通过对其进行隐式多样化处理,实现了从更细微的文本内容角度出发提取扩展词。通过在真实NTCIR8中文语料的检索结果表明,该方法可以有效地提升伪相关反馈的检索性能。 展开更多
关键词 伪相关反馈 伪文档 主题分析 隐含主题
下载PDF
基于聚类和词组抽取的XML查询扩展 被引量:2
14
作者 钟敏娟 万常选 焦贤沛 《情报学报》 CSSCI 北大核心 2010年第4期597-604,共8页
查询扩展技术通过向初始查询请求加入相似或相关的词,组成更为准确的扩展查询表达式,来减少查询请求与相关文献在表达上的不匹配现象,改善检索性能。与传统的查询扩展不同,XML查询扩展不仅要对文档内容进行有效扩展,而且还要考虑结构扩... 查询扩展技术通过向初始查询请求加入相似或相关的词,组成更为准确的扩展查询表达式,来减少查询请求与相关文献在表达上的不匹配现象,改善检索性能。与传统的查询扩展不同,XML查询扩展不仅要对文档内容进行有效扩展,而且还要考虑结构扩展。本文提出了一种基于伪反馈的XML查询扩展方法,将初始检索结果聚类,获得与查询请求最为相关的文档簇,然后在文档簇中抽取词组,找到符合用户查询意图的扩展查询词组,并在扩展查询词组的基础上进行结构扩展,最终形成完整的“内容+结构”的查询扩展表达式。相关实验结果表明,相对没有扩展的查询,所提方法具有更好的精度。 展开更多
关键词 XML 伪反馈 聚类 扩展查询词组 结构查询扩展
下载PDF
结合概念语义空间的语义扩展技术研究 被引量:7
15
作者 王磊 黄广君 《计算机工程与应用》 CSCD 2012年第35期106-109,193,共5页
查询扩展是在原查询词的基础上加入相关的词或者词组,以克服自然语言的"二义性"问题,改进查询意愿的描述。在概念语义空间中进行查询词扩展,可以充分挖掘出查询词之间的关联程度,在整体上把握查询意愿。利用WordNet语义词典... 查询扩展是在原查询词的基础上加入相关的词或者词组,以克服自然语言的"二义性"问题,改进查询意愿的描述。在概念语义空间中进行查询词扩展,可以充分挖掘出查询词之间的关联程度,在整体上把握查询意愿。利用WordNet语义词典中的上下文关系和相似度关系为各个原始查询词构建语义树,并将这些语义树向上溯源建立完整的概念语义空间,以共现信息为特征参数对扩展源中的词进行筛选,以避免过度扩展引起查询语义漂移。还引入动态观察窗口加权模型,以强化共现信息对单词之间关联度的表示。实验结果表明,该扩展算法比传统伪相关反馈算法的扩展质量有明显提高。 展开更多
关键词 查询扩展 伪相关反馈 语义空间 观察窗口 加权 平均倒数排名
下载PDF
基于高质量反馈源的XML查询扩展 被引量:1
16
作者 钟敏娟 万常选 +1 位作者 刘德喜 江腾蛟 《情报学报》 CSSCI 北大核心 2013年第6期610-617,共8页
有效避免伪反馈的“查询主题漂移”主要需要解决两大问题,一是如何确定相关文档,形成较高质量的伪相关文档集,另一个是在伪相关文档集里如何挑选扩展信息。本文主要研究在获取了高质量伪相关文档集合的基础上如何有效进行XML查询扩... 有效避免伪反馈的“查询主题漂移”主要需要解决两大问题,一是如何确定相关文档,形成较高质量的伪相关文档集,另一个是在伪相关文档集里如何挑选扩展信息。本文主要研究在获取了高质量伪相关文档集合的基础上如何有效进行XML查询扩展。针对XML文档的特点,提出了扩展向量空间模型的查询词扩展方法。实验结果表明,与初始查询和传统的词项扩展方法相比,该扩展方法更能获得与用户查询意图相关的扩展信息,更能有效地提高检索质量和性能。 展开更多
关键词 伪反馈 XML查询扩展 标签语义权重 节点层次
下载PDF
基于分段动态时间规整的语音样例快速检索 被引量:5
17
作者 冯志远 张连海 《数据采集与处理》 CSCD 北大核心 2014年第2期265-273,共9页
提出了一种融合下界估计和分段动态时间规整的语音样例快速检索方法。该方法针对缺乏合适的训练数据等语音资源较为有限的语言进行快速检索所设计。此方法首先提取查询样例和测试集的音素后验概率;然后,根据限制条件在测试语句中选定候... 提出了一种融合下界估计和分段动态时间规整的语音样例快速检索方法。该方法针对缺乏合适的训练数据等语音资源较为有限的语言进行快速检索所设计。此方法首先提取查询样例和测试集的音素后验概率;然后,根据限制条件在测试语句中选定候选分段,并计算查询样例和每个候选分段之间实际动态时间规整得分的下界估计,再运用K最近邻搜索算法搜索与查询样例相似度最高的分段;最后,使用虚拟相关反馈技术对检索结果进行修正。实验结果表明:尽管此方法的检索精度略低于直接运用动态时间规整进行检索的检索精度,但其检索速度优于后者,且检索结果经过虚拟相关反馈技术修正后,其检索精度也得到有效提升。 展开更多
关键词 语音样例检索 音素后验概率 分段动态时间规整 下界估计 虚拟相关反馈
下载PDF
基于检索结果排序的伪相关反馈 被引量:1
18
作者 闫蓉 高光来 《计算机应用》 CSCD 北大核心 2016年第8期2099-2102,2143,共5页
针对传统伪相关反馈(PRF)算法扩展源质量不高使得检索效果不佳的问题,提出一种基于检索结果的排序模型(REM)。首先,该模型从初检结果中选择排名靠前的文档作为伪相关文档集;然后,以用户查询意图与伪相关文档集中各文档的相关度最大化、... 针对传统伪相关反馈(PRF)算法扩展源质量不高使得检索效果不佳的问题,提出一种基于检索结果的排序模型(REM)。首先,该模型从初检结果中选择排名靠前的文档作为伪相关文档集;然后,以用户查询意图与伪相关文档集中各文档的相关度最大化、并且各文档之间相似性最小化作为排序原则,将伪相关文档集中各文档进行重排序;最后,将排序后排名靠前的文档作为扩展源进行二次反馈。实验结果表明,与两种传统伪反馈方法相比,该排序模型能获得与用户查询意图相关的反馈文档,可有效地提高检索效果。 展开更多
关键词 伪相关反馈 潜在狄里克雷分配 主题模型 查询扩展
下载PDF
基于矩阵分解的伪相关反馈技术 被引量:1
19
作者 周栋 刘建勋 张三蓉 《模式识别与人工智能》 EI CSCD 北大核心 2015年第8期735-740,共6页
伪相关反馈技术的性能很大程度上依赖2个参数的取值,在缺乏结果相关性评价的前提下,这些参数只能依靠经验设置.文中提出基于矩阵分解的伪相关反馈技术.该技术将多个伪相关反馈结果使用协同过滤的思想融合,自动选择最优化参数进行查询扩... 伪相关反馈技术的性能很大程度上依赖2个参数的取值,在缺乏结果相关性评价的前提下,这些参数只能依靠经验设置.文中提出基于矩阵分解的伪相关反馈技术.该技术将多个伪相关反馈结果使用协同过滤的思想融合,自动选择最优化参数进行查询扩展.实验表明,与现有的伪相关反馈技术相比,无论使用哪种信息检索模型,文中方法的检索性能都能得到较好改善. 展开更多
关键词 伪相关反馈 矩阵分解 查询扩展 协同过滤
下载PDF
基于检索结果聚类的XML伪相关文档查找 被引量:1
20
作者 钟敏娟 万常选 +1 位作者 刘德喜 廖述梅 《计算机科学》 CSCD 北大核心 2013年第10期172-177,共6页
传统伪相关反馈容易产生"查询主题漂移",有效避免"查询主题漂移"的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方法,在充分考虑XML... 传统伪相关反馈容易产生"查询主题漂移",有效避免"查询主题漂移"的首要前提是确定高质量的相关文档,形成与用户查询需求相关的伪相关文档集合。在检索结果聚类的基础上,研究了XML伪相关文档查找方法,在充分考虑XML内容和结构特征的前提下,提出了基于均衡化权值的簇标签提取方法,并以此为基础,提出了候选簇的排序模型和基于候选簇的文档排序模型。相关实验数据表明,与初始检索结果相比,排序模型获得了较好的性能,有效地查找到了更多的XML伪相关文档。 展开更多
关键词 信息检索 XML伪相关反馈 XML检索结果聚类 簇标签 排序模型
下载PDF
上一页 1 2 3 下一页 到第
使用帮助 返回顶部