-
题名查询专指度与检索多样化的关系研究
被引量:1
- 1
-
-
作者
赵春晖
张俊
-
机构
武汉大学信息检索与知识挖掘研究所
深圳证券信息有限公司
-
出处
《情报工程》
2018年第4期82-94,共13页
-
基金
深圳市技术攻关资助项目证券信息多层网络数据检索与监控关键技术研究(JSGG20160229121006579)
-
文摘
为了研究不同查询专指度语句的多样化检索效果,进而为提高检索质量和用户体验提供借鉴。本文基于TREC(2009-2012)Web Track检索词,人工进行专指度标注,选用语言模型狄利克雷平滑、语言模型线性差值平滑和TF-IDF三种模型,使用MAP-IA,α-nDCG@k,ERR-IA@k评价多样化检索结果,对检索结果进行统计学分析和差异性检验,全面分析了查询专指度与多样化检索效果之间的关联性。实验结果表明查询词的专指度特征与多样化检索的效果间存在一定的关联。强专指度查询的多样化检索效果要明显好于弱专指度查询,特别在靠前的检索结果列表中,这种差异性最大。
-
关键词
查询意图
查询专指度
检索多样化
-
Keywords
Query intention
query specificity
search diversification
-
分类号
G353.1
[文化科学—情报学]
-
-
题名基于标签语义距离的图像多样化检索
- 2
-
-
作者
张震宇
丁恒
王瑞雪
陆伟
-
机构
武汉大学信息管理学院
武汉大学信息资源中心
-
出处
《数字图书馆论坛》
CSSCI
2017年第2期34-39,共6页
-
基金
海南省哲学社会科学规划课题"气候变化对海岛型旅游目的地游客流的影响及应对策略研究"(编号:HNSK(GJ)13-96)
中国科学技术信息研究所与武汉大学合作项目"科学文献的语义功能识别与深度利用研究"资助
-
文摘
随着互联网图像资源的爆炸式增长,用户对图像多样化检索的需求愈发强烈。本文在对比图像视觉特征和图像文本内容算法的基础上,探讨不同标签语义距离算法在多样化检索中的效果,通过实验提供一种较好的基于标签语义距离的图像多样化检索算法。
-
关键词
标签语义距离
社会化标签
图像多样化检索
语义相似度
-
Keywords
Semantic Distance of Tags
Social Tag
Image Diversity Retrieval
Semantic Similarity
-
分类号
TP391.41
[自动化与计算机技术—计算机应用技术]
-
-
题名信息检索中支持结果多样化的查询性能预测
- 3
-
-
作者
张忠敏
吴胜利
-
机构
江苏大学
-
出处
《软件工程》
2019年第2期5-10,共6页
-
基金
江苏省自然科学基金(BK20171303:大数据环境下支持检索结果多样化的联邦搜索引擎技术)资助
-
文摘
对支持检索结果多样化任务的查询性能预测进行了研究。分析了现有性能预测算法的不足,考虑利用不同方式衡量最终检索结果列表的多样性,并在此基础上提出同时考察查询结果的相关性性能与多样性性能的三种方法。采用TREC Clue Web09B数据集、Web Track任务的查询集及开源的Indri搜索引擎构建实验平台并进行实验。基于Spearman、Pearson和Kendall相关系数的评价结果表明,所提出的三种方法与传统方法相比更适用于预测多样化检索结果,且在不同条件下性能稳定。
-
关键词
信息检索
查询性能预测
检索结果多样化
-
Keywords
information retrieval
query performance prediction
search result diversification
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名检索结果多样化的性能预测
- 4
-
-
作者
陈佳伟
-
机构
江苏大学计算机科学与通信工程学院
-
出处
《信息技术》
2018年第1期124-129,共6页
-
文摘
目前查询性能预测的研究,主要集中在查询结果相关性性能的评估上,而搜索引擎正不断提高检索结果的多样化性能,因此预测其多样化性能是一项有意义的工作。在多样化性能的预测上,传统基于得分分布算法的有效性较低。为此,提出了预测查询结果多样化性能的算法,并在运行结果上检验了提出的算法的有效性。实验结果显示,提出的预测算法是有价值的。
-
关键词
查询性能预测
查询性能预测算法
检索结果多样化
多样化性能预测
-
Keywords
query performance prediction
query performance predictor
search result diversification
diversification performance prediction
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名基于主题向量模型的多样化资源选择算法
- 5
-
-
作者
李亮
张芳
-
机构
江苏大学计算机科学与通信工程学院
南阳理工学院计算机与信息工程学院
-
出处
《信息技术》
2018年第9期79-83,共5页
-
基金
江苏省自然科学基金项目(BK20171303)
-
文摘
检索结果多样化任务下的资源选择是联邦检索的重要研究内容。针对现有显式方法的信息依赖和隐式方法的多样化性能不高,提出在α相关度筛选后得到的相关文档集上,构建子主题向量模型。从文中语义层提取数据源内容特征,提升资源相似度计算准确度,实现多样化的资源选择。实验显示,基于主题向量模型的资源选择方法表现出更好的性能。
-
关键词
主题向量模型
资源相似度
联邦检索
资源选择
检索结果多样化
-
Keywords
topic vector model
resource similarity
federated search
resource selection
search result diversification
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名联邦搜索中基于词向量的多样化信息源选择算法
- 6
-
-
作者
王雅蓉
李亮
吴胜利
-
机构
江苏大学
-
出处
《软件工程》
2018年第11期1-6,共6页
-
文摘
对支持检索结果多样化任务的信息源选择进行了研究。分析了现有研究的不足,提出利用词向量提取文本的语义特征,在此基础上实现文档建模和信息源选择。采用ClueWeb12b-13数据集构建实验平台和进行实验,基于R方法的评价结果表明,所提出的方法优于现有的方法GLS和MnStD,且在不同条件下性能稳定。
-
关键词
联邦搜索
信息源选择
检索结果多样化
词向量
-
Keywords
federated search
resource selection
search result diversifcation
distributed word representation
-
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
-
-
题名基于查询子主题分类的多样性搜索评价方法
被引量:1
- 7
-
-
作者
陈飞
刘奕群
张敏
马少平
-
机构
智能技术与系统国家重点实验室(清华大学)
清华信息科学与技术国家实验室(筹)(清华大学)
清华大学计算机科学与技术系
-
出处
《软件学报》
EI
CSCD
北大核心
2015年第12期3130-3139,共10页
-
基金
国家自然科学基金(61532011
61472206)
国家重点基础研究发展计划(973)(2015CB358700)~~
-
文摘
多样化检索结果的评测通常假设一个查询词包含多个权重各不相同的用户子意图,并在此假设的基础上对检索结果进行评测.虽然大多数已经存在的多样化检索评测方法利用了这些特性对检索结果进行评测,但在评测过程中,它们都忽略了查询子意图的类型信息;而不同类型的查询子意图对信息需求具有不同的特点.首先,通过引入衰减函数对这种特点进行描述,进而对用户子意图的分类方法进行抽象;在此基础上,提出了利用查询子意图类型信息进行多样化检索结果评测的框架,该框架定义了利用查询子意图类型信息进行多样化检索评测的方法应该具有的结构;然后,讨论了在用信息类和导航类作为子意图分类方法的前提下,其对应的衰减函数的形式;最后,在TREC与NTCIR测试集上的实验结果表明了所提出方法的有效性.
-
关键词
多样化检索评测分类
检索结果多样化
-
Keywords
diversity evaluation
taxonomy
diversified search
-
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
-
-
题名面向查询意图歧义性的多样化检索模型研究
被引量:2
- 8
-
-
作者
桂思思
张晓娟
-
机构
南京农业大学信息管理学院
西南大学教育学部
-
出处
《情报科学》
CSSCI
北大核心
2021年第12期39-45,共7页
-
基金
国家社会科学基金青年项目“面向学术搜索的查询意图研究”(19CTQ023)。
-
文摘
【目的/意义】查询意图歧义性对检索模型提出了挑战。针对查询意图歧义性程度,探讨了基于歧义程度的多样化检索模型的检索效果。【方法/过程】将查询意图歧义性程度的表示方式分为序数变量或连续变量两种方式,在此基础上,提出了基于三种排序策略的面向序数变量查询意图歧义性的多样化检索模型、基于查询重构的面向连续变量查询意图歧义性的多样化检索模型,从而使得检索结果列表同时具有较高的覆盖率与新颖性。【结果/结论】在公开数据集上,四个检索效果测评指标α-nDCG@5、α-nDCG@10、α-nDCG@20及NRBP@20表明,本文提出的多样化检索模型优于基准实验,且获取准确的查询子主题能有效提升检索效果。【创新/局限】区分了查询意图歧义性程度的两种表示方式,据此提出并验证了面向查询意图歧义性程度的多样化检索模型;然而限于实验运行复杂程度,生成初始检索结果列表数据略少。
-
关键词
查询意图
歧义性
多样化检索
重排序
歧义性表示
-
Keywords
query intent
ambiguity intent
diversity search
result list rerank
ambiguity measurement
-
分类号
G254.9
[文化科学—图书馆学]
-