题名 支持搜索结果多样化的排名算法比较研究
被引量:1
1
作者
陈婷婷
黄春兰
吴胜利
机构
江苏大学计算机科学与通信工程学院
出处
《计算机工程》
CAS
CSCD
北大核心
2016年第10期45-50,共6页
基金
江苏大学特聘教授启动基金资助项目(13JDG002)
文摘
近年来在信息检索领域研究人员提出了多种支持结果多样化的排名算法,但还没有相关文献对这些算法的性能进行系统的分析和比较。为此,在数据融合排名算法Comb Sum的基础上,提出一种同时考虑文档相关性和多样性的排名算法Comb Sum Div,并将其与x Qu AD和PM2这2种显式排名算法进行性能比较。在TREC多样性任务提供的查询数据集和Clue Web09B数据集上的实验结果表明,Comb Sum Div查询性能较优、x Qu AD次之、PM2较差,且3种算法均具有较强的稳定性及抗干扰能力。
关键词
数据融合
搜索结果多样化
重排
稳定性
检索评价
Keywords
data fusion
search result diversification
re-ranking
stability
retrieval evaluation
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 论子话题粒度对搜索结果多样化算法的影响
被引量:1
2
作者
胡莎
窦志成
文继荣
机构
西南大学计算机与信息科学学院
中国人民大学信息学院
大数据管理与分析方法研究北京市重点实验室
出处
《中文信息学报》
CSCD
北大核心
2017年第4期165-173,共9页
基金
国家重点基础研究发展计划/973计划(2014CB340403)
国家自然科学基金(61502501)
文摘
随着生活节奏的加快,用户习惯将简短的查询提交给搜索引擎,并希望搜索引擎能体贴地将自己需要的结果返回在靠前的结果中。面对大量有歧义的或者意义广泛的查询,搜索引擎努力地识别用户意图,并试图用有限的结果取悦更多的用户。为了解决这个问题,搜索结果多样化技术应运而生,其任务是是对搜索结果进行重排序,在有限的搜索结果中满足尽可能多的用户意图。该文重点关注多样化算法中子话题的粒度问题。利用传统方法生成了不同粒度的子话题,并比较了使用不同粒度的子话题对搜索结果多样化算法的影响。实验结果表明,经典多样化算法使用细粒度的子话题时表现更好。
关键词
搜索结果多样化
查询意图
子话题
Keywords
search result diversification
query intents
subtopics
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 信息检索中支持结果多样化的查询性能预测
3
作者
张忠敏
吴胜利
机构
江苏大学
出处
《软件工程》
2019年第2期5-10,共6页
基金
江苏省自然科学基金(BK20171303:大数据环境下支持检索结果多样化的联邦搜索引擎技术)资助
文摘
对支持检索结果多样化任务的查询性能预测进行了研究。分析了现有性能预测算法的不足,考虑利用不同方式衡量最终检索结果列表的多样性,并在此基础上提出同时考察查询结果的相关性性能与多样性性能的三种方法。采用TREC Clue Web09B数据集、Web Track任务的查询集及开源的Indri搜索引擎构建实验平台并进行实验。基于Spearman、Pearson和Kendall相关系数的评价结果表明,所提出的三种方法与传统方法相比更适用于预测多样化检索结果,且在不同条件下性能稳定。
关键词
信息检索
查询性能预测
检索结果多样化
Keywords
information retrieval
query performance prediction
search result diversification
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 检索结果多样化的性能预测
4
作者
陈佳伟
机构
江苏大学计算机科学与通信工程学院
出处
《信息技术》
2018年第1期124-129,共6页
文摘
目前查询性能预测的研究,主要集中在查询结果相关性性能的评估上,而搜索引擎正不断提高检索结果的多样化性能,因此预测其多样化性能是一项有意义的工作。在多样化性能的预测上,传统基于得分分布算法的有效性较低。为此,提出了预测查询结果多样化性能的算法,并在运行结果上检验了提出的算法的有效性。实验结果显示,提出的预测算法是有价值的。
关键词
查询性能预测
查询性能预测算法
检索结果多样化
多样化 性能预测
Keywords
query performance prediction
query performance predictor
search result diversification
diversification performance prediction
分类号
TP391
[自动化与计算机技术—计算机应用技术]
题名 增强覆盖度与非相似性的标签选择多样化方法
5
作者
汪美玲
周翔
陶秋铭
赵琛
机构
中国科学院软件研究所
中国科学院研究生院
出处
《软件学报》
EI
CSCD
北大核心
2015年第9期2326-2338,共13页
基金
国家自然科学基金(61100067)
中国科学院先导专项(XDA06010600)
文摘
标签云是社交网站提供在线资源说明与导航功能的一种流行机制.标签选择即从大量标签中选出有代表性的有限标签,是创建标签云的核心任务.标签选择结果的多样性,是影响用户满意度的一个重要因素.信息覆盖度与标签非相似性是在标签选择中引入多样性的两个主要角度.为了进一步提高标签选择结果的信息覆盖度与标签非相似性,提出了3种标签选择方法.在每种方法中,定义了目标函数以同时量化标签集合的信息覆盖度与标签非相似性,并设计了近似算法以求解相应的最大化问题;同时,还分析了近似算法的近似比.利用CiteULike网站与Last.fm网站的标注数据集,将所提出的方法与已有方法进行了比较.实验结果表明,所提出的方法在信息覆盖度与标签非相似性方面都具有较好的效果.
关键词
标签云
标签选择
结果多样化
信息覆盖度
非相似性
Keywords
tag cloud
tag selection
result diversification
information coverage
dissimilarity
分类号
TP311
[自动化与计算机技术—计算机软件与理论]
题名 基于主题向量模型的多样化资源选择算法
6
作者
李亮
张芳
机构
江苏大学计算机科学与通信工程学院
南阳理工学院计算机与信息工程学院
出处
《信息技术》
2018年第9期79-83,共5页
基金
江苏省自然科学基金项目(BK20171303)
文摘
检索结果多样化任务下的资源选择是联邦检索的重要研究内容。针对现有显式方法的信息依赖和隐式方法的多样化性能不高,提出在α相关度筛选后得到的相关文档集上,构建子主题向量模型。从文中语义层提取数据源内容特征,提升资源相似度计算准确度,实现多样化的资源选择。实验显示,基于主题向量模型的资源选择方法表现出更好的性能。
关键词
主题向量模型
资源相似度
联邦检索
资源选择
检索结果多样化
Keywords
topic vector model
resource similarity
federated search
resource selection
search result diversification
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 联邦搜索中基于词向量的多样化信息源选择算法
7
作者
王雅蓉
李亮
吴胜利
机构
江苏大学
出处
《软件工程》
2018年第11期1-6,共6页
文摘
对支持检索结果多样化任务的信息源选择进行了研究。分析了现有研究的不足,提出利用词向量提取文本的语义特征,在此基础上实现文档建模和信息源选择。采用ClueWeb12b-13数据集构建实验平台和进行实验,基于R方法的评价结果表明,所提出的方法优于现有的方法GLS和MnStD,且在不同条件下性能稳定。
关键词
联邦搜索
信息源选择
检索结果多样化
词向量
Keywords
federated search
resource selection
search result diversifcation
distributed word representation
分类号
TP391.3
[自动化与计算机技术—计算机应用技术]
题名 基于查询子主题分类的多样性搜索评价方法
被引量:1
8
作者
陈飞
刘奕群
张敏
马少平
机构
智能技术与系统国家重点实验室(清华大学)
清华信息科学与技术国家实验室(筹)(清华大学)
清华大学计算机科学与技术系
出处
《软件学报》
EI
CSCD
北大核心
2015年第12期3130-3139,共10页
基金
国家自然科学基金(61532011
61472206)
国家重点基础研究发展计划(973)(2015CB358700)~~
文摘
多样化检索结果的评测通常假设一个查询词包含多个权重各不相同的用户子意图,并在此假设的基础上对检索结果进行评测.虽然大多数已经存在的多样化检索评测方法利用了这些特性对检索结果进行评测,但在评测过程中,它们都忽略了查询子意图的类型信息;而不同类型的查询子意图对信息需求具有不同的特点.首先,通过引入衰减函数对这种特点进行描述,进而对用户子意图的分类方法进行抽象;在此基础上,提出了利用查询子意图类型信息进行多样化检索结果评测的框架,该框架定义了利用查询子意图类型信息进行多样化检索评测的方法应该具有的结构;然后,讨论了在用信息类和导航类作为子意图分类方法的前提下,其对应的衰减函数的形式;最后,在TREC与NTCIR测试集上的实验结果表明了所提出方法的有效性.
关键词
多样化 检索评测分类
检索结果多样化
Keywords
diversity evaluation
taxonomy
diversified search
分类号
TP18
[自动化与计算机技术—控制理论与控制工程]
题名 融合文献多元特征的学术搜索策略优化研究
9
作者
梁柱
汤斌
沈思
机构
南京农业大学信息管理学院
南京理工大学经济管理学院
出处
《情报理论与实践》
CSSCI
北大核心
2022年第7期29-35,17,共8页
基金
国家自然科学基金面上项目“基于深度学习的学术全文本知识图谱构建及检索研究”的成果,项目编号:71974094。
文摘
[目的/意义]在学术资源搜索领域中,用户存在使用语义宽泛的查询式进行搜索的行为,该行为导致搜索结果的冗余性,降低了用户的搜索效率。通过搜索结果多样化的方法,可以优化搜索结果排序,提高用户的搜索效率。[方法/过程]结合江苏省科学技术情报研究所的文献搜索平台日志数据,探讨了学术文献特有的分类组织方法在学术搜索中的作用,并在传统搜索结果多样化方法的基础上,提出了一种融合文献多元特征的学术搜索排序优化方法。[结果/结论]实验结果显示,学术文献特有的分类组织方法能在一定程度上提高用户搜索效果,而融合文献多元特征的排序优化方法,能有效提高用户的搜索效率。
关键词
学术搜索
搜索结果多样化
文献多元特征
策略优化
Keywords
academic search
search results diversification
multiple features of documents
strategy optimization
分类号
G252.7
[文化科学—图书馆学]