-
题名直接优化性能指标的多排序模型融合方法
被引量:4
- 1
-
-
作者
王扬
黄亚楼
卢敏
庞晓东
谢茂强
刘杰
-
机构
南开大学信息技术科学学院
国家电网天津市电力公司信息通信公司
中国民航大学计算机科学与技术学院
南开大学软件学院
-
出处
《计算机学报》
EI
CSCD
北大核心
2014年第8期1658-1668,共11页
-
基金
国家自然科学基金(60673009
61105049)
+2 种基金
国家"八六三"高技术研究发展计划项目基金(2011AA05A117)
高等学校博士学科点专项科研基金博士生导师类项目(65010571)
天津市电力公司科技项目(KJ14-1-10)资助~~
-
文摘
现有排序学习算法忽视了查询之间的差异,在建立排序模型的过程中等同对待训练样本集中的所有查询及其相关文档,影响了排序模型的性能.文中描述了查询之间的差异,并在训练过程中考虑查询之间的差异,提出了一种基于有监督学习的多排序模型融合方法.这种方法首先使用每一个查询及其相关文档训练出子排序模型,并将每一个子排序模型的输出转化为体现查询差异的特征数据,使用监督学习方法,实现了多排序模型的融合.更进一步,针对排序问题的特性,文中提出了一种直接优化排序性能的融合函数融合子排序模型,使用梯度上升方法优化其下界函数.文中证明了直接优化排序性能的融合函数融合子排序模型的性能优于子排序模型线性合并的性能.基于较大规模真实数据应用的实验结果表明,直接优化性能指标的多排序模型融合方法可以比传统排序学习模型具有更好的排序性能.
-
关键词
排序模型融合
直接优化性能指标
排序学习
信息检索
-
Keywords
rank aggregation
directly optimizing performance measure
learning to rank
information retrieval
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-
-
题名面向文档信息检索的排序学习算法
- 2
-
-
作者
周祖坤
杨光
冯小坤
-
机构
昆明冶金高等专科学校
云南文化艺术职业学院
云南大学滇池学院
-
出处
《自动化技术与应用》
2018年第2期40-45,共6页
-
文摘
在基于排序学习的信息检索中,不同的查询及其待排序的文档序列之间有较大的差异性,传统的排序学习方法忽视了不同查询之间的差异性。另一方面,由于各个排序学习算法的偏好和侧重的不同,影响了在验证数据集中的排序性能。针对以上问题,本文提出了基于模型融合的有监督学习的多排序模型学习算法。此算法用每一个人工标注的查询-文档序列训练子模型以获得查询特征,并赋予每一个子模型不同的得分权重。用带系数的反三角函数优化定义的融合损失函数并使其连续且可导,通过多次迭代的梯度上升法训练出合适的子模型权重值和相关系数,综合各文档的得分和子模型的权重值为查询所对应的文档序列排序。最后本文通过在多个数据集下进行对比实验,证明了基于模型融合的有监督学习的多排序模型学习算法比传统排序学习算法有更好的性能。
-
关键词
排序学习
信息检索
查询差异
排序模型融合
损失函数
-
Keywords
learning to rank
information retrieval
query diversity
rank aggregation
loss function
-
分类号
TP391.1
[自动化与计算机技术—计算机应用技术]
-