-
题名模仿排序学习模型
- 1
-
-
作者
曾玮
俞蔚捷
徐君
兰艳艳
程学旗
-
机构
中国科学院计算技术研究所网络数据科学与技术重点实验室
中国科学院大学
中国人民大学高瓴人工智能学院大数据管理与分析方法研究北京市重点实验室
-
出处
《中文信息学报》
CSCD
北大核心
2020年第1期97-105,共9页
-
基金
国家自然科学基金(61872338,61832017,61773362,61425016,61472401,61722211,61906180)
北京高校卓越青年科学家计划项目(BJJWZYJH012019100020098)
+3 种基金
北京智源人工智能研究院(BAAI2019ZD0305)
中国人民大学科学研究基金(2018030246)
中国科学院青年创新促进会优秀会员项目(20144310,2016102)
国家重点研发项目(2016QY02D0405)。
-
文摘
文档排序一直是信息检索(IR)领域的关键任务之一。受益于马尔科夫决策过程强大的建模能力,以及强化学习方法强大的求解能力,近年来基于强化学习的排序模型被提出并取得了良好效果。然而,由于候选文档中会包含大量的不相关文档,导致基于"试错"的强化学习方法存在效率低下的问题。为解决上述问题,该文提出了一种基于模仿学习的排序学习算法IR-DAGGER,其基于文档标注信息构建专家策略,在保证文档排序精度的同时提高了算法的学习效率。为了测试IR-DAGGER的性能,该文基于面向相关性排序任务的OHSUMED数据集和面向多样化排序的TREC数据集进行了实验,实验结果表明IR-DAGGER在上述两个数据集上均提升了文档排序的精度和效率。
-
关键词
排序
模仿学习
强化学习
-
Keywords
learning to rank
imitation learning
reinforcement learning
-
分类号
TP391
[自动化与计算机技术—计算机应用技术]
-