直接优化性能指标的多排序模型融合方法被引量：3

Multiple Rank Aggregation Based on Directly Optimizing Performance Measure

下载PDF

导出

摘要现有排序学习算法忽视了查询之间的差异,在建立排序模型的过程中等同对待训练样本集中的所有查询及其相关文档,影响了排序模型的性能.文中描述了查询之间的差异,并在训练过程中考虑查询之间的差异,提出了一种基于有监督学习的多排序模型融合方法.这种方法首先使用每一个查询及其相关文档训练出子排序模型,并将每一个子排序模型的输出转化为体现查询差异的特征数据,使用监督学习方法,实现了多排序模型的融合.更进一步,针对排序问题的特性,文中提出了一种直接优化排序性能的融合函数融合子排序模型,使用梯度上升方法优化其下界函数.文中证明了直接优化排序性能的融合函数融合子排序模型的性能优于子排序模型线性合并的性能.基于较大规模真实数据应用的实验结果表明,直接优化性能指标的多排序模型融合方法可以比传统排序学习模型具有更好的排序性能. In ranking for document retrieval,queries often vary greatly from one to another.Most of the existing approaches treat the losses from different queries as the same.We find out that using a supervised rank aggregation function could further improve the ranking performance.In this paper,the differences among queries are taken into consideration,and a supervised rank aggregation framework based on query similarity is proposed.This approach sets up a number of base rankers based on each query and its relevant documents,and then employs a supervised aggregation function to train the weights for these base rankers.We propose an aggregation function which is directly optimizing performance measure NDCG,referred to as RankAgg.NDCG.We prove that RankAgg.NDCG can achieve better performance than the linear combination of the base rankers.Experimental results performed on real world datasets show our approach outperforms conventional ranking approaches.

作者王扬黄亚楼卢敏庞晓东谢茂强刘杰

机构地区南开大学信息技术科学学院国家电网天津市电力公司信息通信公司中国民航大学计算机科学与技术学院南开大学软件学院

出处《计算机学报》 EI CSCD 北大核心 2014年第8期1658-1668,共11页 Chinese Journal of Computers

基金国家自然科学基金(60673009 61105049) 国家"八六三"高技术研究发展计划项目基金(2011AA05A117) 高等学校博士学科点专项科研基金博士生导师类项目(65010571) 天津市电力公司科技项目(KJ14-1-10)资助~~

关键词排序模型融合直接优化性能指标排序学习信息检索 rank aggregation directly optimizing performance measure learning to rank information retrieval

分类号 TP391 [自动化与计算机技术—计算机应用技术]

引文网络
相关文献

参考文献2

1徐君,曹云波,李航,赵珉,黄亚楼.A Supervised Learning Approach to Search of Definitions[J].Journal of Computer Science & Technology,2006,21(3):439-449. 被引量：1
2王扬,黄亚楼,谢茂强,刘杰,卢敏,廖振.多查询相关的排序支持向量机融合算法[J].计算机研究与发展,2011,48(4):558-566. 被引量：7

二级参考文献56

1丁国栋,白硕,王斌.文本检索的统计语言建模方法综述[J].计算机研究与发展,2006,43(5):769-776. 被引量：19
2Burges C, Shaked T, Renshaw E, et al. I.earning to rank using gradient descent [C] //Proc of ACM ICML2005. New York: ACM, 2005:89-96.
3Cao Z, Qin T, Liu T, et al. Learning to rank: From pairwise approach to listwise approach [C] //Proe of ACM ICML2007. New York: ACM, 2007.
4Qin T, Zhang X, Tsai M, et al. Query level loss functions for information retrieval [J]. Journal of Information Processing and Management, 2008, 44(2): 838-855.
5Xia F, Liu T, Wang J, et al. Listwise approach to learning to rank--theory and algorithm [C] //Proc of ACM ICML2008. New York: ACM, 2008:1192-1199.
6Xu J, Li H. AdaRank: A boosting algorithm for information retrieval [C] //Proc of ACM SIGIR2007. New York: ACM, 2007:391-398.
7Geng X, Liu T, Qin T, using K nearest neighbor New York: ACM, 2008: et al. Query dependent ranking [C]//Proe of ACM SIGIR2008. 115-122.
8Platt J. Fast Training of Support Vector Machines Using Sequential "Minimal Optimization [M]. Cambridge, MA: MIT Press, 1998.
9Liu T, Xu J, Qin T, et al. LETOR: Benchmark dataset for research on learning to rank for information retrieval [C] // Proc of ACM SIGIR2007. New York:ACM, 2007: 3-10.
10Hersh W, Buekley C, Leone T, et al. OHSUMED.. An interactive retrieval evaluation and new large test collection for research [C] //Proc of ACM SIGIR1994. New York:ACM, 1994:192-201.

共引文献6

1罗海霞,冯剑琳.一种基于排列融合的归纳式半监督排序方法[J].计算机研究与发展,2011,48(S3):189-196.
2彭泽武,汤庸,罗海霞,潘炎.基于对象相关性的全监督和直推式排序算法[J].计算机研究与发展,2012,49(6):1256-1263.
3胡小生,钟勇.一种两层加权融合的排序算法[J].计算机应用,2012,32(12):3331-3334.
4蔡国欣.二阶段法凸壳支持向量机的研究与应用[J].煤炭技术,2013,32(5):200-202. 被引量：2
5徐曜,赵政文,陈群,刘海龙,杜晶,胡嘉琪,李战怀.一种基于图结构的Web实体排序方法[J].计算机科学,2014,41(5):219-222.
6朱亚辉,黄襄念.SVM方法在模式识别应用领域中的发展与研究[J].现代计算机,2015,21(4):20-24. 被引量：3

同被引文献20

1赵保卿,李娜.基于层次分析法的内部审计外包内容决策研究[J].审计与经济研究,2013,28(1):37-45. 被引量：61
2胡小鹏,陆能枝.案例推理系统中欧式距离检索算法的改进[J].计算机与数字工程,2007,35(12):35-37. 被引量：3
3徐俊,刘娜.层次分析法的基本思想与实际应用[J].情报探索,2008(12):113-115. 被引量：79
4翁嘉明,刘东,何维国,杨滨,黄玉辉.基于层次分析法的配电网运行方式多目标优化[J].电力系统自动化,2012,36(4):56-61. 被引量：46
5梁旭明,张平,常勇.高压直流输电技术现状及发展前景[J].电网技术,2012,36(4):1-9. 被引量：373
6邓雪,李家铭,曾浩健,陈俊羊,赵俊峰.层次分析法权重计算方法分析及其应用研究[J].数学的实践与认识,2012,24(7):93-100. 被引量：2052
7朱旭锋,马彩文,刘波.采用改进词袋模型的空中目标自动分类[J].红外与激光工程,2012,41(5):1384-1388. 被引量：7
8周孝信,鲁宗相,刘应梅,陈树勇.中国未来电网的发展模式和关键技术[J].中国电机工程学报,2014,34(29):4999-5008. 被引量：447
9黄世华,杨兆兰.数学建模竞赛论文的撰写方法[J].甘肃科技,2015,31(7):67-68. 被引量：4
10王小君,毕圣,徐云鹍,孙月嘉.基于数据挖掘技术和支持向量机的短期负荷预测[J].电测与仪表,2016,53(10):62-67. 被引量：35

引证文献3

1黄霖霖,屈嘉宸,张梦瑶,林丽.基于内容的推荐算法在交通信号配时中的应用[J].物流工程与管理,2019,41(10):124-127.
2刘彤,李少岩,顾雪平,王铁强,吴一敌,王维.基于文本挖掘的电网检修工作票辅助决策方法研究[J].电测与仪表,2020,57(2):39-45. 被引量：22
3王诚.基于离散优化的LP汽车总装线的配置模型研究[J].中国建材科技,2019,0(4):87-89. 被引量：1

二级引证文献23

1王雪.数学建模在高职汽车类专业中的应用研究--以汽车装配顺序优化为例[J].武汉交通职业学院学报,2020,22(2):113-117. 被引量：1
2赵昂,王洪涛,赵军,梁钢,邓睿智.智能变电站二次回路三维建模及全景可视化研究[J].电气技术,2020,21(12):49-55. 被引量：12
3袁彰.基于自然语言处理技术及智能成票规则的配网工作票系统[J].电子元器件与信息技术,2021,5(2):190-192. 被引量：4
4黎颖,刘晶,易满成,彭政,马逢强,俞思帆,黄薇蓉,徐炫东,刘健欣.基于历史票联想的电网工作票智能填写与校验方法研究[J].电子制作,2021,29(19):54-56. 被引量：1
5戴志辉,刘兵成,方伟,陈曦,张雷.基于风险和检修收益的继电保护设备检修决策方法[J].电测与仪表,2021,58(12):149-154. 被引量：8
6叶华,赵明,王国平,赵川.卷积神经网络的电力检修票智能识别研究[J].自动化技术与应用,2022,41(1):97-101. 被引量：5
7宋立华.基于信息抽取的电网缺陷文本挖掘系统设计[J].电子设计工程,2022,30(3):31-34.
8黎颖,彭政,刘晶,易满成,李卓坚,黄薇蓉,俞思帆,徐炫东,刘健欣.工作票智能办票模块设计与运用[J].电工材料,2022(2):11-13. 被引量：1
9翟小静.基于RFID技术的电子图书资源检索方法[J].现代电子技术,2022,45(11):99-103. 被引量：2
10赵福有,陈伟,王以波,张浩榛,张晓思.基于文本挖掘的电力调度协议处理探究[J].电气技术与经济,2022(3):163-165.

1Xiubo GENG Xue-Qi CHENG.Learning multiple metrics for ranking[J].Frontiers of Materials Science,2011,5(3):259-267.
2蒋中.遗传算法在PID参数优化中的应用[J].安徽建筑工业学院学报（自然科学版）,2000,8(1):54-57. 被引量：1
3姜雅文,贾彩燕,于剑.基于类原型的复杂网络重叠社区发现方法[J].模式识别与人工智能,2013,26(7):648-659. 被引量：5
4周扬,张恒生.Hadoop系统map阶段的排序性能分析与优化[J].电脑知识与技术,2014(3):1410-1412.
5汪勇,秦沛.ZigBee的制造执行系统优化[J].煤炭技术,2010,29(6):233-234. 被引量：1
6程凡,杨康,周源,江进龙.一种面向不平衡数据集的直接优化G-TP/PR算法[J].小型微型计算机系统,2016,37(12):2690-2694.
7李新忠,简林柯,何钺.基于神经网络的直接优化控制[J].机械工业自动化,1997,19(2):24-29.
8周旭东,陈晓红,陈松灿.增强组合特征判别性的典型相关分析[J].模式识别与人工智能,2012,25(2):285-291. 被引量：8
9梁天培,周其节,毛宗源,于德江.模糊控制器的优化设计方法[J].控制理论与应用,1995,12(4):491-497. 被引量：7
10黄丹,王志海,刘海洋.一种局部协同过滤的排名推荐算法[J].山东大学学报（工学版）,2016,46(5):29-36.

计算机学报

2014年第8期

浏览历史

内容加载中请稍等...

直接优化性能指标的多排序模型融合方法被引量：3

参考文献2

二级参考文献56

共引文献6

同被引文献20

引证文献3

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

直接优化性能指标的多排序模型融合方法 被引量：3

参考文献2

二级参考文献56

共引文献6

同被引文献20

引证文献3

二级引证文献23

相关作者

相关机构

相关主题

浏览历史

直接优化性能指标的多排序模型融合方法被引量：3