基于ListNet排序学习的特征处理方法被引量：2

A Feature Processing Method Based on Ranking Algorithm ListNet

下载PDF

导出

摘要排序学习(learning to rank)是一种机器学习与信息检索的交叉学科,可以从大量的包含标记的训练集中自动学习排序模型。特征选取对于排序模型的预测结果有很大的影响,而排序学习对其特征领域的研究却很少。针对这一问题,提出一种特征处理方法:利用基于主成分分析(PCA)的特征重组方法扩展数据集,然后在扩展后的数据集上进行排序算法隐含的特征选择。在LETOR4.0数据集(MQ2007,MQ2008)上基于排序评测函数对List Net排序算法进行验证。通过对比特征处理前后的排序性能差异,以及添加新特征的个数对排序结果的影响,实验结果表明,经过特征处理的利用排序学习算法构建的排序函数一般要优于原始的排序函数。 Learning to rank is an interdisciplinary of machine learning and information retrieval and learns ranking model automaticallyfrom given training data set. The feature space has a great influence on the performance of learning to rank approach,however,there area little research in terms of feature generation. For this,we propose one feature analysis method which extends data set by feature recom-bination based on PCA,and then performs feature selection implied by learning to rank methods on the extended data set. We evaluateranking algorithm ListNet on the LETOR4. 0 （MQ2007,MQ2008） data set based on ranking evaluation index,and experimentally com-pare the performance of ListNet using the data set with new feature vectors and not,as well as the impact of the number of the new fea-tures added to the result of sort. The experiment shows that ranking functions learned through learning to rank method based on the fea-ture analysis methods outperform the original ones.

作者李伟宁王磊 LI Wei-ning;WANG Lei(School of Computer,Nanjing University of Posts and Telecommunications,Nanjing 210003,China;School of Electronic Science and Engineering,Nanjing University of Posts and Telecommunications,Nanjing 210003,China)

机构地区南京邮电大学计算机学院南京邮电大学电子科学与工程学院

出处《计算机技术与发展》 2018年第9期30-33,37,共5页 Computer Technology and Development

基金国家"863"高技术发展计划项目(2006AA01Z201)

关键词信息检索排序学习特征处理 ListNet information retrieval learning to rank feature selection ListNet

分类号 TP301 [自动化与计算机技术—计算机系统结构]

引文网络
相关文献

参考文献5

1李敏,卡米力.木依丁.特征选择方法与算法的研究[J].计算机技术与发展,2013,23(12):16-21. 被引量：23
2黄震华,张佳雯,田春岐,孙圣力,向阳.基于排序学习的推荐算法研究综述[J].软件学报,2016,27(3):691-713. 被引量：110
3印鉴,王智圣,李琪,苏伟杰.基于大规模隐式反馈的个性化推荐[J].软件学报,2014,25(9):1953-1966. 被引量：58
4奚凌然,王小平.一种结合LPA半监督学习的排序学习算法[J].计算机应用与软件,2016,33(1):286-290. 被引量：3
5程凡,李龙澍.基于Listwise的新型排序算法[J].计算机工程,2011,37(23):165-167. 被引量：3

二级参考文献42

1陈健,印鉴.基于影响集的协作过滤推荐算法[J].软件学报,2007,18(7):1685-1694. 被引量：59
2Herbrich R, Grapel T, Obermayer K. Large Margin Rank Boundaries for Ordinal Regression[M]. Cambridge, USA: MIT Press, 2000: 115-132.
3Joachims T. Optimizing Search Engines Using Click Through Data[C]//Proc. of Conference on Knowledge Discovery and Data Mining. Edmonton, Canda: ACM Press, 2002:134-142.
4Cao Zhe, Qin Tao, Liu Tieyan, et al. Learning to Rank: From Pairwise Approach to Listwise Approach[C]//Proc. of ICML'07. Corvallis, USA: [s. n.], 2007: 129-136.
5Qin Tao, Zhang Xudong. Query-level Loss Functions for Information Retrieval[J]. Information Processing & Management, 2007, 44(2): 838-855.
6Teo Choon-Hui, Smola A, Vishwanathan S V N. A Scalable Modular Convex Solver for Regularized Risk Minimization[C]// Proc. of International Conference on Knowledge Discovery and Data Mining. San Jose, California, USA: [s. n.], 2007: 48-57.
7吴佳金,杨志豪,林原,等.基于改进Pairwise损失函数的排序学习方法[C]//第六届全国信息检索学术会议论文集,2010.
8Azizi A. Efficient IRIS recognition through improvement of fea-ture extraction and subset selection [ J ]. International journalof computer science and information security ,2009,2( 1) :72-73.
9Yu Lei, Liu Huan. Efficient feature selection via analysis ofrelevance and redundancy [ J ]. Machine learning research,2004,5(1):1207-1220.
10Hall M A,Smith L A. Feature subset selection: A correlationbased filter approach [ C ] //Proc of international conference onneural information processing. [ s. 1. ] : [ s. n. ] ,1997 :2-4.

共引文献190

1刘逸竹,李晴,吴文斌.遥感提取灌溉耕地的特征优选——以中国北方为例[J].中国农业资源与区划,2021,42(9):27-35. 被引量：2
2赖奕安,张玉洁,杜雨露,孟祥武.一种基于协同上下文关系学习的同城活动推荐算法[J].软件学报,2020,31(2):421-438. 被引量：5
3刘美博,满君丰,彭成,刘鸣.引入隐式反馈的多维度推荐算法[J].计算机应用研究,2020,37(1):158-162. 被引量：2
4黄贤英,阳安志,刘小洋,刘广峰.融合兴趣的微博用户相似度计算研究[J].计算机应用研究,2020,37(1):66-70. 被引量：1
5仲秋雁,李晨,崔少泽.考虑工人参与意愿影响因素的竞争式众包任务推荐方法[J].系统工程理论与实践,2018,38(11):2954-2965. 被引量：7
6刘飞飞.特征选择算法及应用综述[J].办公自动化,2018,23(21):47-49. 被引量：4
7张瑜烨,郑幼东,张诗琪.信息茧房:智媒时代个性化推荐系统运作逻辑与反思——以今日头条APP为例[J].现代视听,2018(11):18-24. 被引量：11
8石慧,贾代平,苗培.基于词频信息的改进信息增益文本特征选择算法[J].计算机应用,2014,34(11):3279-3282. 被引量：16
9梁俊杰,孙阳征.基于PH-Tree多属性索引树的朋友推荐算法[J].计算机科学,2015,42(4):156-159. 被引量：2
10郭宇红,杨金然.一种基于AHP的智能电影推荐方法[J].南京邮电大学学报（自然科学版）,2015,35(3):97-105. 被引量：6

同被引文献15

1吕雪骥,李龙澍.FP-Growth算法MapReduce化研究[J].计算机技术与发展,2012,22(11):123-126. 被引量：18
2刘英梅,刘赛红.都柏林核心元数据及其应用[J].情报科学,2000,18(6):572-574. 被引量：16
3印鉴,王智圣,李琪,苏伟杰.基于大规模隐式反馈的个性化推荐[J].软件学报,2014,25(9):1953-1966. 被引量：58
4王微怡,袁学勇,刘俐,刘继昌.基于Apriori聚类算法的快递服务衍生项目关联分析[J].物流技术,2015,34(5):124-126. 被引量：1
5刘俊,刘瑜,何友,孙顺.杂波环境下基于全邻模糊聚类的联合概率数据互联算法[J].电子与信息学报,2016,38(6):1438-1445. 被引量：57
6余永红,高阳,王皓.基于Ranking的泊松矩阵分解兴趣点推荐算法[J].计算机研究与发展,2016,53(8):1651-1663. 被引量：17
7孔欣欣,苏本昌,王宏志,高宏,李建中.基于标签权重评分的推荐模型及算法研究[J].计算机学报,2017,40(6):1440-1452. 被引量：37
8李冰,赵之年,吴迪,陈应东.基于空间数据库的多源异构卫星数据一体化管理研究[J].测绘与空间地理信息,2017,40(12):96-100. 被引量：8
9徐博,林鸿飞,林原,许侃.一种融合语义资源的生物医学查询理解方法[J].计算机学报,2019,42(10):2160-2174. 被引量：5
10Zhi-Guang Chen,Yu-Bo Liu,Yong-Feng Wang,Yu-Tong Lu.A GPU-Accelerated In-Memory Metadata Management Scheme forLarge-Scale Parallel File Systems[J].Journal of Computer Science & Technology,2021,36(1):44-55. 被引量：1

引证文献2

1张进,孙福振,王绍卿,徐上上.融合社交关系与代价敏感的兴趣点推荐算法[J].山东理工大学学报（自然科学版）,2021,35(4):6-10.
2吴文炤,李炳森,聂玲,程红星,梁子寒.基于人工智能的元数据关系研究[J].电力信息与通信技术,2022,20(9):43-50. 被引量：3

二级引证文献3

1杨亚红,孙岩,余党会.人工智能对学术期刊3个重要出版环节的影响[J].编辑学报,2024,36(1):88-92. 被引量：9
2秦丽娟,吴恩政,赵逸君,王冕,高云,黄家凯.地质数据湖数据存储架构与统一元数据实现[J].自然资源信息化,2024(4):19-26. 被引量：1
3武鹏,王刘杨,刘兆年,李为冲,沈晖.基于勘探开发数据湖的数据治理变更影响分析方法[J].中国海上油气,2024,36(6):225-231.

1李金忠,刘关俊,闫春钢,蒋昌俊.排序学习研究进展与展望[J].自动化学报,2018,44(8):1345-1369. 被引量：9
2阿碧.人脑能和电脑融合吗[J].财会月刊,2015(1):4-4.
3苏律文,杨侃,邓丽丽.基于健康江湖关系的长江中游库群多目标优化调度研究[J].中国农村水利水电,2018(1):33-39. 被引量：6
4熊李艳,陈晓霞,钟茂生,黄晓辉.基于PairWise排序学习算法研究综述[J].科学技术与工程,2017,17(21):184-190. 被引量：6
5乌佳伟,梁靖.学习动机与学业成绩对大学生职业生涯规划影响的研究[J].科教文汇,2018(27):41-42. 被引量：3
6刘薇.三角恒等变换中“1”的应用[J].中学数学教学参考,2018,0(4X):36-37.
7田康健,晋良海,边星,郑霞忠.面向时间参数约束的非消耗性施工资源调度模型[J].人民珠江,2018,39(6):67-70. 被引量：1
8陶虹平.非威胁性攻击下网络目标节点毁伤评估仿真[J].计算机仿真,2018,35(3):357-360. 被引量：1
9本刊讯.ImageAI:十行代码解决目标检测[J].数据分析与知识发现,2018,2(7):71-71.
10张雅妮.基于热备份的双余度嵌入式系统的容错设计[J].西北工业大学学报,2017,35(S1):120-123. 被引量：5

计算机技术与发展

2018年第9期

浏览历史

内容加载中请稍等...

基于ListNet排序学习的特征处理方法被引量：2

参考文献5

二级参考文献42

共引文献190

同被引文献15

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于ListNet排序学习的特征处理方法 被引量：2

参考文献5

二级参考文献42

共引文献190

同被引文献15

引证文献2

二级引证文献3

相关作者

相关机构

相关主题

浏览历史

基于ListNet排序学习的特征处理方法被引量：2