摘要
在推荐或广告系统中,召回阶段扮演着快速从大量的候选集中挑选出较为合适的物品Item集合,作为下一阶段精排的准入,从而起到在较为贴合用户兴趣的基础上,缓解精排的计算压力的作用,故召回阶段面临的候选集数量通常非常大,一般在几百万至上亿规模。此时,在训练召回模型时,采样便成了很重要的问题,尤其是负采样,一般情况下,训练召回模型时,会做随机负采样,由于召回模型负样本的不置信问题,采到的负样本有可能并不是真负样本,导致影响了模型的训练效果。针对此问题,本文提出了一个基于双塔模型的Pairwise训练策略,利用度量学习的思想规避召回模型负采样过程中负样本不置信的问题,不直接针对负样本判别真假,而是学习样本对之间的差距,提升模型学习精度与效率。
出处
《中国新通信》
2023年第11期34-36,共3页
China New Telecommunications