推荐系统 | 常见Bias和Debias的方法

标签: 推荐系统更新于: 2024/08/15 阅读:866 原文发表于：2020-11-20

| 原文发表于 2022-08-26

背景

推荐系统中存在非常多的偏差问题，典型的有：

偏差存在于推荐系统反馈循环的每个阶段中，如下图【摘自网上，如侵必删】所示： avatar

样本层面：TopK样本随机展现，将TopK样本做随机展现。生成无pos bias的样本，把这些样本加到训练模型里，一定程度上降低bias的影响。
模型层面：可以将bias特征单独作为一个塔，最后跟非主塔相乘或者相加来产生最终的输出并计算loss，如谷歌YouTuBe的视频多任务中的MMoE解法。
特征层面：如果特征是动态的统计特征，可以在特征统计的层面引入de bias. 比如将点展比升级为点检比。两者的区别是：假如展现了5条结果，用户最后一条点击的结果是第3条结果，则这5条结果的展现全为1，但当考虑exam(检）时，会认为只有前3条结果被exam了，即前3条结果的exam为1，后2条结果的exam为0. 这样算出来的点检比一般会比点展比效果更好一些。