论文地址:[2306.03392] Tree based Progressive Regression Model for Watch-Time Prediction in Short-video Recommendation

“Tree based Progressive Regression Model for Watch-Time Prediction in Short-video Recommendation”提出一种基于树的渐进回归模型(TPM)用于短视频推荐中的观看时长预测,有效解决了现有方法存在的忽视序关系、条件依赖、预测不确定性和偏差放大等问题,通过离线和在线实验验证了TPM的有效性,目前已在快手APP上线。

  1. 研究背景:在线视频服务和短视频平台发展迅速,用户观看推荐视频的时长成为反映用户参与度的关键指标,准确预测观看时长对提升用户参与度至关重要。但观看时长预测存在诸多难点,如序关系建模、捕捉观看行为的条件依赖、考虑预测不确定性和避免偏差放大等,现有方法(如WLR、D2Q)无法同时解决这些问题。

  2. 相关工作

    • 观看时长预测:WLR将观看时长预测视为二分类问题,存在偏差问题;D2Q通过分桶减轻时长偏差,但忽略序关系和依赖。两者均未考虑预测不确定性。
    • 序回归:用于预测有序标签,尚未应用于观看时长预测,且与TPM中条件依赖的二分类问题有本质区别。
    • 基于树的神经网络推荐:LambdaMART在排序任务有竞争力,神经网络能处理复杂特征,但两者结合的研究较少。TDM与TPM目的、结构使用方式不同。
    • 去偏推荐:主要包括逆倾向评分、因果嵌入和因果干预(如随机化和后门调整)。因果干预中的后门调整可用于观看时长预测去偏,且能融入TPM。
  3. 基于树的渐进回归模型(TPM)

    • 模型公式:将观看时长量化为有序等级,把预测问题转化为沿树从根节点到叶节点的搜索过程,树由节点和分类器组成。预测的观看时长服从多项分布,通过计算多项分布概率得到期望观看时长。
    • 树的构建:根据任务和数据集设计树结构,为平衡标签分布,计算观看时长分位数作为有序等级,构建平衡二叉树,使每个非叶节点的分类器标签分布均衡。
    • 不确定性建模:TPM将观看时长视为多项分布的随机变量,计算预测的方差并加入目标函数,以最小化预测不确定性。
    • 训练过程:目标函数包含分类误差、预测方差和回归误差,训练时将样本关联到相应路径的分类器,通过最小化目标函数更新分类器。
    • 结合后门调整:通过构建基于混杂因子分布的树并按组拆分样本训练分类器,实现后门调整去偏,有效避免偏差放大。
    • 模型架构:采用多层感知器作为分类器骨干结构,通过共享隐藏层参数和引入任务特定输出层,减少模型大小,适用于实际环境。
  4. 实验

    • 实验设置:采用快手和CIKM16公共数据集,选择WLR、D2Q和序回归作为对比方法,使用MAE和XAUC评估指标。
    • 离线实验:TPM在MAE和XAUC指标上优于其他方法;消融实验表明,添加均方误差损失、方差约束和考虑去偏因素分别有助于提升模型性能。改变持续时间分组数、树节点数和方差权重的实验,为模型调优提供了依据。
    • 在线实验:在快手APP进行A/B实验,以D2Q为基线。TPM在观看时长相关指标上表现更优,负面反馈更少,验证了其在实际推荐系统中的有效性。
  5. 结论:TPM通过将观看时长预测分解为条件依赖的分类问题,引入预测方差和后门调整,有效解决了观看时长预测中的关键问题,在离线评估和在线实验中表现出色,已成功部署在快手APP。