简介

在推荐系统中,用户行为对预测用户响应至关重要,语义 - 时间相关性却常被忽视。研究通过互信息量化该相关性,发现现有模型难以捕捉。为此提出时间兴趣网络(TIN),它采用目标感知时间编码,结合目标感知注意力目标感知表示实现4路交互以捕捉相关性。在亚马逊和阿里巴巴数据集上,TIN的GAUC分别比最佳基线高出0.43%和0.29%,在线A/B测试中成本提升1.65%,GMV提升1.93%,已成功部署于腾讯微信朋友圈广告平台。

思维导图

image_2025-03-31_20-47-06.jpg

研究背景

详细总结

  1. 研究背景

    • 在推荐系统里,用户行为是预测用户响应的关键特征。但以往研究未综合分析行为与目标间的语义-时间相关性。
  2. 语义-时间相关性分析

    • 量化方法:在亚马逊数据集上,通过互信息定义类别感知目标相关性(CTC)来量化语义-时间相关性。发现存在语义模式(同类别行为相关性高)和时间衰减模式(近期行为相关性强)。
    • 现有模型分析:研究选取DIN、SASRec和BST等模型,发现它们均无法很好地捕捉语义-时间模式。如DIN忽略时间信息,SASRec和BST在语义相关性捕捉上存在不足。
  3. 时间兴趣网络(TIN)

    • 模型架构:采用Embedding & MLP范式,通过时间兴趣模块(TIM)处理用户行为特征。
    • 关键组件

      • 目标感知时间编码(TTE):基于相对位置(TTE-P)或时间间隔(TTE-T)编码行为时间信息,相比其他编码方法更具优势。
      • 目标感知注意力(TA)和目标感知表示(TR):TA计算行为重要性,TR形成二阶表示,两者相乘实现4路交互,捕捉语义-时间相关性。
  4. 实验结果

    • 数据集实验:在亚马逊和阿里巴巴数据集上,与多种基线模型对比,TIN的GAUC分别达到0.8629和0.6144,比最佳基线分别高出0.43%和0.29%。
    • 消融实验:去掉TTE、TA、TR组件,模型性能均下降,表明各组件对捕捉语义-时间相关性很重要。
    • 在线A/B测试:应用于腾讯微信朋友圈广告,相比基线,成本提升1.65%,GMV提升1.93% 。
  5. 应用部署:TIN已成功部署在腾讯微信朋友圈广告平台,为广告投放提供支持。

数据集 对比模型 指标 TIN结果 最佳基线结果 提升幅度
亚马逊 DSIN GAUC 0.8629 - 0.43%
阿里巴巴 DIN GAUC 0.6144 - 0.29%
腾讯微信朋友圈广告 基线 成本提升 1.65% - -
腾讯微信朋友圈广告 基线 GMV提升 1.93% - -

关键问题

  1. TIN与现有模型相比,在捕捉语义-时间相关性上有何创新?

    • 答案:TIN采用目标感知时间编码(TTE),能同时考虑行为和目标的时间信息。通过目标感知注意力(TA)和目标感知表示(TR)实现4路交互,而现有模型大多只能进行2阶或3阶交互,无法有效捕捉语义-时间相关性。
  2. 在不同数据集上,TIN的性能表现有何差异?

    • 答案:在亚马逊数据集上,TIN的GAUC为0.8629,比最佳基线DSIN高出0.43%;在阿里巴巴数据集上,TIN的GAUC为0.6144,比最佳基线DIN高出0.29%。差异原因在于两个数据集行为的时间特性不同,亚马逊数据集时间范围广,TTE-T在该数据集更有效;阿里巴巴数据集行为时间范围窄,TTE-P更合适。
  3. TIN中各组件对模型性能有怎样的影响?

    • 答案:TIN的目标感知时间编码(TTE)、目标感知注意力(TA)和目标感知表示(TR)都很关键。去掉TTE,在亚马逊数据集GAUC下降9.9e-3 ,在阿里巴巴数据集下降1.5e-3;去掉TA,在亚马逊和阿里巴巴数据集分别下降7.3e-3和8.1e-3;去掉TR,在两个数据集分别下降6.1e-3和2.7e-3。