简介
在推荐系统中,用户行为对预测用户响应至关重要,语义 - 时间相关性却常被忽视。研究通过互信息量化该相关性,发现现有模型难以捕捉。为此提出时间兴趣网络(TIN),它采用目标感知时间编码,结合目标感知注意力和目标感知表示实现4路交互以捕捉相关性。在亚马逊和阿里巴巴数据集上,TIN的GAUC分别比最佳基线高出0.43%和0.29%,在线A/B测试中成本提升1.65%,GMV提升1.93%,已成功部署于腾讯微信朋友圈广告平台。
思维导图
研究背景
详细总结
-
研究背景
- 在推荐系统里,用户行为是预测用户响应的关键特征。但以往研究未综合分析行为与目标间的语义-时间相关性。
-
语义-时间相关性分析
- 量化方法:在亚马逊数据集上,通过互信息定义类别感知目标相关性(CTC)来量化语义-时间相关性。发现存在语义模式(同类别行为相关性高)和时间衰减模式(近期行为相关性强)。
- 现有模型分析:研究选取DIN、SASRec和BST等模型,发现它们均无法很好地捕捉语义-时间模式。如DIN忽略时间信息,SASRec和BST在语义相关性捕捉上存在不足。
-
时间兴趣网络(TIN)
- 模型架构:采用Embedding & MLP范式,通过时间兴趣模块(TIM)处理用户行为特征。
-
关键组件
- 目标感知时间编码(TTE):基于相对位置(TTE-P)或时间间隔(TTE-T)编码行为时间信息,相比其他编码方法更具优势。
- 目标感知注意力(TA)和目标感知表示(TR):TA计算行为重要性,TR形成二阶表示,两者相乘实现4路交互,捕捉语义-时间相关性。
-
实验结果
- 数据集实验:在亚马逊和阿里巴巴数据集上,与多种基线模型对比,TIN的GAUC分别达到0.8629和0.6144,比最佳基线分别高出0.43%和0.29%。
- 消融实验:去掉TTE、TA、TR组件,模型性能均下降,表明各组件对捕捉语义-时间相关性很重要。
- 在线A/B测试:应用于腾讯微信朋友圈广告,相比基线,成本提升1.65%,GMV提升1.93% 。
-
应用部署:TIN已成功部署在腾讯微信朋友圈广告平台,为广告投放提供支持。
数据集 | 对比模型 | 指标 | TIN结果 | 最佳基线结果 | 提升幅度 |
---|---|---|---|---|---|
亚马逊 | DSIN | GAUC | 0.8629 | - | 0.43% |
阿里巴巴 | DIN | GAUC | 0.6144 | - | 0.29% |
腾讯微信朋友圈广告 | 基线 | 成本提升 | 1.65% | - | - |
腾讯微信朋友圈广告 | 基线 | GMV提升 | 1.93% | - | - |
关键问题
-
TIN与现有模型相比,在捕捉语义-时间相关性上有何创新?
- 答案:TIN采用目标感知时间编码(TTE),能同时考虑行为和目标的时间信息。通过目标感知注意力(TA)和目标感知表示(TR)实现4路交互,而现有模型大多只能进行2阶或3阶交互,无法有效捕捉语义-时间相关性。
-
在不同数据集上,TIN的性能表现有何差异?
- 答案:在亚马逊数据集上,TIN的GAUC为0.8629,比最佳基线DSIN高出0.43%;在阿里巴巴数据集上,TIN的GAUC为0.6144,比最佳基线DIN高出0.29%。差异原因在于两个数据集行为的时间特性不同,亚马逊数据集时间范围广,TTE-T在该数据集更有效;阿里巴巴数据集行为时间范围窄,TTE-P更合适。
-
TIN中各组件对模型性能有怎样的影响?
- 答案:TIN的目标感知时间编码(TTE)、目标感知注意力(TA)和目标感知表示(TR)都很关键。去掉TTE,在亚马逊数据集GAUC下降9.9e-3 ,在阿里巴巴数据集下降1.5e-3;去掉TA,在亚马逊和阿里巴巴数据集分别下降7.3e-3和8.1e-3;去掉TR,在两个数据集分别下降6.1e-3和2.7e-3。