疲劳度衡量了用户对商品相应类目在多次曝光后兴趣的变化程度。
可以通过类目曝光次数和点击次数进行建模。
建模方案:
sigir'24「快手」用户疲劳建模|Modeling User Fatigue for Sequential Recommendation
https://zhuanlan.zhihu.com/p/701368641
用于顺序推荐的用户疲劳建模(Modeling User Fatigue for Sequential Recommendation)总结
-
研究背景与动机
- 推荐系统旨在为用户筛选感兴趣的内容,但用户可能对短期内过度相似的推荐产生疲劳,影响用户体验,然而现有推荐器很少探索用户疲劳问题。用户疲劳指用户对短期内接触的相似推荐内容感到厌倦,与推荐系统中的多样性、新颖性等概念不同,其代表用户体验的负面方面,如在短视频平台快手的数据中,同一类别视频的有效观看率(EVTR)会随观看次数增加而显著下降。
- 现有处理用户疲劳的方法存在问题,如使用粗粒度特征(基于项目级和类别级重复),缺乏灵活性和可解释性,且在疲劳建模方面面临特征获取、疲劳对兴趣影响的处理、疲劳信号获取等挑战。
-
问题表述
- 考虑顺序推荐的标准问题,给定用户的历史交互序列,目标是预测用户对目标项目的交互概率,同时需在建模中考虑用户疲劳对兴趣和决策的影响。
-
方法(FRec)
- 整体框架:包含四个模块,即兴趣感知相似性矩阵(Interest - aware Similarity Matrix)、疲劳增强多兴趣融合(Fatigue - enhanced Multi - interest Fusion)、疲劳门控循环单元(Fatigue - gated Recurrent Unit)和疲劳监督对比学习(Fatigue - supervised Contrastive Learning)。
-
兴趣感知相似性矩阵(ISM)
-
为支持用户疲劳建模,需细粒度的目标 - 历史项目相似性。通过自注意力机制从历史序列中提取多兴趣表示,利用提取的多兴趣和项目嵌入构建ISM,衡量目标项目与历史项目在每个用户兴趣方面的相似性,公式为,其中为第个兴趣嵌入。考虑到用户疲劳与目标项目附近的项目最相关,计算相似性特征时仅考虑最近的个项目(为可调整的截断阈值)。
-
疲劳增强多兴趣融合
-
多兴趣嵌入虽能捕捉兴趣多方面,但用户疲劳会影响长期兴趣,需自适应调整。提出基于ISM的疲劳增强多兴趣融合方法,先通过特征交叉(cross networks)处理相似性矩阵以应对疲劳与目标 - 历史相似性的复杂非线性关系及多个近期项目对疲劳的共同影响,然后计算兴趣融合的注意力权重,得到用户的长期兴趣嵌入,公式为,,其中为交叉网络处理后的特征。
-
疲劳门控循环单元(FRU)
-
近期消费项目对用户疲劳有重要影响,通过交叉网络和1D卷积网络处理相似性特征以建模时间用户疲劳,将疲劳表示作为额外特征输入构建GRU的更新和重置门,从而影响短期兴趣的学习,新状态计算公式为 ,其中为第个项目的嵌入,为卷积网络处理后的疲劳表示,初始状态(疲劳增强融合后的长期兴趣嵌入)。
-
疲劳监督对比学习
-
为解决无明确疲劳信号监督表示学习的问题,提出序列增强方法获取疲劳信号用于对比学习。将子序列中个项目替换为目标项目(为目标项目在中的重复次数),基于增强序列计算疲劳预测和,并制定对比损失,其中为第次增强的疲劳值。
-
模型训练
-
预测分数综合考虑用户的长短期兴趣及用户疲劳对目标项目决策的影响,公式为。训练损失为推荐损失和对比损失之和,其中为软最大损失函数,为控制疲劳监督重要性的超参数。
-
实验
-
实验设置
-
使用快手(Kuaishou)、淘宝(Taobao)和工业数据集(Industrial),对用户和项目数量、交互实例数量、平均序列长度等进行统计,采用10 - 核心规则过滤数据并按时间顺序划分训练、验证和测试集。选择多种先进的推荐模型作为基线方法,采用AUC、GAUC、HR@k、NDCG@k和MRR等评估指标,使用Microsoft Recommender基于Tensorflow实现模型,设置优化器、学习率、正则化权重、批量大小等超参数。
-
实验结果与分析
-
整体比较(RQ1):FRec在公共数据集(快手和淘宝)和工业数据集上均显著优于基线模型,在快手数据集上AUC和GAUC分别提升约0.009和0.026,在淘宝数据集上提升0.026和0.019,其他排名指标也有明显改进;建模长短期兴趣或多兴趣的模型性能较好,CLSR表现出色;使用粗粒度相似性特征的DFN在部分指标上优于其基线模型DIN,但仍有提升空间;在工业数据集上,FRec的改进更为显著,这得益于其在处理用户疲劳影响方面的优势。
- 消融研究(RQ2):通过移除疲劳增强多兴趣融合、FRU、交叉网络和对比学习等关键模块进行消融实验,结果表明FRec性能始终优于不完整模型,证明各模块对建模用户疲劳的必要性;不同模块在不同数据集上的重要性有所不同,如在快手数据集上对比学习影响较大,在淘宝数据集上FRU作用更关键。
- 疲劳减少研究(RQ3):在线实验中,将FRec与CLSR在快手平台进行A/B测试7天,涉及数百万用户,FRec在应用使用时长、播放数量、类别多样性和集中度等关键在线指标上有显著提升(约0.1% - 0.4%),减少了用户疲劳感知;离线实验通过推荐案例和定义代理指标分析,表明FRec能避免重复推荐,在用户疲劳影响较大时表现更好,可减少用户疲劳。
- 超参数研究(RQ4):以淘宝数据集为例,研究卷积核大小和截断阈值等关键超参数对模型性能的影响。卷积核大小为1时性能低,较大核尺寸性能更高但过大则下降,表明FRec能有效建模连续消费导致的用户疲劳;截断阈值过短或过长都会导致性能变差,合适的截断阈值有助于获得稳定推荐结果。
-
-
相关工作与结论
- 相关工作:顺序推荐中深度学习广泛应用于建模长短期兴趣,但现有工作很少考虑用户疲劳;已有处理用户疲劳的方法依赖粗粒度特征且设计不够精细,本文则利用细粒度相似性特征并通过对比学习明确预测用户疲劳。
- 结论与展望:提出的FRec通过多兴趣框架建模用户疲劳对长短期兴趣的影响,采用序列增强获取疲劳信号用于对比学习,离线和在线实验证明其有效性;未来将引入疲劳度量作为新维度衡量推荐效果,推动推荐系统研究中疲劳建模的发展。