[2302.11087] A Survey on User Behavior Modeling in Recommender Systems

image_2024-12-24_11-53-30.jpg

“A Survey on User Behavior Modeling in Recommender Systems”由 Zhicheng He、Weiwen Liu 等人撰写。随着互联网应用发展,推荐系统至关重要,但用户偏好的显式反馈稀缺,用户行为建模(UBM)成为研究热点。本文对 UBM 研究进行综述,按研究方向分类介绍现有工作,分析各方向的优缺点,并探讨工业应用和未来发展方向,为该领域研究提供全面参考。

  1. 研究背景与分类

    • 推荐系统需从用户行为日志挖掘偏好,因显式反馈少。UBM 旨在提取用户兴趣表示,其核心是从行为历史中提取和建模兴趣,本文将 UBM 方法分为传统 UBM、长序列 UBM、多类型 UBM 和带辅助信息的 UBM 四类。
  2. 传统 UBM

    • 从简单行为序列提取项目依赖关系,限制序列长度。
    • 基于 RNN 的方法:如 GRU4Rec 用 GRU 学习会话内行为模式,NARM 结合全局和局部兴趣。
    • 基于 CNN 的方法:Caser 把行为视为“图像”,用卷积滤波器学习模式,NextItNet 用生成式 CNN 捕获依赖关系。
    • 基于注意力的方法:SASRec 用自注意力识别行为重要性,DIN 自适应学习兴趣表示,DIEN 结合注意力和 GRU 改进。
    • 讨论:探索多种网络结构,依赖建模从简单到复杂,更实用。
  3. 长序列 UBM

    • 利用更多用户行为历史,但长序列建模有挑战。
    • 记忆增强方法:如 NMRN、RUM 等维护外部记忆存储兴趣表示,HPMN、UIC 等更高效处理长序列。
    • 用户行为检索方法:UBR、SIM 等检索相关行为,ETA、SDIM、ADFM 等改进检索过程。
    • 讨论:记忆增强法复杂难部署,检索法高效但有信息损失,需权衡。
  4. 多类型 UBM

    • 考虑不同行为类型在建模中的差异。
    • 行为类型定义:分宏观(如电商基本行为)、微观(从宏观细分)和跨域行为(结合不同域行为)三类。
    • 多行为融合:晚期融合先分别预测再组合,早期融合联合学习,各有优缺点。
    • 多行为预测:联合预测有挑战,可采用分离预测模块或 MMoE、PLE 等方法。
    • 讨论:三个问题紧密相关,需综合权衡。
  5. 带辅助信息的 UBM

    • 利用行为记录的辅助信息。
    • 辅助信息来源:包括时间、项目属性和多模态信息。
    • 辅助信息利用:早期简单融合,后来有改进方法,如 NOVA - BERT 利用辅助信息辅助注意力模块,还有采用自监督学习技术。
    • 讨论:信息源影响融合过程,需探索高效整合方式。
  6. 工业实践

    • UBM 方法应用场景广,考虑长序列、多类型和辅助信息有性能提升,长序列 UBM 部署较多。
    • 计算效率关键,哈希等方法平衡性能和成本,GNN 技术因资源需求大未在线部署。
  7. 总结与展望

    • UBM 取得进展,但面临信息深度融合、高效学习、可解释性和先进技术应用等挑战,是未来研究方向。