[2302.11087] A Survey on User Behavior Modeling in Recommender Systems
“A Survey on User Behavior Modeling in Recommender Systems”由 Zhicheng He、Weiwen Liu 等人撰写。随着互联网应用发展,推荐系统至关重要,但用户偏好的显式反馈稀缺,用户行为建模(UBM)成为研究热点。本文对 UBM 研究进行综述,按研究方向分类介绍现有工作,分析各方向的优缺点,并探讨工业应用和未来发展方向,为该领域研究提供全面参考。
-
研究背景与分类
- 推荐系统需从用户行为日志挖掘偏好,因显式反馈少。UBM 旨在提取用户兴趣表示,其核心是从行为历史中提取和建模兴趣,本文将 UBM 方法分为传统 UBM、长序列 UBM、多类型 UBM 和带辅助信息的 UBM 四类。
-
传统 UBM
- 从简单行为序列提取项目依赖关系,限制序列长度。
- 基于 RNN 的方法:如 GRU4Rec 用 GRU 学习会话内行为模式,NARM 结合全局和局部兴趣。
- 基于 CNN 的方法:Caser 把行为视为“图像”,用卷积滤波器学习模式,NextItNet 用生成式 CNN 捕获依赖关系。
- 基于注意力的方法:SASRec 用自注意力识别行为重要性,DIN 自适应学习兴趣表示,DIEN 结合注意力和 GRU 改进。
- 讨论:探索多种网络结构,依赖建模从简单到复杂,更实用。
-
长序列 UBM
- 利用更多用户行为历史,但长序列建模有挑战。
- 记忆增强方法:如 NMRN、RUM 等维护外部记忆存储兴趣表示,HPMN、UIC 等更高效处理长序列。
- 用户行为检索方法:UBR、SIM 等检索相关行为,ETA、SDIM、ADFM 等改进检索过程。
- 讨论:记忆增强法复杂难部署,检索法高效但有信息损失,需权衡。
-
多类型 UBM
- 考虑不同行为类型在建模中的差异。
- 行为类型定义:分宏观(如电商基本行为)、微观(从宏观细分)和跨域行为(结合不同域行为)三类。
- 多行为融合:晚期融合先分别预测再组合,早期融合联合学习,各有优缺点。
- 多行为预测:联合预测有挑战,可采用分离预测模块或 MMoE、PLE 等方法。
- 讨论:三个问题紧密相关,需综合权衡。
-
带辅助信息的 UBM
- 利用行为记录的辅助信息。
- 辅助信息来源:包括时间、项目属性和多模态信息。
- 辅助信息利用:早期简单融合,后来有改进方法,如 NOVA - BERT 利用辅助信息辅助注意力模块,还有采用自监督学习技术。
- 讨论:信息源影响融合过程,需探索高效整合方式。
-
工业实践
- UBM 方法应用场景广,考虑长序列、多类型和辅助信息有性能提升,长序列 UBM 部署较多。
- 计算效率关键,哈希等方法平衡性能和成本,GNN 技术因资源需求大未在线部署。
-
总结与展望
- UBM 取得进展,但面临信息深度融合、高效学习、可解释性和先进技术应用等挑战,是未来研究方向。