论文：A Survey on User Behavior Modeling in Recommender Systems

[2302.11087] A Survey on User Behavior Modeling in Recommender Systems

“A Survey on User Behavior Modeling in Recommender Systems”由 Zhicheng He、Weiwen Liu 等人撰写。随着互联网应用发展，推荐系统至关重要，但用户偏好的显式反馈稀缺，用户行为建模（UBM）成为研究热点。本文对 UBM 研究进行综述，按研究方向分类介绍现有工作，分析各方向的优缺点，并探讨工业应用和未来发展方向，为该领域研究提供全面参考。

研究背景与分类
- 推荐系统需从用户行为日志挖掘偏好，因显式反馈少。UBM 旨在提取用户兴趣表示，其核心是从行为历史中提取和建模兴趣，本文将 UBM 方法分为传统 UBM、长序列 UBM、多类型 UBM 和带辅助信息的 UBM 四类。
传统 UBM
- 从简单行为序列提取项目依赖关系，限制序列长度。
- 基于 RNN 的方法：如 GRU4Rec 用 GRU 学习会话内行为模式，NARM 结合全局和局部兴趣。
- 基于 CNN 的方法：Caser 把行为视为“图像”，用卷积滤波器学习模式，NextItNet 用生成式 CNN 捕获依赖关系。
- 基于注意力的方法：SASRec 用自注意力识别行为重要性，DIN 自适应学习兴趣表示，DIEN 结合注意力和 GRU 改进。
- 讨论：探索多种网络结构，依赖建模从简单到复杂，更实用。
长序列 UBM
- 利用更多用户行为历史，但长序列建模有挑战。
- 记忆增强方法：如 NMRN、RUM 等维护外部记忆存储兴趣表示，HPMN、UIC 等更高效处理长序列。
- 用户行为检索方法：UBR、SIM 等检索相关行为，ETA、SDIM、ADFM 等改进检索过程。
- 讨论：记忆增强法复杂难部署，检索法高效但有信息损失，需权衡。
多类型 UBM
- 考虑不同行为类型在建模中的差异。
- 行为类型定义：分宏观（如电商基本行为）、微观（从宏观细分）和跨域行为（结合不同域行为）三类。
- 多行为融合：晚期融合先分别预测再组合，早期融合联合学习，各有优缺点。
- 多行为预测：联合预测有挑战，可采用分离预测模块或 MMoE、PLE 等方法。
- 讨论：三个问题紧密相关，需综合权衡。
带辅助信息的 UBM
- 利用行为记录的辅助信息。
- 辅助信息来源：包括时间、项目属性和多模态信息。
- 辅助信息利用：早期简单融合，后来有改进方法，如 NOVA - BERT 利用辅助信息辅助注意力模块，还有采用自监督学习技术。
- 讨论：信息源影响融合过程，需探索高效整合方式。
工业实践
- UBM 方法应用场景广，考虑长序列、多类型和辅助信息有性能提升，长序列 UBM 部署较多。
- 计算效率关键，哈希等方法平衡性能和成本，GNN 技术因资源需求大未在线部署。
总结与展望
- UBM 取得进展，但面临信息深度融合、高效学习、可解释性和先进技术应用等挑战，是未来研究方向。

论文：A Survey on User Behavior Modeling in Recommender Systems

序列建模相关文章

综述相关文章

最近热门

最常浏览