在推荐系统中,生成式推荐(Generative Recommendation) 是一种基于生成式模型(如 GAN、VAE、大语言模型等)的推荐方法。与传统推荐系统(协同过滤、内容过滤)不同,生成式推荐的核心是通过模型生成内容或用户偏好,而非仅依赖历史行为的匹配。以下是关键点解析:


1. 生成式推荐的核心原理

  • 生成 vs 匹配:传统方法通过用户历史行为“匹配”已有物品;生成式模型则直接“生成”新的推荐内容(如文本、图像、序列等),或生成用户潜在兴趣的表示。
  • 技术基础:常用模型包括:
  • 生成对抗网络(GAN):生成用户可能感兴趣的虚拟物品,或增强稀疏数据。
  • 变分自编码器(VAE):学习用户/物品的潜在分布,生成推荐。
  • 大语言模型(LLM):如 GPT、Claude,生成文本推荐、解释推荐理由,或预测用户行为序列。
  • 扩散模型:生成高质量内容(如个性化图片/视频推荐)。

2. 典型应用场景

  • 冷启动问题:生成合成数据补全稀疏的用户-物品交互。
  • 个性化内容生成
  • 电商:生成商品描述、搭配建议(如“适合你的春季穿搭”)。
  • 视频平台:生成个性化预告片或剧情摘要。
  • 新闻推荐:生成摘要吸引用户点击。
  • 序列推荐:预测用户下一步行为(如下一个观看的视频、购买的商品)。
  • 跨模态推荐:生成图文/视频内容,匹配用户多模态兴趣(如根据文字描述生成推荐图片)。

3. 生成式推荐 vs 传统推荐

维度 传统推荐 生成式推荐
核心逻辑 匹配历史行为 生成新内容或兴趣表示
数据依赖性 依赖大量显式交互数据 可处理稀疏数据,生成合成样本
推荐多样性 易陷于“信息茧房” 生成新组合,突破固有模式
可解释性 部分模型(如矩阵分解)可解释 生成过程可能较难解释
适用场景 已知物品的精准匹配 冷启动、跨模态、内容创造

4. 技术挑战

  • 生成质量:模型可能生成无关或低质量内容(如推荐不合理商品)。
  • 偏差放大:训练数据中的偏见可能被生成模型放大(如性别/种族刻板印象)。
  • 计算成本:大模型训练/推理资源消耗高,难以实时响应。
  • 评估指标:传统指标(如准确率)无法全面衡量生成内容的多样性、新颖性。

5. 未来方向

  • 可控生成:加入用户反馈,实时调整生成内容(如“更便宜/更小众”)。
  • 多模态融合:结合文本、图像、视频生成跨模态推荐。
  • 伦理与安全:避免生成有害/歧视性内容,设计公平性约束。
  • 轻量化部署:模型压缩技术,让生成式推荐适配端侧设备(如手机)。

快手OneRec模型

Meta HSTU模型