推荐系统 | 生成式推荐

标签: 推荐系统更新于: 2025/03/17 阅读:730 原文发表于：2024-07-03

在推荐系统中，生成式推荐（Generative Recommendation） 是一种基于生成式模型（如 GAN、VAE、大语言模型等）的推荐方法。与传统推荐系统（协同过滤、内容过滤）不同，生成式推荐的核心是通过模型生成内容或用户偏好，而非仅依赖历史行为的匹配。以下是关键点解析：

1. 生成式推荐的核心原理

生成 vs 匹配：传统方法通过用户历史行为“匹配”已有物品；生成式模型则直接“生成”新的推荐内容（如文本、图像、序列等），或生成用户潜在兴趣的表示。
技术基础：常用模型包括：
生成对抗网络（GAN）：生成用户可能感兴趣的虚拟物品，或增强稀疏数据。
变分自编码器（VAE）：学习用户/物品的潜在分布，生成推荐。
大语言模型（LLM）：如 GPT、Claude，生成文本推荐、解释推荐理由，或预测用户行为序列。
扩散模型：生成高质量内容（如个性化图片/视频推荐）。

2. 典型应用场景

冷启动问题：生成合成数据补全稀疏的用户-物品交互。
个性化内容生成：
电商：生成商品描述、搭配建议（如“适合你的春季穿搭”）。
视频平台：生成个性化预告片或剧情摘要。
新闻推荐：生成摘要吸引用户点击。
序列推荐：预测用户下一步行为（如下一个观看的视频、购买的商品）。
跨模态推荐：生成图文/视频内容，匹配用户多模态兴趣（如根据文字描述生成推荐图片）。

3. 生成式推荐 vs 传统推荐

维度	传统推荐	生成式推荐
核心逻辑	匹配历史行为	生成新内容或兴趣表示
数据依赖性	依赖大量显式交互数据	可处理稀疏数据，生成合成样本
推荐多样性	易陷于“信息茧房”	生成新组合，突破固有模式
可解释性	部分模型（如矩阵分解）可解释	生成过程可能较难解释
适用场景	已知物品的精准匹配	冷启动、跨模态、内容创造

4. 技术挑战

生成质量：模型可能生成无关或低质量内容（如推荐不合理商品）。
偏差放大：训练数据中的偏见可能被生成模型放大（如性别/种族刻板印象）。
计算成本：大模型训练/推理资源消耗高，难以实时响应。
评估指标：传统指标（如准确率）无法全面衡量生成内容的多样性、新颖性。

5. 未来方向

可控生成：加入用户反馈，实时调整生成内容（如“更便宜/更小众”）。
多模态融合：结合文本、图像、视频生成跨模态推荐。
伦理与安全：避免生成有害/歧视性内容，设计公平性约束。
轻量化部署：模型压缩技术，让生成式推荐适配端侧设备（如手机）。

快手OneRec模型

快手OneRec: Unifying Retrieve and Rank with Generative Recommender and Preference Alignment

Meta HSTU模型

https://zhuanlan.zhihu.com/p/687478684
HSTU（Hierarchical Sequential Transduction Units）