在推荐系统中,生成式推荐(Generative Recommendation) 是一种基于生成式模型(如 GAN、VAE、大语言模型等)的推荐方法。与传统推荐系统(协同过滤、内容过滤)不同,生成式推荐的核心是通过模型生成内容或用户偏好,而非仅依赖历史行为的匹配。以下是关键点解析:
1. 生成式推荐的核心原理
- 生成 vs 匹配:传统方法通过用户历史行为“匹配”已有物品;生成式模型则直接“生成”新的推荐内容(如文本、图像、序列等),或生成用户潜在兴趣的表示。
- 技术基础:常用模型包括:
- 生成对抗网络(GAN):生成用户可能感兴趣的虚拟物品,或增强稀疏数据。
- 变分自编码器(VAE):学习用户/物品的潜在分布,生成推荐。
- 大语言模型(LLM):如 GPT、Claude,生成文本推荐、解释推荐理由,或预测用户行为序列。
- 扩散模型:生成高质量内容(如个性化图片/视频推荐)。
2. 典型应用场景
- 冷启动问题:生成合成数据补全稀疏的用户-物品交互。
- 个性化内容生成:
- 电商:生成商品描述、搭配建议(如“适合你的春季穿搭”)。
- 视频平台:生成个性化预告片或剧情摘要。
- 新闻推荐:生成摘要吸引用户点击。
- 序列推荐:预测用户下一步行为(如下一个观看的视频、购买的商品)。
- 跨模态推荐:生成图文/视频内容,匹配用户多模态兴趣(如根据文字描述生成推荐图片)。
3. 生成式推荐 vs 传统推荐
维度 | 传统推荐 | 生成式推荐 |
---|---|---|
核心逻辑 | 匹配历史行为 | 生成新内容或兴趣表示 |
数据依赖性 | 依赖大量显式交互数据 | 可处理稀疏数据,生成合成样本 |
推荐多样性 | 易陷于“信息茧房” | 生成新组合,突破固有模式 |
可解释性 | 部分模型(如矩阵分解)可解释 | 生成过程可能较难解释 |
适用场景 | 已知物品的精准匹配 | 冷启动、跨模态、内容创造 |
4. 技术挑战
- 生成质量:模型可能生成无关或低质量内容(如推荐不合理商品)。
- 偏差放大:训练数据中的偏见可能被生成模型放大(如性别/种族刻板印象)。
- 计算成本:大模型训练/推理资源消耗高,难以实时响应。
- 评估指标:传统指标(如准确率)无法全面衡量生成内容的多样性、新颖性。
5. 未来方向
- 可控生成:加入用户反馈,实时调整生成内容(如“更便宜/更小众”)。
- 多模态融合:结合文本、图像、视频生成跨模态推荐。
- 伦理与安全:避免生成有害/歧视性内容,设计公平性约束。
- 轻量化部署:模型压缩技术,让生成式推荐适配端侧设备(如手机)。
快手OneRec模型
Meta HSTU模型
- https://zhuanlan.zhihu.com/p/687478684
- HSTU(Hierarchical Sequential Transduction Units)