PixelRec是一个大规模的视觉推荐系统数据集,它包含了约2亿用户-短视频交互行为、3000万用户和40万高质量视频封面图片。这个数据集的特点在于它提供了直接访问原始图像像素的能力,使得推荐模型能够直接从这些像素中学习项目表示。PixelRec数据集的发布旨在推动基于图像像素内容的推荐模型研究,它不仅包含了大量的用户交互数据,还提供了丰富的基线实现,包括9种推荐结构和9个图像编码器。

PixelRec数据集的创建是为了解决当前视觉推荐数据集中存在的小规模和不包含原始图片的问题。它从公开视频平台收集而来,包含了用户在平台上的评论/发弹幕行为,视频的封面,标题等元数据,以及视频播放量。这个数据集的发布,为视觉推荐提供了一个基准,即PixelRec基准测试,全面覆盖了多种推荐结构和图像编码器。

技术报告和代码可以在以下链接找到:

PixelRec数据集的发布,为推荐系统研究者提供了一个重要的资源和测试平台,特别是对于那些强调图像像素内容的推荐模型研究。通过这个数据集,研究者可以探索如何更有效地利用图像特征来构建优秀的推荐模型,尤其是在冷启动和跨域推荐场景中。