Amazon Book Reviews 数据集是一个包含亚马逊用户对图书商品评价的集合,它是推荐系统领域的经典数据集之一。以下是关于该数据集的一些详细信息:
-
数据集版本:
-
数据集内容:
- 包含商品信息描述和用户评分记录数据。商品信息描述包括商品ID、名称、价格、图片链接、相关商品、销售排名、品牌和目录类别等。用户评分记录数据包括用户ID、商品ID、用户名、有效评价率、评价文本、评分、评价总结和评价时间戳等。
-
数据集特点:
- Amazon Book Reviews 数据集包含多种特征,如客户ID、评论ID、产品ID、星级评分、有帮助的投票数、总投票数、评论标题、评论正文和评论日期。
- 数据集经过筛选,仅包含最近两年(2003-2005年)的评论。
-
数据集更新:
- 2023年版本:https://www.selectdataset.com/dataset/3ecd284764a1212acc46aa08da33680a
- 该版本数据量增长245.2%,互动数据更新至2023年9月,商品元数据更详尽,时间戳精度提升至秒级,数据处理更精细,并进行标准数据划分以推动推荐系统基准测试。
-
数据集字段:
- 用户评论字段包括评分、标题、文本、图片、产品ID、父产品ID、用户ID、时间戳、购买验证和有用投票等。
- 商品元数据字段包括描述、价格、原始图像等。
-
数据集下载:
- 完整的评论数据和每个类别的文件可以通过提供的链接下载,但需要填写表格。
-
数据集应用:
- 适用于传统的推荐任务以及新的复杂产品搜索任务,为研究者提供了宝贵的资源,助力算法理解与优化。
这些数据集为研究人员和开发者提供了丰富的资源,以进行推荐系统、情感分析、用户行为分析等方面的研究和应用。