《Ordinal Regression with Multiple Output CNN for Age Estimation》总结
相关论文推荐:
论文地址:doc
这篇论文由Zhenxing Niu等人撰写,提出了一种使用多输出CNN解决序数回归问题的方法,并将其应用于年龄估计任务,同时发布了一个新的亚洲人脸年龄数据集(AFAD)。
-
引言
- 年龄估计可视为序数回归问题,传统方法将特征提取和回归模型学习分开优化,且未充分利用年龄标签的序数关系。
- 本文提出使用深度卷积神经网络进行端到端学习,将序数回归问题转化为一系列二分类子问题,并通过多输出CNN共同解决这些子问题,以探索任务间的相关性。
- 缺乏大规模年龄数据集是研究的障碍,本文发布的AFAD数据集是目前最大的公开年龄数据集。
-
相关工作
- 年龄估计:现有方法通过两步进行年龄估计,即局部特征提取和度量回归(或多类分类),最成功的手工特征是生物启发特征(BIFs),近期一些工作采用序数回归来更好地处理老化过程的非平稳性,深度学习在年龄估计中的应用较少,且现有方法未充分发挥CNN的判别能力。
- 序数回归:大多数序数回归算法是从著名的分类算法修改而来,另一种方法是将序数回归问题转化为一系列二分类子问题。
-
使用CNN的序数回归
- 问题表述:给定训练样本,序数回归旨在找到从图像到秩的映射,使风险函数最小化,本文采用成本矩阵来测量预测秩和真实秩之间的成本。
- 方法:将序数回归转化为K - 1个二分类子问题,每个子问题构建特定的训练数据,使用一个具有多个输出层的CNN来共同实现这些二分类器,最后根据分类结果预测样本的秩。
- 多输出CNN架构:网络包括3个卷积层、3个局部响应归一化层、2个最大池化层和1个全连接层,最后分出K - 1个输出层,每个输出层对应一个二分类任务,采用softmax归一化交叉熵损失函数。
- 学习多输出CNN:损失函数考虑了不同任务的重要性系数,输出层和倒数第二层的参数学习过程不同,倒数第二层的误差是所有输出层误差的加权和。
-
AFAD数据集
- 测试方法在MORPH II数据集上进行,该数据集种族不平衡,亚洲面孔少于1%。
- AFAD数据集通过在人人社交网络(RSN)上收集面部图像构建,RSN用户年龄范围广,创建账户时需提供出生日期,便于获取自拍照片的真实年龄。
- 数据集经过预处理,包括人脸检测、面部标志定位、对齐和裁剪等操作,最终收集了164,432张标记良好的照片,包括63,680张女性照片和100,752张男性照片,年龄范围为15至40岁。
-
实验
- 预处理和实验设置:比较了基于度量回归和序数回归的几种方法在年龄估计中的性能,使用平均绝对误差(MAE)和累积分数(CS)来衡量性能。
- 年龄估计:序数回归方法总体上优于度量回归方法,结合序数回归和深度学习方法能显著提升性能,本文方法在MORPH II和AFAD数据集上达到了最先进水平。
- 比较度量和序数回归:提出基线方法MR - CNN,将年龄估计视为度量回归问题,与本文的OR - CNN进行比较,结果表明将年龄估计作为序数回归问题是必要的,且序数回归和深度学习方法的结合能显著提升性能。
- 讨论:分析了任务重要性,根据样本数量分布设置任务重要性参数能略微提高性能;颜色信息对年龄估计有帮助,直接使用彩色图像的性能优于将其转换为灰度图像。
-
结论
- 本文提出使用端到端深度学习方法解决序数回归问题,并应用于年龄估计,取得了更好的性能,避免了直接设计手工特征。
- 发布的AFAD数据集是目前最大的公开年龄数据集。
- 本文方法在两个大规模基准数据集上的评估结果表明,其在相关应用中有很大潜力。