-
定义
- AUC(Area Under the Curve)即曲线下面积。在回归问题中,通常是指预测值与真实值之间关系曲线下的面积。对于回归模型,一般会先将回归结果转化为排序问题来计算AUC。
- 例如,假设我们有一组真实值y = [y_1,y_2,\cdots,y_n]和对应的预测值\hat{y}=[\hat{y}_1,\hat{y}_2,\cdots,\hat{y}_n]。我们可以根据预测值的大小对样本进行排序,然后比较排序后的预测值和真实值的顺序关系来计算AUC。
-
计算方法
-
回归AUC计算的步骤:
- 统计正类的有效对数 cnt_{pos}:预测值较大且真实值较大
- 统计负类的有效对数:预测值大但真实值小
- 统计总样本对数 cnt_{all}:label_i != label_j
- 计算回归AUC:reg_{auc} = cnt_{pos}/cnt_{all}
-
意义
-
AUC的取值范围是0.5到1。AUC = 0.5表示模型的预测结果是随机的,没有任何区分能力。AUC = 1表示模型是一个完美的模型,能够完全正确地对样本进行排序。
- 它可以用来衡量回归模型的预测性能,特别是在比较不同回归模型的优劣时,AUC是一个很有用的指标。例如,在预测房价的回归模型中,AUC越高说明模型对房价高低的排序能力越强,能够更好地将价格高的房子和价格低的房子区分开来。
-
与分类AUC的区别
-
在分类问题中,AUC是基于分类结果(如正类和负类)的混淆矩阵计算出来的,直接衡量分类模型对正例和反例的区分能力。而回归AUC是通过将回归结果转化为排序问题来计算的。
- 例如,在二分类问题中,我们可以直接根据预测的类别概率来计算TPR和FPR,绘制ROC曲线和计算AUC。但在回归问题中,需要先进行排序等操作后才能计算类似的指标。
Regression AUC、回归AUC
指标相关文章
- 加速比:衡量加速效果的一个重要指标
- 千次展现订单数(Orders per Mille, OPM)
- 消费者投诉率(Customer Complaint Rate, CCR)
- TFLOPS(teraFLOPS缩写)
- NLP评估指标之ROUGE
- 前端FMP(First Meaningful Paint)指标
- SSIM(Structural Similarity Index,结构相似性指数)
- MRR(Mean Reciprocal Rank):一个信息检索和推荐系统中常用的评价指标
- MOS分(Mean Opinion Score)
- PSNR(Peak Signal-to-Noise Ratio,峰值信噪比)
最近热门
- bazel target-syntax
- Speculative decoding(推测性解码)
- 金融领域BSM模型(Black-Scholes-Merton模型)和KMV模型
- calibration,模型纠偏,模型校准
- AttributeError: 'module' object has no attribute '_internal_create_key'
- SLAM(Simultaneous Localization and Mapping,即时定位与地图构建)技术
- 凸优化中的 Slater 条件
- 凸优化 | 拉格朗日对偶问题,slater条件,KKT条件
- ECEF(Earth-Centered, Earth-Fixed)坐标系和ENU(East-North-Up)坐标系
- 站点地图(sitemap.xml)
最常浏览
- 016 推荐系统 | 排序学习(LTR - Learning To Rank)
- 偏微分符号
- i.i.d(又称IID)
- 利普希茨连续条件(Lipschitz continuity)
- (error) MOVED 原因和解决方案
- TextCNN详解
- 找不到com.google.protobuf.GeneratedMessageV3的类文件
- Deployment failed: repository element was not specified in the POM inside distributionManagement
- cannot access com.google.protobuf.GeneratedMessageV3 解决方案
- CLUSTERDOWN Hash slot not served 问题原因和解决办法
×