假设测试样本有N个(已知),正样本为p个(未知,需要求解)。
针对单个样本,log-loss计算公式如下:
整个测试集的平均loss如下:
令
代入得:
已知loss和pred,即可求出ctr。
python计算代码如下:
from math import log def cal_ctr(loss, pred): return (loss + log(1-pred)) / (log(1-pred) - log(pred))