假设测试样本有N个(已知),正样本为p个(未知,需要求解)。

针对单个样本,log-loss计算公式如下:

整个测试集的平均loss如下:

代入得:

已知loss和pred,即可求出ctr。

python计算代码如下:

from math import log


def cal_ctr(loss, pred):
    return (loss + log(1-pred)) / (log(1-pred) - log(pred))