PSI(Population Stability Index,群体稳定性指标)是一个衡量模型预测值与实际值偏差大小的指标,主要用于评价特征或模型的稳定性。它通过比较两个样本(如训练样本和测试样本)在各分数段的分布差异来评估模型的稳定性。PSI的基本计算公式为:
其中,实际占比是指测试样本(如新的样本或跨时间样本)在各分数段的用户占比,预期占比是指基准样本(如训练样本)在各分数段的用户占比。如果模型很稳定,那么这两个占比应该是相近的,PSI值会较小;反之,如果模型不稳定,PSI值会较大。PSI值越小,表示模型的稳定性越好。
PSI指标的应用领域包括但不限于风控模型的稳定性评估、特征稳定性监控、模型上线前后的稳定性评价等。它可以帮助我们识别模型在不同时间段的表现是否稳定,从而对模型的有效性和可靠性做出判断。