PTQ（训练后量化）和QAT（量化感知训练）

在模型量化中，PTQ（Post - Training Quantization，训练后量化）和QAT（Quantization - Aware Training，量化感知训练）是两种常见的量化方法。

PTQ是在模型训练完成后，对模型的权重和激活值进行量化的方法。它通常包括以下步骤：

PTQ的优点是简单、快速，不需要重新训练模型。但是，由于它是在训练后进行量化，可能无法充分利用模型的训练信息，导致量化后的模型精度下降。

QAT则是在模型训练过程中，引入量化操作，让模型在训练过程中学习如何适应量化带来的误差。具体来说，QAT会在训练过程中模拟量化操作，例如将权重和激活值量化为低精度数值，并通过反向传播调整模型的参数，以减少量化带来的误差。

QAT的优点是可以充分利用模型的训练信息，提高量化后的模型精度。但是，它需要重新训练模型，计算量较大，训练时间较长。

总的来说，PTQ和QAT各有优缺点，在实际应用中需要根据具体情况选择合适的量化方法。