Google在2020年04月09日发布了 Quantification Aware Training(QAT)API,即在训练过程中模拟量化的过程,这样训练之后的量化模型可以最大地逼近原始float32浮点模型的精度,能够进一步推动模型在移动/嵌入式设备中的快速部署。