Token Merging

标签: DNN 更新于: 2024/08/14 阅读:345

Token Merging的思路

Token Merging（令牌合并）是一种在自然语言处理和相关领域中用于模型压缩和优化的技术，其基本思路通常包括以下几个方面：

减少冗余通过分析模型中的令牌（token）分布和重要性，识别并合并那些具有相似语义或较低重要性的令牌，以减少模型的参数数量和计算量。
特征提取对令牌进行特征提取和表示学习，找到具有相似特征的令牌组，为合并操作提供依据。
重要性评估使用某种评估指标或策略来确定令牌的重要性，例如令牌对模型输出的影响程度、在数据中的出现频率等。
合并操作将选定的令牌进行合并，可能是通过平均、求和或其他合适的方式来整合它们的特征表示。
模型微调在完成令牌合并后，对压缩后的模型进行微调，以恢复或进一步优化模型的性能。

通过 Token Merging 可以在一定程度上保持模型性能的同时，降低模型的复杂度，提高计算效率和减少内存占用。

参考

ToMe：我的方法无需训练即可加速 ViT 模型