Google 正式发布 Gemma 4 QAT 模型,在训练阶段即引入量化感知训练,把端侧大模型的部署门槛拉到 8GB 内存手机和轻薄笔电。本文从 QAT 与 PTQ 的差异出发,拆解端侧部署在内存、...