acshame
07:20 · 2025年4月4日 · 周五
https://x.com/karminski3/status/1907927989901471886?t=bxxJob_RB7-co2mcIBVJqQ&s=35
X (formerly Twitter)
karminski-牙医 (@karminski3) on X
Google 的开源模型 Gemma-3 的新 QAT (Quantization Aware Trained, 量化感知训练) 检查点量化版本放出了!
这个版本使用 Q4 量化并且能与之前 BF16 版本保持几乎一致的质量(我看到的是Q4量化比 bartowski 的Q5量化数据还好)
总之这个量化版本应该是目前最优的版本了,
Home
Powered by
BroadcastChannel
&
Sepia