acshame
16:57 · 2025年4月16日 · 周三
https://x.com/karminski3/status/1912287572065415582?t=4kgi73oZCfIWD3KOiLAkJA&s=35
X (formerly Twitter)
karminski-牙医 (@karminski3) on X
微软研究院整了个活,发布了个原生 1-bit 的大语言模型 —— bitnet-b1.58-2B-4T
有啥意义吗?有的,这个模型虽然将权重量化到超低精度(实际是1.58位,权重只有{-1, 0, +1}三个值),但它在性能上几乎能与其它2B参数规模的全精度模型相媲美。
与传统模型相比,这个1-bit模型带来了惊人的效率提升:
-
Home
Powered by
BroadcastChannel
&
Sepia