acshame
01:46 · 2025年5月20日 · 周二
https://x.com/karminski3/status/1924255317841588663?t=AQyzHpQCi6SZrq3BRyg1tg&s=35
X (formerly Twitter)
karminski-牙医 (@karminski3) on X
Qwen 又发新模型了! ParScale-1.8B-P1 (P2,P4,P8)
这个 P 是什么意思?没错,就是这个模型最新颖的点。大家知道提升模型能力要么增加参数量,要么疯狂推理(类似QwQ一个问题要想3分钟)。于是 Qwen 团队又搞出了一个新方法,干脆并行推理。于是他们发明了新的方法——ParScale
简单讲
Home
Powered by
BroadcastChannel
&
Sepia