acshame
09:52 · 2025年5月14日 · 周三
https://x.com/karminski3/status/1922436445152620842?t=xdFRn71JfQW3DkHYZ4s_Jg&s=35
X (formerly Twitter)
karminski-牙医 (@karminski3) on X
Unsloth 刚刚发布了他们的 GRPO 的新互动教程 (ipynb notebook)
只需要跟着教程一步步来就能微调 Qwen3-Base 并且开启思考模式,并且是 GRPO 的所以可以几乎让模型无监督学习
地址:https://t.co/tId33YnBG7
Home
Powered by
BroadcastChannel
&
Sepia