01:52 · May 14, 2025 · Wed https://x.com/karminski3/status/1922436445152620842?t=xdFRn71JfQW3DkHYZ4s_Jg&s=35 X (formerly Twitter) karminski-牙医 (@karminski3) on X Unsloth 刚刚发布了他们的 GRPO 的新互动教程 (ipynb notebook)只需要跟着教程一步步来就能微调 Qwen3-Base 并且开启思考模式,并且是 GRPO 的所以可以几乎让模型无监督学习地址:https://t.co/tId33YnBG7