看到一个如何训练领域特定模型的文章写得非常好，作者使用 GRPO 微调了 qwen2.5-coder-7B, 实现了一个生成日程表的大模型 | acshame

Skip to main content

00:10 · May 4, 2025 · Sun

看到一个如何训练领域特定模型的文章写得非常好，作者使用 GRPO 微调了 qwen2.5-coder-7B, 实现了一个生成日程表的大模型。并且不光有教程，还有代码，模型。感兴趣的同学可以参考这个学习

教程地址：huggingface.co/blog/anakin87/qwen-scheduler-grpo
代码地址： https://mapp.api.weibo.cn/fx/d8bbc474e4a04f29c66bfa55c4675104.html