大家都在等 DeepSeek-R2, 不过, 有没有想过把 DeepSeek-V3-0324 变成推理模型?

来看这个新模型 DeepSeek-R1T-Chimera,它基于DeepSeek-R1构建,并使用DeepSeek-V3-0324 数据进行微调。

模型作者的测试结果是水平与 DeepSeek-R1 一样好,但是思考时间显著变短了,可以当作 DeepSeek-R1 加强版使用。 ​​​https://mapp.api.weibo.cn/fx/601a60a6b06bd65f26966ea00ab63579.html
 
 
Back to Top