#模型学会启发式教学##小模型也能教出强推理#

7B小模型也能教出强推理AI?

Transformer作者之一Llion Jones,其公司Sakana AI提出的方法让模型“像人类教师一样”教学。

如此,模型就像有了参考答案,讲解推理过程毫不费力。这种RLT(Reinforcement Learning Teacher)模式,和过去AI训练方式有两个 ​​​https://mapp.api.weibo.cn/fx/a8dcc54ba05d475d435248a40ce9d33a.html
 
 
Back to Top