Andrej Karpathy分享了一个可能更客观的大模型的评估体系:openrouter这种大模型API服务商的排行榜。
OpenRouter 允许个人/公司在不同的 LLM 提供商之间快速切换 API。它们的应用场景都是真实的(不是玩具问题或谜题),它们都有自己的私有评估,并且它们都有激励机制来确保选择正确,因此通过选择一个 ​​​https://mapp.api.weibo.cn/fx/3de82c66833ba6695f26597dc379d1ce.html
 
 
Back to Top