Skip to main content

acshame

  1. 小米今天发布了自己的推理开源大模型MiMo,仅用7B就超越了OpenAI 推理模型o1-mini和阿里的推理模型QwQ-32B-Preview,值得一提的是,小米的7B总训练量达到了25T,还是非常恐怖的。7B的大模型非常适合做端侧,不论是应用到小爱还是米家智能生态都非常适合,甚至可以再训练训练丢给小米客服去做产品和服务 ​​​https://mapp.api.weibo.cn/fx/ffa6a8d072aca18be4057bae48e1e25d.html
  2. 世界首个免费无限制 分布式 AI 算力平台
    基于来自全国各地 50 台家用电脑的 3090、4080、4090 显卡分布式算力,我们为开发者提供完全免费、无限制的 Qwen3-30B-A3B 大语言模型 API。Qwen3-30B-A3B 是通义千问最新开源的大语言模型,其性能媲美 DeepSeek-R1、o1、o3-mini、Grok-3 和 Gemini-2.5-Pro 等明星模型。无需注册,无需充值,立即获取 API Key 开始使用。

    https://qwen3.slmnb.cn/
  3. Andrej Karpathy分享了一个可能更客观的大模型的评估体系:openrouter这种大模型API服务商的排行榜。
    OpenRouter 允许个人/公司在不同的 LLM 提供商之间快速切换 API。它们的应用场景都是真实的(不是玩具问题或谜题),它们都有自己的私有评估,并且它们都有激励机制来确保选择正确,因此通过选择一个 ​​​https://mapp.api.weibo.cn/fx/3de82c66833ba6695f26597dc379d1ce.html