# 2025W34 AI大模型领域精选热点 🔥---## 1. Deepseek 更新 V3.1 模型> 评价两极分化严重，只能期待 R2 或者 V4 了- DeepSeek-V3.1-Base 是一个 Hybrid-Model, 可以开关思考模式（这不是Qwen 通过社区验证已经放弃了的嘛？混合模型在非推理任务上的性能损失非常严重），更新记录：api-docs.deepseek.com/zh-cn/news/news250821- 支持了anthropic API模式，可以接入Claude code，参考文档：api-docs.deepseek.com/zh-cn/guides/anthropic_api - 新增原生 search token 的支持- 后续模型取消夜间优惠，涨价是始料未及的模型地址：huggingface.co/deepseek-ai/DeepSeek-V3.1-Base## 2. 阿里> 感觉阿里现在得有1万个部门在搞AI- 阿里面向全球市场发布了 Agentic 编程平台 Qoder

19:00 · Aug 24, 2025 · Sun

# 2025W34 AI大模型领域精选热点 🔥

---

## 1. Deepseek 更新 V3.1 模型

> 评价两极分化严重，只能期待 R2 或者 V4 了

- DeepSeek-V3.1-Base 是一个 Hybrid-Model, 可以开关思考模式（这不是Qwen 通过社区验证已经放弃了的嘛？混合模型在非推理任务上的性能损失非常严重），更新记录：api-docs.deepseek.com/zh-cn/news/news250821

- 支持了anthropic API模式，可以接入Claude code，参考文档：api-docs.deepseek.com/zh-cn/guides/anthropic_api

- 新增原生 search token 的支持

- 后续模型取消夜间优惠，涨价是始料未及的

模型地址：huggingface.co/deepseek-ai/DeepSeek-V3.1-Base

## 2. 阿里

> 感觉阿里现在得有1万个部门在搞AI

- 阿里面向全球市场发布了 Agentic 编程平台 Qoder。又一个新的叫Qoder的IDE，难道通义灵码不用了嘛？

- 内置代码检索引擎
- 支持 Repo Wiki
- 集成长短期记忆系统
- 除了提供 Ask Mode（问答模式）和 Agent Mode（智能体模式）之外，Qoder 新增了 Quest Mode（AI自主编程）

体验地址：qoder.com

+ qwen开源一个图片编辑模型Qwen-Image-Edit（Qwen-Image 的图像编辑版本），类似gpt-image-1和google gemini image的功能。Qwen-Image-Edit 基于20B Qwen-Image 模型，将 Qwen-Image 独特的文本渲染功能扩展到图像编辑任务中，实现精确的文本编辑。并且支持多图 reference。实际效果很强大。

Blog地址：qwenlm.github.io/zh/blog/qwen-image-edit
体验地址：chat.qwen.ai
Repo地址: github.com/QwenLM/Qwen-Image
模型地址: huggingface.co/Qwen/Qwen-Image-Edit

## 3. 字节 Seed-OSS 系列模型开源

模型大小都是36B。这个模型的特性是可以调整思考长度（类似 GPT-OSS 调整思考长度的 low-high）. 以及针对 Agent 性能进行了优化。原生上下文长度为512K。目前从官方放出的测试数据来看，基本是30B这个规模大模型的 SOTA。

模型包括：

- Seed-OSS-36B-Base (基础模型，包含了合成指令数据的预训练版本)
- Seed-OSS-36B-Base-woSyn (基础模型的"纯净版"，没有经过合成指令数据的预训练)
- Seed-OSS-36B-Instruct (指令微调模型，适用于各种下游任务，在智能体任务和推理能力上表现比较好)

模型地址：

- huggingface.co/ByteDance-Seed/Seed-OSS-36B-Base
- huggingface.co/ByteDance-Seed/Seed-OSS-36B-Base-Instruct
- huggingface.co/ByteDance-Seed/Seed-OSS-36B-Base-woSyn

字节AI硬件OCEAN团队研发豆包手机中，中兴 ODM 代工，可能年底或明年年初内部推出

## 4. 智谱发布 AutoGLM 智能体

> 感觉像是给用户预制了1台云端虚拟手机（云手机），实际体验怎么样呢？各大应用商店下载试试吧，注意保护个人隐私

- 可能是世界上首个手机通用 Agent
- 操作全在云手机&云电脑上运行
- 全平台覆盖的客户端，IOS&安卓均支持
- 可以实现多个应用联动自动操作（点外卖、订机票）

## 5. 其他动态

1. OpenAI 7 月份营收达到了 10 亿美元。

ChatGPT Go —— 一款全新的低成本订阅计划，首先支持印度，价格为每月 399 卢比（约合 4.55 美元），会将根据用户的反馈进行学习和调整，然后再决定是否推广到其他国家。与免费版相比，Go 套餐提供了：消息上限提升 10 倍、图像生成数量提升 10 倍、文件上传数量提升 10 倍，以及记忆时长延长 2 倍

2. 马斯克宣布 grok2开源（开源弱鸡模型没人用的），模型地址：huggingface.co/xai-org/grok-2

3. 为何精神控制类Prompt远胜普通事务性Prompt：机制解析与实战指南 jieyibu.net/a/87962 github.com/linkerlin/PUAX

4. NASA 和 IBM 联合搞了个大模型——Surya-1.0 是用来预测太阳耀斑的。模型大小1.8GB左右。

模型地址：huggingface.co/nasa-ibm-ai4science/Surya-1.0

5. Google DeepMind 的研究员展示了他们在AI生成的世界里（Genie 3）训练AI 的场景。世界模型 Genie 3，能够即时想象并生成全新的世界。具身智能体 Sima 被投放到这些世界中，并能自主学习如何在其中导航。

6. 一个在线可玩的实时通用领域生成世界引擎，Mirage 2，上传图片可以变成可玩的环境，通过对话也可以改变环境。目前 Mirage 2 能够创造10分钟以上的交互视频，延迟为 200 毫秒。

体验地址：dynamicslab.ai

7. Runway 推出了通用世界模型（General World Models），能够实时生成拥有独一无二角色和故事的游戏。每一次游玩都会有不同的事件发生，甚至可以自己打造专属的故事和玩法。目前只支持图文模式。

体验地址：play.runwayml.com

8. 据称，英伟达正基于最新Blackwell架构为中国开发两款新型AI芯片：一款暂名B30A，原始算力约为其旗舰B300的一半，具备高宽带内存与NVLink技术，性能优于当前获准销售的H20，该芯片规格尚未完全确定，但英伟达计划最快下月向中国客户交付样品进行测试；另一款中国专供芯片则于今年5月被报道，暂名RTX6000D，主要用途为AI推理任务，售价低于H20，内存带宽略低于美国政府限制阈值，预计9月小批量交付。

9. Google Pixel 10 手机发布，可以本地运行 Gemini Nano 模型。手机系统的所有自带软件全部 AI 化（AI 软件场景有 AI 健康教练和 AI 修图&拍摄指导），多个系统 APP 之间的 AI 能力可以联动，输出的信息可以相互流转。除了手机之外的其他硬件产品也全部加上了 Gemini 的对话和沟通能力。新的 Pixel Watch 4 有 Gemini 驱动的健身教练能力，提供主动健身与睡眠指导及按需建议，通过“抬腕交谈”唤出 Gemini 交流。

## Github Repos Recommend

1. agent-lightning 一个智能体训练框架，由微软开源，配置使用较为简单且不受限于各种框架。

Repo 地址：github.com/microsoft/agent-lightning

2. 开源AI生成图片检测对抗工具 Image-Detection-Bypass-Utility

可以通过噪声注入、FFT 平滑、FFT 匹配、像素扰动、相机模拟等来绕过 AI 图像检测。支持 ComfyUI 工作流的接入。

Repo地址：github.com/PurinNyova/Image-Detection-Bypass-Utility

3. 类似 AI操作手机的框架 DroidRun的开源项目 mobile-use

Repo地址：github.com/minitap-ai/mobile-use

4. AgenticSeek：一个私有、本地的 Manus 替代方案

一个本地运行的 Manus AI 替代品，支持语音 AI 助手，可自主浏览网页、编写代码、规划任务，所有数据仅保存在本地设备上。

Repo地址：github.com/Fosowl/agenticSeek/