# 2025W34 AI大模型领域精选热点 🔥
---
## 1. Deepseek 更新 V3.1 模型
> 评价两极分化严重,只能期待 R2 或者 V4 了
- DeepSeek-V3.1-Base 是一个 Hybrid-Model, 可以开关思考模式(这不是Qwen 通过社区验证已经放弃了的嘛?混合模型在非推理任务上的性能损失非常严重),更新记录:api-docs.deepseek.com/zh-cn/news/news250821
- 支持了anthropic API模式,可以接入Claude code,参考文档:api-docs.deepseek.com/zh-cn/guides/anthropic_api
- 新增原生 search token 的支持
- 后续模型取消夜间优惠,涨价是始料未及的
模型地址:huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
## 2. 阿里
> 感觉阿里现在得有1万个部门在搞AI
- 阿里面向全球市场发布了 Agentic 编程平台 Qoder。又一个新的叫Qoder的IDE,难道通义灵码不用了嘛?
- 内置代码检索引擎
- 支持 Repo Wiki
- 集成长短期记忆系统
- 除了提供 Ask Mode(问答模式) 和 Agent Mode(智能体模式) 之外,Qoder 新增了 Quest Mode(AI自主编程)
体验地址:qoder.com
+ qwen开源一个图片编辑模型Qwen-Image-Edit(Qwen-Image 的图像编辑版本),类似gpt-image-1和google gemini image的功能 。Qwen-Image-Edit 基于20B Qwen-Image 模型,将 Qwen-Image 独特的文本渲染功能扩展到图像编辑任务中,实现精确的文本编辑。并且支持多图 reference。实际效果很强大。
Blog地址:qwenlm.github.io/zh/blog/qwen-image-edit
体验地址:chat.qwen.ai
Repo地址: github.com/QwenLM/Qwen-Image
模型地址: huggingface.co/Qwen/Qwen-Image-Edit
## 3. 字节 Seed-OSS 系列模型开源
模型大小都是36B。这个模型的特性是可以调整思考长度(类似 GPT-OSS 调整思考长度的 low-high). 以及针对 Agent 性能进行了优化。原生上下文长度为512K。目前从官方放出的测试数据来看,基本是30B这个规模大模型的 SOTA。
模型包括:
- Seed-OSS-36B-Base (基础模型,包含了合成指令数据的预训练版本)
- Seed-OSS-36B-Base-woSyn (基础模型的"纯净版",没有经过合成指令数据的预训练)
- Seed-OSS-36B-Instruct (指令微调模型,适用于各种下游任务,在智能体任务和推理能力上表现比较好)
模型地址:
- huggingface.co/ByteDance-Seed/Seed-OSS-36B-Base
- huggingface.co/ByteDance-Seed/Seed-OSS-36B-Base-Instruct
- huggingface.co/ByteDance-Seed/Seed-OSS-36B-Base-woSyn
字节AI硬件OCEAN团队研发豆包手机中,中兴 ODM 代工,可能年底或明年年初内部推出
## 4. 智谱发布 AutoGLM 智能体
> 感觉像是给用户预制了1台云端虚拟手机(云手机),实际体验怎么样呢?各大应用商店下载试试吧,注意保护个人隐私
- 可能是世界上首个手机通用 Agent
- 操作全在云手机&云电脑上运行
- 全平台覆盖的客户端,IOS&安卓均支持
- 可以实现多个应用联动自动操作(点外卖、订机票)
## 5. 其他动态
1. OpenAI 7 月份营收达到了 10 亿美元。
ChatGPT Go —— 一款全新的低成本订阅计划,首先支持印度,价格为每月 399 卢比(约合 4.55 美元),会将根据用户的反馈进行学习和调整,然后再决定是否推广到其他国家。与免费版相比,Go 套餐提供了:消息上限提升 10 倍、图像生成数量提升 10 倍、文件上传数量提升 10 倍,以及记忆时长延长 2 倍
2. 马斯克宣布 grok2开源(开源弱鸡模型没人用的),模型地址:huggingface.co/xai-org/grok-2
3. 为何精神控制类Prompt远胜普通事务性Prompt:机制解析与实战指南 jieyibu.net/a/87962 github.com/linkerlin/PUAX
4. NASA 和 IBM 联合搞了个大模型——Surya-1.0 是用来预测太阳耀斑的。模型大小1.8GB左右。
模型地址:huggingface.co/nasa-ibm-ai4science/Surya-1.0
5. Google DeepMind 的研究员展示了他们在AI生成的世界里(Genie 3)训练AI 的场景。世界模型 Genie 3,能够即时想象并生成全新的世界。具身智能体 Sima 被投放到这些世界中,并能自主学习如何在其中导航。
6. 一个在线可玩的实时通用领域生成世界引擎,Mirage 2,上传图片可以变成可玩的环境,通过对话也可以改变环境。目前 Mirage 2 能够创造10分钟以上的交互视频,延迟为 200 毫秒。
体验地址:dynamicslab.ai
7. Runway 推出了通用世界模型(General World Models),能够实时生成拥有独一无二角色和故事的游戏。每一次游玩都会有不同的事件发生,甚至可以自己打造专属的故事和玩法。目前只支持图文模式。
体验地址:play.runwayml.com
8. 据称,英伟达正基于最新Blackwell架构为中国开发两款新型AI芯片:一款暂名B30A,原始算力约为其旗舰B300的一半,具备高宽带内存与NVLink技术,性能优于当前获准销售的H20,该芯片规格尚未完全确定,但英伟达计划最快下月向中国客户交付样品进行测试;另一款中国专供芯片则于今年5月被报道,暂名RTX6000D,主要用途为AI推理任务,售价低于H20,内存带宽略低于美国政府限制阈值,预计9月小批量交付。
9. Google Pixel 10 手机发布,可以本地运行 Gemini Nano 模型。手机系统的所有自带软件全部 AI 化(AI 软件场景有 AI 健康教练和 AI 修图&拍摄指导),多个系统 APP 之间的 AI 能力可以联动,输出的信息可以相互流转。除了手机之外的其他硬件产品也全部加上了 Gemini 的对话和沟通能力。新的 Pixel Watch 4 有 Gemini 驱动的健身教练能力,提供主动健身与睡眠指导及按需建议,通过“抬腕交谈”唤出 Gemini 交流。
## Github Repos Recommend
1. agent-lightning 一个智能体训练框架,由微软开源,配置使用较为简单且不受限于各种框架。
Repo 地址:github.com/microsoft/agent-lightning
2. 开源AI生成图片检测对抗工具 Image-Detection-Bypass-Utility
可以通过噪声注入、FFT 平滑、FFT 匹配、像素扰动、相机模拟等来绕过 AI 图像检测。支持 ComfyUI 工作流的接入。
Repo地址:github.com/PurinNyova/Image-Detection-Bypass-Utility
3. 类似 AI操作手机的框架 DroidRun的开源项目 mobile-use
Repo地址:github.com/minitap-ai/mobile-use
4. AgenticSeek:一个私有、本地的 Manus 替代方案
一个本地运行的 Manus AI 替代品,支持语音 AI 助手,可自主浏览网页、编写代码、规划任务,所有数据仅保存在本地设备上。
Repo地址:github.com/Fosowl/agenticSeek/
---
## 1. Deepseek 更新 V3.1 模型
> 评价两极分化严重,只能期待 R2 或者 V4 了
- DeepSeek-V3.1-Base 是一个 Hybrid-Model, 可以开关思考模式(这不是Qwen 通过社区验证已经放弃了的嘛?混合模型在非推理任务上的性能损失非常严重),更新记录:api-docs.deepseek.com/zh-cn/news/news250821
- 支持了anthropic API模式,可以接入Claude code,参考文档:api-docs.deepseek.com/zh-cn/guides/anthropic_api
- 新增原生 search token 的支持
- 后续模型取消夜间优惠,涨价是始料未及的
模型地址:huggingface.co/deepseek-ai/DeepSeek-V3.1-Base
## 2. 阿里
> 感觉阿里现在得有1万个部门在搞AI
- 阿里面向全球市场发布了 Agentic 编程平台 Qoder。又一个新的叫Qoder的IDE,难道通义灵码不用了嘛?
- 内置代码检索引擎
- 支持 Repo Wiki
- 集成长短期记忆系统
- 除了提供 Ask Mode(问答模式) 和 Agent Mode(智能体模式) 之外,Qoder 新增了 Quest Mode(AI自主编程)
体验地址:qoder.com
+ qwen开源一个图片编辑模型Qwen-Image-Edit(Qwen-Image 的图像编辑版本),类似gpt-image-1和google gemini image的功能 。Qwen-Image-Edit 基于20B Qwen-Image 模型,将 Qwen-Image 独特的文本渲染功能扩展到图像编辑任务中,实现精确的文本编辑。并且支持多图 reference。实际效果很强大。
Blog地址:qwenlm.github.io/zh/blog/qwen-image-edit
体验地址:chat.qwen.ai
Repo地址: github.com/QwenLM/Qwen-Image
模型地址: huggingface.co/Qwen/Qwen-Image-Edit
## 3. 字节 Seed-OSS 系列模型开源
模型大小都是36B。这个模型的特性是可以调整思考长度(类似 GPT-OSS 调整思考长度的 low-high). 以及针对 Agent 性能进行了优化。原生上下文长度为512K。目前从官方放出的测试数据来看,基本是30B这个规模大模型的 SOTA。
模型包括:
- Seed-OSS-36B-Base (基础模型,包含了合成指令数据的预训练版本)
- Seed-OSS-36B-Base-woSyn (基础模型的"纯净版",没有经过合成指令数据的预训练)
- Seed-OSS-36B-Instruct (指令微调模型,适用于各种下游任务,在智能体任务和推理能力上表现比较好)
模型地址:
- huggingface.co/ByteDance-Seed/Seed-OSS-36B-Base
- huggingface.co/ByteDance-Seed/Seed-OSS-36B-Base-Instruct
- huggingface.co/ByteDance-Seed/Seed-OSS-36B-Base-woSyn
字节AI硬件OCEAN团队研发豆包手机中,中兴 ODM 代工,可能年底或明年年初内部推出
## 4. 智谱发布 AutoGLM 智能体
> 感觉像是给用户预制了1台云端虚拟手机(云手机),实际体验怎么样呢?各大应用商店下载试试吧,注意保护个人隐私
- 可能是世界上首个手机通用 Agent
- 操作全在云手机&云电脑上运行
- 全平台覆盖的客户端,IOS&安卓均支持
- 可以实现多个应用联动自动操作(点外卖、订机票)
## 5. 其他动态
1. OpenAI 7 月份营收达到了 10 亿美元。
ChatGPT Go —— 一款全新的低成本订阅计划,首先支持印度,价格为每月 399 卢比(约合 4.55 美元),会将根据用户的反馈进行学习和调整,然后再决定是否推广到其他国家。与免费版相比,Go 套餐提供了:消息上限提升 10 倍、图像生成数量提升 10 倍、文件上传数量提升 10 倍,以及记忆时长延长 2 倍
2. 马斯克宣布 grok2开源(开源弱鸡模型没人用的),模型地址:huggingface.co/xai-org/grok-2
3. 为何精神控制类Prompt远胜普通事务性Prompt:机制解析与实战指南 jieyibu.net/a/87962 github.com/linkerlin/PUAX
4. NASA 和 IBM 联合搞了个大模型——Surya-1.0 是用来预测太阳耀斑的。模型大小1.8GB左右。
模型地址:huggingface.co/nasa-ibm-ai4science/Surya-1.0
5. Google DeepMind 的研究员展示了他们在AI生成的世界里(Genie 3)训练AI 的场景。世界模型 Genie 3,能够即时想象并生成全新的世界。具身智能体 Sima 被投放到这些世界中,并能自主学习如何在其中导航。
6. 一个在线可玩的实时通用领域生成世界引擎,Mirage 2,上传图片可以变成可玩的环境,通过对话也可以改变环境。目前 Mirage 2 能够创造10分钟以上的交互视频,延迟为 200 毫秒。
体验地址:dynamicslab.ai
7. Runway 推出了通用世界模型(General World Models),能够实时生成拥有独一无二角色和故事的游戏。每一次游玩都会有不同的事件发生,甚至可以自己打造专属的故事和玩法。目前只支持图文模式。
体验地址:play.runwayml.com
8. 据称,英伟达正基于最新Blackwell架构为中国开发两款新型AI芯片:一款暂名B30A,原始算力约为其旗舰B300的一半,具备高宽带内存与NVLink技术,性能优于当前获准销售的H20,该芯片规格尚未完全确定,但英伟达计划最快下月向中国客户交付样品进行测试;另一款中国专供芯片则于今年5月被报道,暂名RTX6000D,主要用途为AI推理任务,售价低于H20,内存带宽略低于美国政府限制阈值,预计9月小批量交付。
9. Google Pixel 10 手机发布,可以本地运行 Gemini Nano 模型。手机系统的所有自带软件全部 AI 化(AI 软件场景有 AI 健康教练和 AI 修图&拍摄指导),多个系统 APP 之间的 AI 能力可以联动,输出的信息可以相互流转。除了手机之外的其他硬件产品也全部加上了 Gemini 的对话和沟通能力。新的 Pixel Watch 4 有 Gemini 驱动的健身教练能力,提供主动健身与睡眠指导及按需建议,通过“抬腕交谈”唤出 Gemini 交流。
## Github Repos Recommend
1. agent-lightning 一个智能体训练框架,由微软开源,配置使用较为简单且不受限于各种框架。
Repo 地址:github.com/microsoft/agent-lightning
2. 开源AI生成图片检测对抗工具 Image-Detection-Bypass-Utility
可以通过噪声注入、FFT 平滑、FFT 匹配、像素扰动、相机模拟等来绕过 AI 图像检测。支持 ComfyUI 工作流的接入。
Repo地址:github.com/PurinNyova/Image-Detection-Bypass-Utility
3. 类似 AI操作手机的框架 DroidRun的开源项目 mobile-use
Repo地址:github.com/minitap-ai/mobile-use
4. AgenticSeek:一个私有、本地的 Manus 替代方案
一个本地运行的 Manus AI 替代品,支持语音 AI 助手,可自主浏览网页、编写代码、规划任务,所有数据仅保存在本地设备上。
Repo地址:github.com/Fosowl/agenticSeek/