Vibe Coding 要变天了?!OpenAI 发布代码 Agent:Codex

划重点:
1️⃣云:每个任务都在云沙盒环境中运行(预加指定代码库
2️⃣同时多任务
3️⃣底层模型为 codex-1:基于 o3 的 SWE(软件工程) 微调版本
4️⃣Pro 用户今天可用,Plus 要等
5️⃣API 定价:codex-mini-latest
输入:$1.5/1m tokens
输出:$6/1m tokens
6️⃣未来计划:支持实时协作和异步委托,将推出更具交互性和灵活性的 Agent 工作流程

细节:
7️⃣能力:Codex 可以读取和编辑文件,可运行包括测试工具、linters 和类型检查器等命令
8️⃣用时参考:一般任务需 1 min 30 s,可以实时监控 Codex 的进度
9️⃣完成结果:Codex 完成任务后会在其环境中提交更改,并通过引用终端日志和测试输出来提供其操作的可验证证据,可以追踪任务完成过程中的每个步骤
可以查看结果、请求进一步修订、提交 GitHub 拉取请求,或直接将更改集成到本地环境中
在产品中,可以配置 Codex 环境,使其尽可能与实际开发环境匹配

官文:https://openai.com/index/introducing-codex/ Introducing Codex
#模型时代# 谷歌CEO皮查伊这段话含金量挺高的,由Gemini驱动的编码agent,优化了Gemini的训练,形成了一个数据飞轮。换句话说:AI训练AI。 ​​​https://mapp.api.weibo.cn/fx/cf933e68c840f4b12dc602cc2a22a6cf.html
Minimax 最近发布的 Speech-02 音频模型,无论是打榜还是实际体验都很不错。今天技术报告也发布了。 arxiv.org/pdf/2505.07916
总的来说,该模型应用的 MiniMax-Speech 技术通过可学习的说话人编码器实现了高质量、高表现力、高相似度的真正零样本语音克隆,摆脱了对参考音频文本转录的依赖。结合Flow- ​​​https://mapp.api.weibo.cn/fx/3c45b8ff878b468b81c8cf93b082d05a.html
美国新闻报纸数据库:1780-1960。Melissa Dell及合作者使用美国公共图书馆接近2000万份的报纸扫描件,通过深度学习和OCR技术,获得了11.4亿篇文本数据。http://t.cn/A6gqk6Vu
#data# ​​​https://mapp.api.weibo.cn/fx/9667b9a1a44e4832209650348eceb58b.html
实现AGI真的要来了吗?即 AlphaGo 在围棋上打败人类,Google 又要在数学和算法上打败人类了?

Google 刚刚发布了一个 AI Agent —— AlphaEvolve, 它成功的找到了一种全新的算法,性能超过了 Strassen 1969年发明的算法!

AlphaEvolve 是一个基于 Gemini 的编程 Agent, 他在数学分析、几何、组合学和 ​​​https://mapp.api.weibo.cn/fx/7bfd1a5450466ea8bfdb253eed66d87c.html
DeepLearning AI吴恩达终于推出MCP课程了!
MCP: 使用Anthropic构建丰富上下文AI应用。

在这个短课程中,由Anthropic的技术教育负责人Elie 教授,你将学习如何构建能够利用模型上下文协议(MCP)访问工具、数据和提示的AI应用。

1️⃣ 传统上,将AI应用连接到能够为基于大型语言模型(LLM)的应用带 ​​​https://mapp.api.weibo.cn/fx/a0b243805865aa0c676611bfead8d2e9.html
万相2.1 (wan 2.1) 来啦!这次发布的是 Wan2.1-VACE-14B 和 Wan2.1-VACE-1.3B

之前发布的都是单一功能的模型,这次是 all-in-one, 支持文本到视频、图像到视频、视频编辑、文本到图像和视频到音频。另外它是首个支持在视频中生成中文和英文的模型。

我在wan网页版给大家录了个demo,视频中我拍了一个 ​​​https://mapp.api.weibo.cn/fx/dc5b35575cc3d0e9883813b6da7bed82.html
OpenAI: 应广大用户要求,GPT-4.1今天起在ChatGPT上线了!
GPT-4.1是专门针对编程任务和指令执行优化的模型。它的速度更快,因此对日常的编程任务来说,是比OpenAI的o3和o4-mini更好的选择。

目前,Plus、Pro和Team版本用户都可以通过模型选择器里的「更多模型」下拉菜单来使用GPT-4.1。企业版(Enter ​​​https://mapp.api.weibo.cn/fx/d7f4f8e0bcad3a72e531b4a0f4daf06c.html
又一个能操作手机的大模型来啦!AgentCPM-GUI

由由清华大学THUNLP实验室和面壁智能共同开发,基于 MiniCPM-V,参数量8B。视频中演示的场景是打开蒙古上单检查李子柒是否发了新视频。

地址:github.com/OpenBMB/AgentCPM-GUI/blob/main/README_zh.md

#ai创造营##AI生活指南# http://t.cn/A6gGtDsz ​​​https://mapp.api.weibo.cn/fx/a7212a8af0d977748abcea3aa142efd4.html
根据 The Information 的报道,Anthropic 公司计划在未来几周内推出新版本的人工智能模型 Claude Sonnet 和 Claude Opus。这些新模型的突出能力是能够在“思考模式”和“工具使用模式”之间灵活切换,以更有效地解决复杂问题。这一消息得到了两位曾经试用过这些模型的知情人士的证实。

* 举例来说,如 ​​​https://mapp.api.weibo.cn/fx/bec313c1e2e2edcae1a34ab8123f9245.html
这个定律,预言了你的人生进度条!
一秒、一天、一年的时长从来没有变过。为什么我们会觉得时间越过越快呢?
这个问题可不是心理学的错觉,或许看完这个视频,你就会明白自己为什么总是怀念童年。 http://t.cn/A6gh7d2P ​​​https://mapp.api.weibo.cn/fx/053f0382b118b2c5dcd33c6f5582e156.html
来看个神奇的项目——mergekit

这个 python 项目可以将多个大模型合并为一个,比如你有一个模型A,感觉它写作特别好,然后有个模型B,感觉它写代码很好,那么用这个 mergekit 就能将两个模型合并为一个。除此之外,在模型之间迁移能力也是可以的。

另外这个项目是可以用CPU合并的,当然用GPU加速也可 ​​​https://mapp.api.weibo.cn/fx/f77c66154092f8f5487ab8857b52ce18.html
Back to Top