给大家演示下刚刚放出的 FLUX.1-Kontext 的修图效果

第一组:把美国国旗修改为法国国国旗,镜头虚焦可能需要进一步优化

第二组:移除门上的贴纸,完美,没问题

第三组:移除沙发旁边的红色物体。这个例子最复杂,需要处理阴影,反射和漫反射,可以看到地板上的反射处理得很好,但是窗帘上的漫反射不 ​​​https://mapp.api.weibo.cn/fx/5d54d1d7b200164cca2970a615effc89.html
funwithcomputervision 发布了一个开源实时 3D 操纵器,你可以基于手势来操作投在界面上的任何物体,无论是缩放,移动,调节等等都能实现。

感觉这个对AI眼镜的操作还是很有帮助的,现在全是闭源实现(比如 Apple VisionPro ),终于看到了个开源实现。

在线体验地址,注意需要有摄像头: ​​​https://mapp.api.weibo.cn/fx/642e1084ad06ee48b071210b4dfdaa3b.html
巅峰对决来了!Google发布了 Gemini-Cli 对标 Claude-Code。给大家梳理两个工具的快速对比!

其实连 Google 自己官推都没搞清楚 Gemini-cli 相对于 Claude-Code 强在哪里。

gemini-cli 其实定位是 Agentic Workflow Tool,Claude-code 是 Agentic Coding Tool

最大的原因是,Gemini-cli 不但拥有写 ​​​https://mapp.api.weibo.cn/fx/c562badb946efa47da3835a2342d2d12.html
【阿里巴巴发布全球首个胃癌影像筛查AI模型:CT就能识别早期胃癌】浙江省肿瘤医院联合阿里巴巴达摩院,发布了全球首个胃癌影像筛查AI模型DAMO GRAPE。

该模型首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅提升胃癌检出率。该AI模型是重大的医学突破,让 ​​​https://mapp.api.weibo.cn/fx/328482729d300bd4dbe01e89adbadcf6.html
Gemini CLI 来了,谷歌的基于终端的编程 Agent ,开源(Apache 2.0 协议)。

链接:github.com/google-gemini/gemini-cli

Gemini CLI 可提供从代码理解、文件操作到命令执行与动态故障排除的强大 AI 功能。其命令行体验带来根本性升级,让用户能够用自然语言编写代码、调试问题并优化工作流程。

Gem ​​​https://mapp.api.weibo.cn/fx/c939228d882953e19ce9b0160ee3646f.html
《堂吉诃德》里的桑丘说话提到猪的时候要说抱歉,我就怀疑跟那段历史有关系。//@白饭如霜:哈哈哈哈//@河阳侯林登万DRY:哈哈哈哈//@黄斌:笑死…死猪不怕开水烫。//@江湖中的Seaman:被穆斯林统治过700年,所以西班牙人都是大胡子估计和这个有关系。 阿拉伯人当年没有灭了西班牙语。https://mapp.api.weibo.cn/fx/f5e754b34c479481c88e1eb8c69ce6d9.html
#模型学会启发式教学##小模型也能教出强推理#

7B小模型也能教出强推理AI?

Transformer作者之一Llion Jones,其公司Sakana AI提出的方法让模型“像人类教师一样”教学。

如此,模型就像有了参考答案,讲解推理过程毫不费力。这种RLT(Reinforcement Learning Teacher)模式,和过去AI训练方式有两个 ​​​https://mapp.api.weibo.cn/fx/a8dcc54ba05d475d435248a40ce9d33a.html
据《The Information》报道,OpenAI 正准备通过在 ChatGPT 中添加文档协作和聊天沟通功能,直接与谷歌和微软展开竞争。这些消息来自两名曾亲眼见过设计方案的人士。他们透露,OpenAI 的产品负责人凯文·威尔(Kevin Weil)早在近一年前,就首次展示和讨论过该文档协作功能的设计。

报道称,OpenAI 已经 ​​​https://mapp.api.weibo.cn/fx/8a90408df2f82682cc518bf1923caa3b.html
我有个大胆的猜想,Linux 未来可能也会是微软主导的一个社区了
昨天这篇先设计再提示词然后生成代码 http://t.cn/A6DUvYZl 是针对 Claude Code 写的,其实并不只是适用于 Claude Code,重写了一篇:

先设计再写代码,还是先实现再重构?AI 编程让这种选择变的简单

在传统手工编程时代,经常会有争论:先把各种细节设计清楚再动手写代码?还是先实现,实现后再回过 ​​​https://mapp.api.weibo.cn/fx/5a540037434e557498db9f3a27f25bc4.html
酷,ElevenLabs刚刚放出了一款最新个人语音助手:11ai,支持MCP、工具集成,开始往实际场景中下沉了

可以用Perplexity进行搜索,也可以用语音管理Notion笔记,还集成了Linear、Slack等

支持自定义MCP,实现自定义工作流程

支持5000种声音,也可以使用自己的声音

目前免费使用,体验地址: ​​​https://mapp.api.weibo.cn/fx/1f9530df5b7608c1614d3eb26277cd6f.html
分享一个vas 经过 100 多次迭代完善的 Cursor 规则。它强制代码完美,修改范围明确,并且不会出现代码膨胀。

中文直译(英文见后面)
——
标题:高级工程师任务执行规则

适用范围:所有任务

规则说明:
你是一位具备丰富经验的高级工程师,专精于构建可用于生产环境的 AI 智能体、自动化系统及工作 ​​​https://mapp.api.weibo.cn/fx/6bcfc2a8ebf6068668285d192132c072.html
Back to Top