给大家演示下刚刚放出的 FLUX.1-Kontext 的修图效果
第一组:把美国国旗修改为法国国国旗,镜头虚焦可能需要进一步优化
第二组:移除门上的贴纸,完美,没问题
第三组:移除沙发旁边的红色物体。这个例子最复杂,需要处理阴影,反射和漫反射,可以看到地板上的反射处理得很好,但是窗帘上的漫反射不 https://mapp.api.weibo.cn/fx/5d54d1d7b200164cca2970a615effc89.html
第一组:把美国国旗修改为法国国国旗,镜头虚焦可能需要进一步优化
第二组:移除门上的贴纸,完美,没问题
第三组:移除沙发旁边的红色物体。这个例子最复杂,需要处理阴影,反射和漫反射,可以看到地板上的反射处理得很好,但是窗帘上的漫反射不 https://mapp.api.weibo.cn/fx/5d54d1d7b200164cca2970a615effc89.html
funwithcomputervision 发布了一个开源实时 3D 操纵器,你可以基于手势来操作投在界面上的任何物体,无论是缩放,移动,调节等等都能实现。
感觉这个对AI眼镜的操作还是很有帮助的,现在全是闭源实现(比如 Apple VisionPro ),终于看到了个开源实现。
在线体验地址,注意需要有摄像头: https://mapp.api.weibo.cn/fx/642e1084ad06ee48b071210b4dfdaa3b.html
感觉这个对AI眼镜的操作还是很有帮助的,现在全是闭源实现(比如 Apple VisionPro ),终于看到了个开源实现。
在线体验地址,注意需要有摄像头: https://mapp.api.weibo.cn/fx/642e1084ad06ee48b071210b4dfdaa3b.html
巅峰对决来了!Google发布了 Gemini-Cli 对标 Claude-Code。给大家梳理两个工具的快速对比!
其实连 Google 自己官推都没搞清楚 Gemini-cli 相对于 Claude-Code 强在哪里。
gemini-cli 其实定位是 Agentic Workflow Tool,Claude-code 是 Agentic Coding Tool
最大的原因是,Gemini-cli 不但拥有写 https://mapp.api.weibo.cn/fx/c562badb946efa47da3835a2342d2d12.html
其实连 Google 自己官推都没搞清楚 Gemini-cli 相对于 Claude-Code 强在哪里。
gemini-cli 其实定位是 Agentic Workflow Tool,Claude-code 是 Agentic Coding Tool
最大的原因是,Gemini-cli 不但拥有写 https://mapp.api.weibo.cn/fx/c562badb946efa47da3835a2342d2d12.html
【阿里巴巴发布全球首个胃癌影像筛查AI模型:CT就能识别早期胃癌】浙江省肿瘤医院联合阿里巴巴达摩院,发布了全球首个胃癌影像筛查AI模型DAMO GRAPE。
该模型首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅提升胃癌检出率。该AI模型是重大的医学突破,让 https://mapp.api.weibo.cn/fx/328482729d300bd4dbe01e89adbadcf6.html
该模型首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅提升胃癌检出率。该AI模型是重大的医学突破,让 https://mapp.api.weibo.cn/fx/328482729d300bd4dbe01e89adbadcf6.html
Gemini CLI 来了,谷歌的基于终端的编程 Agent ,开源(Apache 2.0 协议)。
链接:github.com/google-gemini/gemini-cli
Gemini CLI 可提供从代码理解、文件操作到命令执行与动态故障排除的强大 AI 功能。其命令行体验带来根本性升级,让用户能够用自然语言编写代码、调试问题并优化工作流程。
Gem https://mapp.api.weibo.cn/fx/c939228d882953e19ce9b0160ee3646f.html
链接:github.com/google-gemini/gemini-cli
Gemini CLI 可提供从代码理解、文件操作到命令执行与动态故障排除的强大 AI 功能。其命令行体验带来根本性升级,让用户能够用自然语言编写代码、调试问题并优化工作流程。
Gem https://mapp.api.weibo.cn/fx/c939228d882953e19ce9b0160ee3646f.html
《堂吉诃德》里的桑丘说话提到猪的时候要说抱歉,我就怀疑跟那段历史有关系。//@白饭如霜:哈哈哈哈//@河阳侯林登万DRY:哈哈哈哈//@黄斌:笑死…死猪不怕开水烫。//@江湖中的Seaman:被穆斯林统治过700年,所以西班牙人都是大胡子估计和这个有关系。 阿拉伯人当年没有灭了西班牙语。https://mapp.api.weibo.cn/fx/f5e754b34c479481c88e1eb8c69ce6d9.html
#模型学会启发式教学##小模型也能教出强推理#
7B小模型也能教出强推理AI?
Transformer作者之一Llion Jones,其公司Sakana AI提出的方法让模型“像人类教师一样”教学。
如此,模型就像有了参考答案,讲解推理过程毫不费力。这种RLT(Reinforcement Learning Teacher)模式,和过去AI训练方式有两个 https://mapp.api.weibo.cn/fx/a8dcc54ba05d475d435248a40ce9d33a.html
7B小模型也能教出强推理AI?
Transformer作者之一Llion Jones,其公司Sakana AI提出的方法让模型“像人类教师一样”教学。
如此,模型就像有了参考答案,讲解推理过程毫不费力。这种RLT(Reinforcement Learning Teacher)模式,和过去AI训练方式有两个 https://mapp.api.weibo.cn/fx/a8dcc54ba05d475d435248a40ce9d33a.html
据《The Information》报道,OpenAI 正准备通过在 ChatGPT 中添加文档协作和聊天沟通功能,直接与谷歌和微软展开竞争。这些消息来自两名曾亲眼见过设计方案的人士。他们透露,OpenAI 的产品负责人凯文·威尔(Kevin Weil)早在近一年前,就首次展示和讨论过该文档协作功能的设计。
报道称,OpenAI 已经 https://mapp.api.weibo.cn/fx/8a90408df2f82682cc518bf1923caa3b.html
报道称,OpenAI 已经 https://mapp.api.weibo.cn/fx/8a90408df2f82682cc518bf1923caa3b.html
▶️ Andrej Karpathy: Software Is Changing (Again) #youtube
https://www.youtube.com/watch?v=LCEmiRjPEtQ
https://www.youtube.com/watch?v=LCEmiRjPEtQ
昨天 Google 把 Agent2Agent 捐给 Linux 基金会了。
这个操作熟悉吗? 哈哈哈
https://www.linuxfoundation.org/press/linux-foundation-launches-the-agent2agent-protocol-project-to-enable-secure-intelligent-communication-between-ai-agents
这个操作熟悉吗? 哈哈哈
https://www.linuxfoundation.org/press/linux-foundation-launches-the-agent2agent-protocol-project-to-enable-secure-intelligent-communication-between-ai-agents
昨天这篇先设计再提示词然后生成代码 http://t.cn/A6DUvYZl 是针对 Claude Code 写的,其实并不只是适用于 Claude Code,重写了一篇:
先设计再写代码,还是先实现再重构?AI 编程让这种选择变的简单
在传统手工编程时代,经常会有争论:先把各种细节设计清楚再动手写代码?还是先实现,实现后再回过 https://mapp.api.weibo.cn/fx/5a540037434e557498db9f3a27f25bc4.html
先设计再写代码,还是先实现再重构?AI 编程让这种选择变的简单
在传统手工编程时代,经常会有争论:先把各种细节设计清楚再动手写代码?还是先实现,实现后再回过 https://mapp.api.weibo.cn/fx/5a540037434e557498db9f3a27f25bc4.html
酷,ElevenLabs刚刚放出了一款最新个人语音助手:11ai,支持MCP、工具集成,开始往实际场景中下沉了
可以用Perplexity进行搜索,也可以用语音管理Notion笔记,还集成了Linear、Slack等
支持自定义MCP,实现自定义工作流程
支持5000种声音,也可以使用自己的声音
目前免费使用,体验地址: https://mapp.api.weibo.cn/fx/1f9530df5b7608c1614d3eb26277cd6f.html
可以用Perplexity进行搜索,也可以用语音管理Notion笔记,还集成了Linear、Slack等
支持自定义MCP,实现自定义工作流程
支持5000种声音,也可以使用自己的声音
目前免费使用,体验地址: https://mapp.api.weibo.cn/fx/1f9530df5b7608c1614d3eb26277cd6f.html
分享一个vas 经过 100 多次迭代完善的 Cursor 规则。它强制代码完美,修改范围明确,并且不会出现代码膨胀。
中文直译(英文见后面)
——
标题:高级工程师任务执行规则
适用范围:所有任务
规则说明:
你是一位具备丰富经验的高级工程师,专精于构建可用于生产环境的 AI 智能体、自动化系统及工作 https://mapp.api.weibo.cn/fx/6bcfc2a8ebf6068668285d192132c072.html
中文直译(英文见后面)
——
标题:高级工程师任务执行规则
适用范围:所有任务
规则说明:
你是一位具备丰富经验的高级工程师,专精于构建可用于生产环境的 AI 智能体、自动化系统及工作 https://mapp.api.weibo.cn/fx/6bcfc2a8ebf6068668285d192132c072.html