Skip to main content

acshame

  1. funwithcomputervision 发布了一个开源实时 3D 操纵器,你可以基于手势来操作投在界面上的任何物体,无论是缩放,移动,调节等等都能实现。

    感觉这个对AI眼镜的操作还是很有帮助的,现在全是闭源实现(比如 Apple VisionPro ),终于看到了个开源实现。

    在线体验地址,注意需要有摄像头: ​​​https://mapp.api.weibo.cn/fx/642e1084ad06ee48b071210b4dfdaa3b.html
  2. 【阿里巴巴发布全球首个胃癌影像筛查AI模型:CT就能识别早期胃癌】浙江省肿瘤医院联合阿里巴巴达摩院,发布了全球首个胃癌影像筛查AI模型DAMO GRAPE。

    该模型首次利用平扫CT影像识别早期胃癌病灶,并联合全国20家医院,在近10万人的大规模临床研究中大幅提升胃癌检出率。该AI模型是重大的医学突破,让 ​​​https://mapp.api.weibo.cn/fx/328482729d300bd4dbe01e89adbadcf6.html
  3. #模型学会启发式教学##小模型也能教出强推理#

    7B小模型也能教出强推理AI?

    Transformer作者之一Llion Jones,其公司Sakana AI提出的方法让模型“像人类教师一样”教学。

    如此,模型就像有了参考答案,讲解推理过程毫不费力。这种RLT(Reinforcement Learning Teacher)模式,和过去AI训练方式有两个 ​​​https://mapp.api.weibo.cn/fx/a8dcc54ba05d475d435248a40ce9d33a.html
  4. 据《The Information》报道,OpenAI 正准备通过在 ChatGPT 中添加文档协作和聊天沟通功能,直接与谷歌和微软展开竞争。这些消息来自两名曾亲眼见过设计方案的人士。他们透露,OpenAI 的产品负责人凯文·威尔(Kevin Weil)早在近一年前,就首次展示和讨论过该文档协作功能的设计。

    报道称,OpenAI 已经 ​​​https://mapp.api.weibo.cn/fx/8a90408df2f82682cc518bf1923caa3b.html
  5. 昨天这篇先设计再提示词然后生成代码 http://t.cn/A6DUvYZl 是针对 Claude Code 写的,其实并不只是适用于 Claude Code,重写了一篇:

    先设计再写代码,还是先实现再重构?AI 编程让这种选择变的简单

    在传统手工编程时代,经常会有争论:先把各种细节设计清楚再动手写代码?还是先实现,实现后再回过 ​​​https://mapp.api.weibo.cn/fx/5a540037434e557498db9f3a27f25bc4.html
  6. 分享一个vas 经过 100 多次迭代完善的 Cursor 规则。它强制代码完美,修改范围明确,并且不会出现代码膨胀。

    中文直译(英文见后面)
    ——
    标题:高级工程师任务执行规则

    适用范围:所有任务

    规则说明:
    你是一位具备丰富经验的高级工程师,专精于构建可用于生产环境的 AI 智能体、自动化系统及工作 ​​​https://mapp.api.weibo.cn/fx/6bcfc2a8ebf6068668285d192132c072.html
  7. 一款综合多模态文档处理RAG系统:RAG-Anything,可以无缝处理/查询文本、图像、表格、公式等复杂文档

    提供从文档摄取、解析到智能多模态问答的端到端多模态处理流程

    自动提取实体和跨模态关系的多模态知识图谱
    支持PDF、Office文档、图像、文本文件等通用文档

    特点在于它的多模态理解、一体化流程、 ​​​https://mapp.api.weibo.cn/fx/8ab1dbc1d8ad024e5fccafa3387cf22c.html