acshame

一位 Meta 工程师的「用 Cursor 做个推特」教程，主要是用 ChatGPT 来写项目的开发文档：

第一步：构建 architecture.md

打开 ChatGPT（4o，不是 o1/o3/o4）并说：

“我正在构建一个[产品描述 - 越详细越好]。前端使用 Next.js，数据库和身份验证使用 Supabase。

给我完整的架构：
- 文件 + 文 https://mapp.api.weibo.cn/fx/51ce56dc4ba8ee605a666bb432cc006f.html

12:58 · 2025年5月19日 · 周一

#学习的本质是极致的重复# （转）世界上被证明最有效率的四个学习方法，值得好好看看，受益匪浅。

1、费曼学习法

曾经有一个农民让自己的孩子从学校回来之后，把在学校学到的知识讲给自己听。这样他也可以学到知识了。可没想到，他孩子的学习成绩从此特别优异，最终考上了清华。

这个农民无意中采用 https://mapp.api.weibo.cn/fx/abccc97723f7d95e0537bb4110e37326.html

11:56 · 2025年5月19日 · 周一

//@水獭otter:这老兄厉害了。//@伊洛牧:出问题大部分时间用来解释客观原因，而非如何详述补救措施及可能，引以为戒//@学术状态帝:这彭家荣把在欧美职场不能说的都一股脑地说了出来[允悲]有种隐形的畅快感//@程序员邹欣:1. 虚假的团队凝聚力， 2. 内耗&爱辩论， 3. 眼高手低//https://mapp.api.weibo.cn/fx/6a4677ce517c6aced0c9bb468fb70e6e.html

03:06 · 2025年5月19日 · 周一

https://weibo.com/ttarticle/p/show?id=2309405167743040356555&mark_id=followtopweibo

03:06 · 2025年5月19日 · 周一

https://weibo.com/ttarticle/p/show?id=2309405166759878721584

03:03 · 2025年5月19日 · 周一

02:50 · 2025年5月19日 · 周一

https://weibo.com/2169039837/PrJHNvYOQ

Weibo

Unsloth 刚刚发布了他们的 GRPO 的新互动... 来自karminski-牙医 - 微博

Unsloth 刚刚发布了他们的 GRPO 的新互动教程 (ipynb notebook)

只需要跟着教程一步步来就能微调 Qwen3-Base 并且开启思考模式，并且是 GRPO 的所以可以几乎让模型无监督学习

地址：colab.research.google.com...

02:45 · 2025年5月19日 · 周一

https://weibo.com/2169039837/Ps1kfqKJC

Weibo

卧槽这个好转发@零重力瓦力：技术博主 ... 来自karminski-牙医 - 微博

卧槽这个好【转发】@零重力瓦力：技术博主 Geekademy 推荐了一款高效的视频转博客工具 Video to Blog，大大简化了内容创作的流程。以往要将视频转化为博客，需要先将视频内容转成文字，再进行格式整理、SEO 优化...

02:45 · 2025年5月19日 · 周一

https://weibo.com/7402396589/PrX8x6u4i

Weibo

hdr.closeai.moe ( )
搞了个在线的小工具... 来自阿尼亚是安妮亞 - 微博

hdr.closeai.moe ( http://t.cn/A6gtHLxV )
搞了个在线的小工具，可以把任意图片转成这种亮瞎眼的wx表情包
不过好像有个问题是，不一定在每台设备上都生效(有些玄学)

02:43 · 2025年5月19日 · 周一

https://weibo.com/2169039837/PscKjeyQp

Weibo

MiniMax 新发布的TTS (文本转语音) 大模型 ... 来自karminski-牙医 - 微博

MiniMax 新发布的TTS (文本转语音) 大模型 Speech-02-HD 在 TTS-Arena-V2 霸榜了，我给大家录了个 demo，使用回春丹的《鲜花》的歌词，来听听生成得怎么样！

第一个音色是 Trustworth_Man，听着一股京片子味儿哈...

02:24 · 2025年5月19日 · 周一

https://weibo.com/5648162302/PrAjnynRJ

Weibo

这篇文章介绍了Claude 系统提示词有趣的发... 来自黄建同学 - 微博

这篇文章介绍了Claude 系统提示词有趣的发现↓

Claude's System Prompt: Chatbots Are More Than Just Models（Claude 系统提示：聊天机器人不仅仅是模型）

……

Claude 的系统提示很长，有 16,739 个字，也就是 ...

02:22 · 2025年5月19日 · 周一

https://weibo.com/5648162302/PrM4riuck

Weibo

斯坦福大学邀请Andrej Karpathy介绍Transfo... 来自黄建同学 - 微博

斯坦福大学邀请Andrej Karpathy介绍Transformer的一个老视频，很值得看↓

Stanford CS25: V2 I Introduction to
Transformers w/ Andrej Karpathy

在这个视频中，深入研究了Transformer的工作原理，并详细探讨了...

02:21 · 2025年5月19日 · 周一

deepseek又发新论文了！arxiv.org/pdf/2505.09343
论文主要介绍了DeepSeek-V3在硬件架构方面的挑战和创新，以及如何通过软硬件协同设计实现高效训练和推理。
关键结论
✨内存效率：DeepSeek-V3 通过 MLA 将 KV 缓存大小显著减少到每个 token 仅需 70 KB，远低于其他模型（如 Qwen-2.5 72B 的 327 KB 和 LLaMA-3.1 405B 的 516 KB）。这使得模型更适合处理长文本和资源受限的环境。
✨成本效益：MoE 架构允许在训练时仅激活部分参数，从而显著降低计算需求。例如，DeepSeek-V3 在扩展到 671B 参数时，每个 token 的激活参数仅为 37B，相比全参数激活的密集模型（如 72B 的 Qwen 和 405B 的 LLaMA），计算成本大幅降低。
✨推理速度：通过重叠计算和通信以及多令牌预测模块，DeepSeek-V3 在推理时能够显著提高吞吐量和响应速度。例如，多令牌预测模块可以将生成速度提高 1.8 倍。
✨低精度计算：FP8 混合精度训练在 DeepSeek-V3 中首次应用于大规模模型训练，通过细粒度量化策略，相对 BF16 的精度损失控制在 0.25% 以内。
✨网络优化：采用多平面两层 Fat-Tree 网络拓扑，相比传统的三层 Fat-Tree 拓扑，显著降低了网络成本，并提高了网络的鲁棒性和可扩展性。
论文还提出了对未来 AI 硬件的建议和展望。

02:20 · 2025年5月19日 · 周一

https://weibo.com/2194035935/PrUEzBh30

Weibo

deepseek又发新论文了！arxiv.org/pdf/2505... 来自蚁工厂 - 微博

deepseek又发新论文了！arxiv.org/pdf/2505.09343
论文主要介绍了DeepSeek-V3在硬件架构方面的挑战和创新，以及如何通过软硬件协同设计实现高效训练和推理。
关键结论
✨内存效率：DeepSeek-V3 通过 MLA 将 KV 缓...