acshame
02:20 · 2025年5月19日 · 周一
https://weibo.com/2194035935/PrUEzBh30
Weibo
deepseek又发新论文了!arxiv.org/pdf/2505... 来自蚁工厂 - 微博
deepseek又发新论文了!arxiv.org/pdf/2505.09343
论文主要介绍了DeepSeek-V3在硬件架构方面的挑战和创新,以及如何通过软硬件协同设计实现高效训练和推理。
关键结论
✨
内存效率:DeepSeek-V3 通过 MLA 将 KV 缓...
Home
Powered by
BroadcastChannel
&
Sepia