摩尔线程宣布S5000 Day-0适配DeepSeek-V4

2026-04-24 17:50:13 上海证券报未分类

上证报中国证券网讯（记者窦世平）摩尔线程4月24日携手智源众智FlagOS社区，在旗舰级AI训推一体全功能GPUMTTS5000上，率先实现对新一代大模型DeepSeek-V4-Flash的极速适配，并完成了全量核心算子的深度优化与部署支持。

据介绍，DeepSeek-V4-Flash采用混合专家（MoE）架构，总参数量高达284B，激活参数13B，支持百万token上下文长度。其预训练数据超32Ttoken，在最大推理力度模式（Flash-Max）下推理能力逼近Pro版本。值得关注的是，V4模型首次采用“FP4+FP8”混合精度策略，而当前国内主流AI芯片仍普遍以BF16为主。摩尔线程表示，凭借独特的原生FP8支持优势，MTTS5000能够更高效承载DeepSeek-V4的前沿精度设计，为模型部署与推理优化提供了坚实的算力底座。

作为国内率先原生支持FP8精度的全功能GPU，MTTS5000配置了强大的硬件级FP8TensorCore加速单元。相比传统的BF16/FP16，FP8能够将数据位宽直接减半，使显存带宽压力降低50%，理论计算吞吐量实现翻倍。

为充分发挥MTTS5000在FP8计算上的内核优势，FlagOS对DeepSeekV4模型进行了FP8量化。通过系统级分析，双方技术团队将本次适配的攻坚重点锁定在FP8算子与SparseAttention算子。针对这两个决定长上下文效率与极致推理性能的关键算子，团队从“编译优化”与“自动调优”两个核心方向取得了突破。

当前，摩尔线程与FlagOS社区正持续推进拥有1.6T旗舰模型（1.86万亿参数）的DeepSeek-V4-Pro在MTTS5000上的迁移适配工作。摩尔线程表示，未来，公司将继续以MUSA架构与全功能GPU的全栈技术优势，为国产大模型生态提供更高效、更自主可控的算力基石。

阅读：4 点赞：0

云霞资讯网

摩尔线程宣布S5000 Day-0适配DeepSeek-V4

热门分类

摩尔线程宣布S5000 Day-0适配DeepSeek-V4

猜你喜欢

黄仁勋直言：华为芯片加上DeepSeek，美国怕的不只是丢市场英伟达CEO黄

DeepSeekV4发布碰到了什么问题？国产大模型都在搞什么？DeepSeek

DeepSeek发新项目了！但不是v4地址：github.com/deepsee

DeepSeek-V4预览版官宣发布DeepSeekV4发布真的发布了，看看

本以为横空出世的DeepSeek，是去跟硅谷巨头硬刚的国货之光。弄了半天，梁老板

⚡国产AI双雄炸场！DeepSeekV4|Qwen3.6-27B颠覆行业，

台积电宣布停供大陆7纳米以下的芯片，以为会大乱，没想到十多天过去了，依然风平浪静

热门分类