【东吴电子陈海进】寒武纪:直击CUDA“痛点”,国产AI芯片的软件生态“站起来了”! 📍易用好用,寒武纪引领AI芯片软件新生态 ➡️11/3日晚,寒武纪官宣——经过多年投入与积累,寒武纪基础软件平台Cambricon NeuWare已经日趋成熟,全面兼容社区最新PyTorch版本和Triton算子开发语言,支持用户模型和自定义算子快速迁移。 📍大模型&搜广推,训练&推理,均已完成大规模的技术和产品验证 ➡️搜广推训练方向:寒武纪稳步推进技术和产品验证。验证结果表明,解决方案可支撑多场景下的流式训练任务,可持续超数月稳定运行,精度与稳定性均满足要求。持续性能优化方面,完成Layernorm/RMSNorm/L2Norm等多种图匹配融合,显著提升性能。在图融合基础上进一步优化XLA支持,并获得更显著的加速比结果。 ➡️大模型训练方向:寒武纪重点支持DeepSeek V3/V3.1、Qwen2.5/Qwen3/Qwen3-next等MoE类模型训练,同时扩展了GLM4.5、Flux、Wan2.1/2.2、Qwen3-VL、Hunyuan-Video等模型的训练支持。基于原生FP8的计算能力,新增Qwen/DeepSeek等系列网络FP8的训练支持,精度符合预期。 ➡️大模型推理方向:寒武纪研究并实践W4A4以及MX-FP8/MX-FP4等新型数据类型,探索并支持多种高效注意力机制,包括Sparse Attention与Linear Attention。 🧧观点重申:软件生态一直以来是国产AI芯片的痛点和难点问题,经过多年打磨,国产AI芯片的软件能力已取得巨大进步。市场也对以寒武纪为代表的国产算力第一梯队在软件生态方面的能力具有相当的认可,而此次官方发布则更是提振信心!传递积极信号📶继续强call国产算力五大天王【寒武纪】【海光信息】【兆易创新】【芯原股份】【盛科通信】 风险提示:技术、需求、竞争等
这下知道为什么AI取代不了医护了🙉
【8点赞】