【DeepSeek-V3.2-Exp】“长文本+降本“利好应用落地 【模型亮点

丹萱谈生活文化 2025-09-30 08:49:09

【DeepSeek-V3.2-Exp】“长文本+降本“利好应用落地 【模型亮点:降本50%】引入DeepSeekSparseAttention(DSA),针对【长文本】的训推效率进行了【探索性】的优化和验证。在测试集表现与V3.1-Terminus相近的情况下,API的成本将降低50%以上,输入(缓存命中)/(缓存未命中)/输出分别定价0.2/2/3元每百万Tokens。 【DSA:长文本性能&整体性价比提升】和DeepSeek此前提出的NSA的算法逻辑类似,通过信息预筛选(只处理关键信息)降低注意力计算压力。其核心机制在于闪电索引器(LightningIndexer)用很少的头数(计算量)和FP8低精度实现信息高效筛选,主注意力模块(核心模型)只处理筛选后的重要信息,进而实现长文本性能提升和成本下降。 【算力影响:国产芯片与国产模型真正实现相向而行】本次开源的算子包含TileLang与CUDA两种版本,官方建议社区使用基于TileLang的版本以方便调试和快速迭代。华为宣布昇腾0Day支持DeepSeek-V3.2-Exp,立刻支持FP16部署,在128K长序列下能够保持TTFT低于2秒、TPOT低于30毫秒的推理生成速度。其他国产芯片龙头也宣布0Day适配并支持TileLang。结合8月21日的UE8M0FP8,我们认为国产芯片与国产模型真正实现相向而行。 【应用展望:重视国产AI应用拐点机遇】本次V3.2-Exp为实验版本,当前DSA效果亟待产业验证,尤其在非标准场景下的指令跟随和幻觉率情况值得持续关注。但如我们此前周观点的内容,模型性能升级与成本降低同步进行利好应用落地,我们预计核心国产应用公司AI贡献占比2025年起将显著提升,建议重视国产AI应用拐点机遇。建议持续关注三条投资主线: 1)算力产业链:国产算力芯片头部公司、浪潮信息、深信服、工业富联、金山云、网宿科技、智微智能等; 2)通用Agent应用:金山办公、金蝶国际、第四范式、税友股份、鼎捷数智、用友网络、北森控股、泛微网络等; 3)垂直Agent应用:科大讯飞、讯飞医疗科技、京东健康、同花顺、恒生电子、九方智投控股、阜博集团、中科创达、宇信科技、广联达、中望软件、华大九天、索辰科技、焦点科技、光云科技、当虹科技、明源云等。

0 阅读:3
丹萱谈生活文化

丹萱谈生活文化

感谢大家的关注