【DeepSeek-V3.2-Exp】“长文本+降本“利好应用落地【模型亮点

【DeepSeek-V3.2-Exp】“长文本+降本“利好应用落地【模型亮点：降本50%】引入DeepSeekSparseAttention（DSA），针对【长文本】的训推效率进行了【探索性】的优化和验证。在测试集表现与V3.1-Terminus相近的情况下，API的成本将降低50%以上，输入（缓存命中）/（缓存未命中）/输出分别定价0.2/2/3元每百万Tokens。【DSA：长文本性能&整体性价比提升】和DeepSeek此前提出的NSA的算法逻辑类似，通过信息预筛选（只处理关键信息）降低注意力计算压力。其核心机制在于闪电索引器（LightningIndexer）用很少的头数（计算量）和FP8低精度实现信息高效筛选，主注意力模块（核心模型）只处理筛选后的重要信息，进而实现长文本性能提升和成本下降。【算力影响：国产芯片与国产模型真正实现相向而行】本次开源的算子包含TileLang与CUDA两种版本，官方建议社区使用基于TileLang的版本以方便调试和快速迭代。华为宣布昇腾0Day支持DeepSeek-V3.2-Exp，立刻支持FP16部署，在128K长序列下能够保持TTFT低于2秒、TPOT低于30毫秒的推理生成速度。其他国产芯片龙头也宣布0Day适配并支持TileLang。结合8月21日的UE8M0FP8，我们认为国产芯片与国产模型真正实现相向而行。【应用展望：重视国产AI应用拐点机遇】本次V3.2-Exp为实验版本，当前DSA效果亟待产业验证，尤其在非标准场景下的指令跟随和幻觉率情况值得持续关注。但如我们此前周观点的内容，模型性能升级与成本降低同步进行利好应用落地，我们预计核心国产应用公司AI贡献占比2025年起将显著提升，建议重视国产AI应用拐点机遇。建议持续关注三条投资主线： 1）算力产业链：国产算力芯片头部公司、浪潮信息、深信服、工业富联、金山云、网宿科技、智微智能等； 2）通用Agent应用：金山办公、金蝶国际、第四范式、税友股份、鼎捷数智、用友网络、北森控股、泛微网络等； 3）垂直Agent应用：科大讯飞、讯飞医疗科技、京东健康、同花顺、恒生电子、九方智投控股、阜博集团、中科创达、宇信科技、广联达、中望软件、华大九天、索辰科技、焦点科技、光云科技、当虹科技、明源云等。

0 阅读：3

【DeepSeek-V3.2-Exp】“长文本+降本“利好应用落地【模型亮点

在DeepSeek眼里，中国最顶流的明星是谁？

RG飞翼零式（by主夫プラ）高达模型高达模型

迪马尔科近期多重非利好消息缠身。先有皮奥图谋东宫，后有傲骨准备替位，还有齐沃改变

使用AI后共情了领导[跪了]

有人说在中国儿子就那么重要吗?我举个案例：2021年5月贝壳创始人左晖因肺癌去世

不是点歪了科技树，而是他们总想吃独食[吃瓜]

赵今麦x网友做的ai～毫无违和感

【DeepSeek-V3.2-Exp】“长文本+降本“利好应用落地 【模型亮点

在DeepSeek眼里，中国最顶流的明星是谁？​​​

RG飞翼零式（by主夫プラ）高达模型高达模型​​​

迪马尔科近期多重非利好消息缠身。先有皮奥图谋东宫，后有傲骨准备替位，还有齐沃改变

使用AI后共情了领导[跪了]​​​​

有人说在中国儿子就那么重要吗?我举个案例：2021年5月贝壳创始人左晖因肺癌去世

不是点歪了科技树，而是他们总想吃独食[吃瓜]

赵今麦x网友做的ai～毫无违和感​​​

【DeepSeek-V3.2-Exp】“长文本+降本“利好应用落地【模型亮点

在DeepSeek眼里，中国最顶流的明星是谁？

RG飞翼零式（by主夫プラ）高达模型高达模型

使用AI后共情了领导[跪了]

赵今麦x网友做的ai～毫无违和感