DeepSeek-V3.2-Exp发布,长文本AI效率跃升,产业链协同加速
事件:北京时间9月29日,DeepSeek-V3.2-Exp 发布。
DeepSeek-V3.2-Exp 模型发布:长文本效率显著优化。
DeepSeek正式推出V3.2-Exp模型,作为迈向新一代架构的关键中间步骤。新版本在V3.1-Terminus基础上引入DeepSeek Sparse Attention(DSA)稀疏注意力机制,在几乎不影响模型输出质量的前提下,大幅提升长文本训练和推理效率,并已在官方App、网页端、小程序同步更新。价格方面,DeepSeek对API价格进行超过50%的下调。模型与论文均已在HuggingFace等平台开源,同时开放了TileLang与CUDA两类GPU算子以支持社区快速迭代。
寒武纪与昇腾实现适配、软硬件协同优化推理性能。
寒武纪已在第一时间实现DeepSeek-V3.2-Exp的适配,并开源大模型推理引擎vLLM-MLU源码,开发者可在寒武纪软硬件平台率先体验新模型。
昇腾同样在开源发布即完成BF16模型部署,128K长序列下可实现TTFT低于2秒、TPOT低于30毫秒的推理速度。针对新引入的算子,昇腾完成流水优化,并推出相关编程体系以简化算子开发。
投资建议
#云端算力 继续强call国产算力五大天王【寒武纪】【海光信息】【芯原股份】【盛科通信】【兆易创新】
风险提示:市场竞争,需求,地缘政治风险等
?欢迎联系东吴电子:陈海进/李雅文
注:此文仅代表作者观点
