DeepSeek-V3.2-Exp 发布,训练推理提效,API 同步降价

发布时间:2025-09-30

2025 年 9 月 29 日,DeepSeek 正式发布 DeepSeek-V3.2-Exp 模型。该模型作为新一代架构的过渡版本,在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse Attention(DSA)稀疏注意力机制,实现细粒度优化,在几乎不影响模型输出效果的前提下,实现了长文本训练和推理效率的大幅提升。

从性能来看,在训练设置严格对齐的前提下,该模型在各领域公开评测集表现与 V3.1-Terminus 基本持平。

目前,官方 App、网页端、小程序已同步更新该模型,且 API 价格大幅下调,新价格 9 月 29 日 18:00 生效,开发者调用成本降低 50% 以上。

deepseek v3.2 exp.jpg


为进一步验证模型,DeepSeek 为 V3.1-Terminus 临时保留额外API访问接口至10月15日23:59,用户只需修改 base_url="https://api.deepseek.com/v3.1_terminus_expires_on_20251015" 即可访问 V3.1-Terminus,调用价格与 V3.2-Exp 相同。

DeepSeek-V3.2-Exp 模型现已在 Huggingface 与魔搭开源:

论文同步公开:https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf

参考链接:https://mp.weixin.qq.com/s/6hKi5F_S2zQ4g6SyF0UNow

来源:DeepSeek