哥斯拉 发表于 2025-9-30 08:22:54

DeepSeek-V3.2-Exp模型正式发布并开源

9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏Attention架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台MaaS,针对DeepSeek-V3.2-Exp模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。DeepSeek介绍,得益于新模型服务成本的大幅降低,官方API价格也相应下调,新价格即刻生效。在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上。

独家记忆 发表于 2025-9-30 08:23:11

DeepSee真是爱国 基本上每次发布在特别的日子里

Crystαl 发表于 2025-9-30 08:23:50

支持开源

Crystαl 发表于 2025-9-30 08:24:45

支持开源
页: [1]
查看完整版本: DeepSeek-V3.2-Exp模型正式发布并开源