2025年9月29日,DeepSeek-V3.2-Exp模型正式发布并开源。模型引入稀疏 Attention 架构,这种架构能够有效降低计算资源消耗并提升模型推理效率。目前,该模型已正式上架华为云大模型即服务平台 MaaS,针对DeepSeek-V3.2-Exp 模型,华为云此次仍沿用大EP并行方案部署,基于稀疏Attention结构叠加实现长序列亲和的上下文并行策略,并兼顾模型时延和吞吐性能。
免责声明:
本站原创内容根据公开信息整理或转载,与立场无关,我们力求信息真实、准确,但文章、所示信息、提及内容仅供参考,无法保证该等信息的准确性和完整性、及时性、有效性等,不构成任何建议,据此操作风险自担。转载的属于第三方的信息,已标注作者及来源,并不代表赞成或反对等任何观点,亦不对其真实性负责。