热门搜索

搜索历史清空

罕见!DeepSeek与寒武纪同步发布重要事项

乐居财经 2025-09-30 00:24 1.3w阅读

Ai快讯 2025年9月29日,国内两大AI巨头DeepSeek(深度求索)、寒武纪罕见同步发布相关重要事项,展现出中国AI产业链头部公司的深度协同态势。

当日18:07,DeepSeek官方微信号发文宣布正式发布DeepSeek - V3.2 - Exp模型,这是一个实验性(Experimental)的版本。作为迈向新一代架构的中间步骤,V3.2 - Exp在V3.1 - Terminus的基础上引入了DeepSeek Sparse Attention(一种稀疏注意力机制),针对长文本的训练和推理效率进行了探索性的优化和验证。目前,官方App、网页端、小程序均已同步更新为DeepSeek - V3.2 - Exp,同时API大幅度降价。DeepSeek表示,在新的价格政策下,开发者调用DeepSeek API的成本将降低50%以上,且目前API的模型版本为DeepSeek - V3.2 - Exp,访问方式保持不变。

仅仅4分钟后的18:11,寒武纪旗下的微信公众号“寒武纪开发者”发布文章称,寒武纪已同步实现对深度求索公司最新模型DeepSeek - V3.2 - Exp的适配,并开源大模型推理引擎vLLM - MLU源代码,开发者可在文末查看代码地址和测试步骤,从而在寒武纪软硬件平台上第一时间体验DeepSeek - V3.2 - Exp的亮点。

寒武纪一直高度重视大模型软件生态建设,支持以DeepSeek为代表的所有主流开源大模型。借助长期活跃的生态建设和技术积累,寒武纪得以快速实现对DeepSeek - V3.2 - Exp这一全新实验性模型架构的day 0适配和优化。寒武纪还重视芯片和算法的联合创新,致力于以软硬件协同的方式,优化大模型部署性能,降低部署成本。此前,寒武纪对DeepSeek系列模型进行了深入的软硬件协同性能优化,达成了业界领先的算力利用率水平。针对本次的DeepSeek - V3.2 - Exp新模型架构,寒武纪通过Triton算子开发实现了快速适配,利用BangC融合算子开发实现了极致性能优化,并基于计算与通信的并行策略,再次达成了业界领先的计算效率水平。

寒武纪强调,依托DeepSeek - V3.2 - Exp带来的全新DeepSeek Sparse Attention机制,叠加寒武纪的极致计算效率,可大幅降低长序列场景下的训推成本,共同为客户提供极具竞争力的软硬件解决方案。

业内人士认为,此种同步发布适配的动作,或许意味着早在DeepSeek - V3.2发布之前,寒武纪就在技术方面与DeepSeek进行沟通,并启动相关适配研发工作,这体现了中国AI产业链头部公司正在进行深度协同。

(AI撰文,仅供参考)

重要提示: 本文仅代表作者个人观点,并不代表乐居财经立场。 本文著作权,归乐居财经所有。未经允许,任何单位或个人不得在任何公开传播平台上使用本文内容;经允许进行转载或引用时,请注明来源。联系请发邮件至ljcj@leju.com或点击联系客服

24小时热门文章

更多热读

最新文章

更多原创

评论

点击下载App参与更多互动

前往乐居财经APP查看原文,体验更佳

榜单