行业动态

DeepSeek 开源 R2 模型,推理性能比肩顶级闭源模型

深度求索(DeepSeek)正式发布 DeepSeek-R2 模型,这是继 R1 之后的又一次重大突破。R2 采用了全新的混合专家(MoE)架构,在推理效率上实现了3倍提升。

架构创新:R2 采用了改进的 MoE 路由机制,激活参数量仅为总参数的 1/10,大幅降低了推理成本。在 AIME 2025、MATH-500 等推理基准上,R2 的表现比肩甚至超越了 GPT-5 和 Claude 4 等顶级闭源模型。

完全开源:R2 的模型权重、训练代码和技术报告全部开源,遵循 MIT 许可证。这是迄今为止单一开源模型中推理能力最强的一次发布,引发了全球开发者社区的广泛讨论。

行业影响:R2 的开源意味着企业可以以极低成本部署顶级的推理能力,将加速 AI 在金融分析、法律推理、科研辅助等专业领域的落地。国内多家云厂商已第一时间上线 R2 的 API 服务。

文章未找到