DeepSeek R2要来了?
DeepSeek作为全球讨论热度最高的
人工智能企业之一
其下一代模型备受关注
近日
有媒体报道称
中国人工智能企业
深度求索(DeepSeek)
即将发布下一代AI大模型
DeepSeek-R2
报道称
DeepSeek-R2大模型
将会采用一种
更先进的混合专家模型(MoE)
结合了更加智能的门控网络层
(Gating Network)
以优化高负载推理任务的性能
关于R2的技术细节
许多媒体认为
可以从官方发布的一篇论文中
找到蛛丝马迹
在4月初
深度求索(DeepSeek)
发布研究论文
披露了被称为
自我原则点评调优(SPCT)的技术
旨在构建更通用、更具扩展性的AI奖励模型
媒体认为
这项技术
为更智能的AI应用铺平道路
虽然研究论文并未提及R2
但提到DeepSeek的R1系列
和隐含的进展表明
该公司正在积极开发其下一代模型R2
自OpenAI推出o1模型以来
行业注重通过算力投入
来持续提升模型性能
但深度求索自主研发的R1系列模型
则进一步验证了纯强化学习训练
对大语言模型推理能力的提升
有分析师预计
R2的定价
可能显著低于OpenAI同类产品
预示着其可能颠覆
现有AI服务的定价模式
需要关注的是
从R1爆火之后
市场上开始出现
许多有关R2的相关消息
根据2025年3月的报道
有消息称R2可能在3月17日发布
但官方对此进行了辟谣
称“R2发布为假消息”
关于R2的最新情况
DeepSeek评价称
DeepSeek-R2的发布
标志着中国AI在多模态大模型领域的突破
其多语言支持、高效代码生成
及低成本部署等特性
可能重塑全球AI应用格局
尽管发布时间存在动态调整
但其技术亮点已引发广泛期待
R2具体什么时候发布?
静等官方消息
参考:synced、热点科技、DeepSeek