汇正财经预测:DeepSeek的出现,有望让AI终端落地
2025年1月20日,DeepSeek 发布并开源DeepSeek-R1模型,其在极少标注数据下通过强化学习极大提升推理能力,在各项任务上性能比肩OpenAIo1正式版,获英伟达等众多国内外科技巨头支持,软件下载量全球居首。作为一家专业的投资咨询机构,汇正财经预测,DeepSeek的出现,有望加速AI终端商业落地进程。
DeepSeek,全称杭州深度求索人工智能基础技术研究有限公司,成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。2025年1月20日,DeepSeek 正式发布DeepSeek-R1模型,在仅有极少标注数据的情况下,极大提升了模型推理能力。其成本价格低廉,性能与OpenAI相当,让硅谷震惊,甚至引发了 Meta 内部的恐慌,工程师们开始连夜尝试复制DeepSeek的成果。
在2024年美国数学邀请赛里,R1得分率是79.8%,比o1的79.2%还高;MATH-500 测试里,R1得分率97.3%,同样高于o1的96.4%;软件工程任务测试,R1得分49.2%,也比o1的48.9%高;代码测试Codeforces里,R1得分率只比o1低0.3%,整体性能和o1差不多。而且,DeepSeek 团队还根据R1的输出,提炼出6个小模型也开源了。其中 32B 和70B参数的模型,好多能力都和 OpenAIo1-mini 差不多。
面对如此优秀的成绩,国内外各大互联网公司都宣布把DeepSeek-R1模型用到自己的云服务或者硬件里。到2月1日,DeepSeek的AI软件在全球140个市场的移动应用下载量排第一。
在AI行业里,大模型调用成本降低,说明这个行业在走向成熟,中小规模的市场应用就能更多地调用模型,AI就能用到更多细分领域。经汇正财经分析,DeepSeek-R1模型既能通用,能力又能扩展,还开源了模型权重,允许用户用模型输出、通过模型蒸馏等方法训练其他端侧模型,这就给各种AI终端开发者提供了机会,很可能让AI终端更快地在商业上落地。