当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek V3升级版发布:编程数学能力接近Claude 3.7

13小时前DeepSeek技术交流15

DeepSeek于24日夜间发布V3模型小版本升级,新版本DeepSeek-V3-0324在模型参数上达到685B,并采用MIT许可证,为用户带来全新体验。该版本重点提升了数学和编程能力,性能接近Claude 3.7 Sonnet,且对用户免费开放使用。

模型架构全面升级

DeepSeek-V3作为专家混合巨头模型,原始参数为671B,每个Token可激活370亿个参数。新版本DeepSeek-V3-0324的模型参数提升至685B,采用多头潜在注意力和DeepSeek MoE技术支持。知识截止日期从2023年12月延长至2024年7月,优化了Function call功能,解决了此前版本的函数调用问题。

编程能力显著提升

在前端编程领域,DeepSeek V3-0324展现出惊人实力。测试显示,其能在3分钟内完成750行电商网站代码,包含动态产品卡片悬停效果和手机端响应式布局等功能。自2024年6月以来,业界普遍认为仅Claude 3.5能够生成优质前端代码,而此次DeepSeek的升级版本终于为Anthropic带来了强劲竞争对手。在数学能力方面,V3-0324也表现出色,成功解答了此前大模型普遍解答错误的数学题目。

开源协议引领行业变革

DeepSeek V3-0324采用MIT许可证,允许用户出于任何目的使用、修改和分发模型,包括商业用途。这一决策获得业内广泛关注,Perplexity CEO阿拉文德认为,DeepSeek的开源策略具有革命性意义。该模型不仅能在AWS和Azure上以极低成本部署,仅需支付服务器费用,还为创业企业提供了可负担的AI解决方案。这种开源模式可能影响未来AI巨头的融资格局,推动行业向更开放、更透明的方向发展。

本文源自:金融界


“DeepSeek V3升级版发布:编程数学能力接近Claude 3.7” 的相关文章

西宁市12345热线搭载DeepSeek大模型应用

西宁市12345热线搭载DeepSeek大模型应用

3月1日,记者从中国移动通信集团青海有限公司西宁分公司(以下简称西宁移动)获悉,西宁市12345热线平台正式搭载DeepSeek大模型应用后,通过一周测试数据分析,预计接通率和准确率将分别提升7%、1...

deepseek的历史对话记录能保存多久?

deepseek的历史对话记录能保存多久?

deepseek的历史对话记录能保存多久?Deepseek的历史对话记录默认保存时间为180天。您可以在账户的历史记录页面查看和管理这些记录。如果需要长期保存重要对话,建议手动导出并备份。相关问题怎么...

DeepSeek在多个领域拥有巨大应用潜力

DeepSeek在多个领域拥有巨大应用潜力

本报讯记者张守营报道近日,由资深人工智能应用专家卢森煌撰写的《高效使用DeepSeek》正式出版。本书被誉为“保姆级”DeepSeek使用指南,旨在帮助个人和企业零基础掌握AI工具的高效应用方法,覆盖...

DeepSeek+昇腾云技术创享会重庆站成功举办

DeepSeek+昇腾云技术创享会重庆站成功举办

2月27日,以“山城论道 智链未来”为主题的“探秘DeepSeek行业影响暨华为云昇腾云技术创享会”在重庆成功举办。活动现场,政府代表、行业专家、企业决策者及技术开发者等300余人齐聚一堂,围绕人工智...

让AI懂湖北知产业助创新 湖北率先完成DeepSeek区域性科技情报领域模型部署

让AI懂湖北知产业助创新 湖北率先完成DeepSeek区域性科技情报领域模型部署

湖北日报讯(记者文俊、通讯员门玉英、丁迪、实习生朱诗果)3月11日,DeepSeek在湖北省科技信息研究院正式上线运行。记者获悉,在省科技厅指导下,该院在全国范围内率先完成基于DeepSeek的区域性...

DeepSeek、Manus相继火了,产业政策怎样“抢时间”?

DeepSeek、Manus相继火了,产业政策怎样“抢时间”?

“经济主题记者会,快变成科技主题记者会了。”今年全国两会期间,证监会主席吴清开玩笑说,这两天,谁要是不说说DeepSeek,好像就不太时髦似的。话音未落,又一款国产AI产品Manus横空出世,迅速走红...