当前位置：首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源周连续“放大招”

2个月前 (02-25)Deepseek最新资讯123

2月24日消息

DeepSeek宣布启动

“开源周”（Open Source Week）

计划连续5天（2月24日至28日）

陆续开源5个代码库

网友们对此举纷纷点赞称：

“DeepSeek王炸开局”

“‘源’神启动！”

图源：网络

FlashMLA让AI大模型低成本却有高性能

首个开源的项目是FlashMLA

可谓是第一天就“放大招”！

DeepSeek首日开源内容公告图源：X

FlashMLA是

DeepSeek针对

英伟达Hopper架构GPU优化的

高效MLA解码内核

（MLA即多头潜在注意力）

可理解为

专为高性能显卡设计的

“AI加速工具”

现在已经投入生产使用

简而言之

FlashMLA能够让AI大模型

在H800这样的GPU上

跑得更快、更高效

当AI同时处理长句子和短句子时

FlashMLA

能动态调整资源分配

避免浪费算力

网友称赞DeepSeek是真正的“Open AI”图源：X

根据此前公开发布的

DeepSeek V3大模型技术文档

该大模型正是使用

H800芯片训练而成

自从V2模型开始

MLA就已帮助DeepSeek

在一系列模型中实现成本大幅降低

但计算、推理性能

仍能与顶尖模型持平

DeepEP让专业答案更高效精准

2月25日

DeepSeek再度官宣

当日开源代码库为DeepEP

即首个用于MoE（混合专家）模型

训练和推理的

开源EP（专家并行）通信库

据报道

MLA和MoE也被认为是

DeepSeek以低成本

实现杰出表现的核心原因

DeepSeek25日开源内容公告图源：X

MoE架构的缺点之一

是会增加通信成本

而EP通信库正是

针对通信环节的优化

可以实现高效、优化的全员沟通

适配现代高性能计算需求等

值得一提的是

在宣布开源20分钟内

DeepEP便已在GitHub上

获得超1000个收藏

受到大量关注

推动AI普惠发展也要守住底线

“DeepSeek开源周连续“放大招”” 的相关文章

广东全省推进DeepSeek部署，开启AI智能服务新篇章！

拥抱AI浪潮加速AI赋能近期，AI系统DeepSeek依托先进的深度学习算法和强大的数据处理能力火热出圈。中国电信广东公司积极拥抱AI浪潮，依托天翼云强大的算力资源和技术优势，为DeepSeek在广...

硅谷视角深聊：Deepseek的颠覆、冲击、争议和误解

2024年12月底，中国幻方量化旗下的人工智能团队，发布了6700亿参数大语言基础模型DeepSeek V3，紧接着在2025年1月20日开源了基于V3的两款推理模型：DeepSeek-R1-Zero...

中国产品竞争力增强，DeepSeek、豆包、美图秀秀登上全球Top 50 AI 应用

近日，全球知名投资机构a16z 发布全球Top 100 AI消费级应用排行榜，该榜单每半年更新一次。值得注意的是，全球化布局产品的身影大量出现，包括深度求索的DeepSeek、美图秀秀的海外版Meit...

DeepSeek杀入金融科技圈

低成本、低门槛、高效能的优势，加之开源策略支持本地私有化部署，让DeepSeek在近期席卷金融科技圈，从国有大行、互联网大厂金融科技公司到消费金融公司、第三方支付机构、上市金融科技企业纷纷宣布接入De...

DeepSeek网站用户数量暴增-上线20天日活突破2000万 7天增1亿用户

DeepSeek网站用户数量暴增-上线20天日活突破2000万 7天增1亿用户观点网讯：2月8日，据AI产品榜最新数据显示，DeepSeek自上线以来20天内日活跃用户数已突破2000万，达到Chat...

大江时评：从DeepSeek到Manus，中国AI领域何以“黑马”频出

江山代有才人出。3月6日凌晨，中国AI团队Monica宣布推出全球首款通用型AI智能体产品Manus，引发网络热议和关注。据悉，Manus在GAIA基准测试中取得了SOTA（State-of-the-...