当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek发布开源周首个成果 可优化英伟达GPU效率

2周前 (02-25)Deepseek最新资讯52

新京报贝壳财经讯(记者罗亦丹)北京时间2月24日上午,DeepSeek发布了其“开源周”的第一项成果:FlashMLA(直译为快速多头潜在注意力机制)的代码。

据了解,MLA(多头潜在注意力机制)正是DeepSeek降低大模型成本使用的关键技术之一,其可以显著减少大模型训练和推理过程中的内存占用,而FlashMLA则是针对Hopper GPU(一种英伟达GPU架构)开发的高效MLA解码内核,其针对可变长度序列进行了优化,目前已投入了生产,其可以使得H800达到3000GB/s内存,实现580TFLOPS(每秒浮点运算次数)计算性能。

贝壳财经记者注意到,根据此前DeepSeek发布V3大模型时公开的技术文档,该大模型正是使用英伟达的H800芯片训练而成。

上海骊翰科技咨询有限公司发文称,FlashMLA能在不损失模型性能的前提下,将缓存体积压缩至原来的1/4,从而大幅降低显存需求。例如,原始需要存储的100GB中间结果,压缩后仅需25GB,通过开源让企业可以直接使用FlashMLA来优化自家模型。随着FlashMLA的普及,AI推理有望进入千元级硬件跑百亿模型的时代。


“DeepSeek发布开源周首个成果 可优化英伟达GPU效率” 的相关文章

大江时评:从DeepSeek到Manus,中国AI领域何以“黑马”频出

大江时评:从DeepSeek到Manus,中国AI领域何以“黑马”频出

江山代有才人出。3月6日凌晨,中国AI团队Monica宣布推出全球首款通用型AI智能体产品Manus,引发网络热议和关注。据悉,Manus在GAIA基准测试中取得了SOTA(State-of-the-...

国内安全平台公司数美科技发布DeepSeek一体机内容安全组件

国内安全平台公司数美科技发布DeepSeek一体机内容安全组件

近日,国内安全平台公司数美科技发布DeepSeek一体机内容安全产品组件。组件可提供实时的输入、输出内容风险检测能力和针对自杀、欺诈、犯罪倾向等风险问题的安全回答能力。...

deepseek怎么拍照解题-deepseek拍照解题步骤详解

deepseek怎么拍照解题-deepseek拍照解题步骤详解

DeepSeek拍照解题的步骤相对简单且直观,以下是详细的操作步骤:一、准备阶段确保设备兼容:确保手机或平板等设备已安装DeepSeek应用,并且设备摄像头功能正常。启动DeepSeek应用:打开手机...

DeepSeek在企业数字化转型中的角色是什么?

DeepSeek在企业数字化转型中的角色是什么?

DeepSeek在企业数字化转型中的角色是什么?思考和行动过程用户希望了解DeepSeek在企业数字化转型中的角色。DeepSeek是一款开源的人工智能模型,具备强大的自然语言处理和数据分析能力,可能...

仿冒DeepSeek的手机木马病毒被捕获 相关部门发布防范措施

仿冒DeepSeek的手机木马病毒被捕获 相关部门发布防范措施

据央视新闻消息,近日,国家计算机病毒应急处理中心和计算机病毒防治技术国家工程实验室依托国家计算机病毒协同分析平台在我国境内捕获发现仿冒DeepSeek官方App的安卓平台手机木马病毒。△相关病毒样本信...

艾美疫苗全面接入DeepSeek大模型

艾美疫苗全面接入DeepSeek大模型

2月23日晚,港股公司艾美疫苗(06660.HK)发布自愿公告,全面部署接入DeepSeek大模型,通过本地化策略,推动DeepSeek-R1版本在集团全业务场景应用,实现疫苗全生命周期的“降本、提质...