当前位置:首页 > Deepseek最新资讯 > 正文内容

全面适配!京东云将DeepSeek推理场景性能提升50%

2周前 (03-03)Deepseek最新资讯45

央广网北京3月3日消息 在DeepSeek为期五天的“开源周”中,其连续开源的五大核心技术(FlashMLA、DeepEP、DeepGEMM、DualPipe & EPLB、3FS文件系统),惊艳全球。

京东云率先宣布完成对这五项技术的全栈适配,在模型推理效率、算力资源利用率及数据管理等领域实现突破性优化,综合Flash MLA、DeepEP、FP8 GEMM、DualPipe四方面的调优,在DeepSeek推理场景下性能提升50%。

全面适配五大技术,DeepSeek推理场景性能提升50%

作为DeepSeek开源首日的重磅技术,Flash MLA通过动态调度GPU的显存与算力资源,解决了传统方法处理变长序列时的资源浪费问题。

京东vGPU AI算力平台通过支持Flash MLA的FP8格式来提升推理性能,使单Token的 KV Cache显存占用相比Multi-head Attention降低57倍,配合最新的投机推理技术,以极低的显存需求,在高并发请求场景下保证了推理的吞吐量和延迟表现。

此外,针对用于DeepSeek开源的通信库DeepEP,京东云vGPU AI算力平台已全面支持EP模式下的分布式推理,显著提高推理吞吐。通过整合DeepEP作为通信后端,针对机内通信使用NVLink传输数据,机间通信使用NVSHMEM接口走RDMA网络,同时通过灵活的GPU SM数量利用控制,增大GPU算力资源利用率以及减少对计算算子的性能串。

更低成本更高效率,让大模型真正用起来

针对客户大模型的使用需求,京东云vGPU AI算力平台,为用户提供更高推理性能、更多国产芯片适配、更多高数据安全的大模型服务,让大模型真正用起来。

在推理性能方面,针对DeepSeek大模型技术特点,京东云通过推理加速与内核驱动级优化,提升单台服务器推理性能50%。

在国产芯片适配方面,京东云已完成从底层算力到大模型和业务应用的全面国产化适配,包括十余家国产化AI算力,确保自主可控。

在数据安全方面,通过机密容器AI全场景密态计算和先进的容器隔离技术,确保模型数据的机密性与完整性,为用户提供金融级安全防护。

目前,在河南鹤壁、江苏宿迁、山东滨州、广西北海、山西大同,京东云已经助力多地政府基于现有基础设施本地化部署DeepSeek,既满足本地政务业务,又让当地企业不用投入资源,即可通过政务云调用DeepSeek。


“全面适配!京东云将DeepSeek推理场景性能提升50%” 的相关文章

关于DeepSeek的常见误区与真相

关于DeepSeek的常见误区与真相

最近,DeepSeek火得有点不讲道理。从我的朋友圈到国外媒体,从华尔街到硅谷,几乎所有人都在热议这个中国AI新秀。560万美元训练成本、开源大模型、链式推理能力、股市动荡...故事真是越讲越玄乎,热...

Deepseek引发AI+变革浪潮 2025年AI行情可期

Deepseek引发AI+变革浪潮 2025年AI行情可期

本报记者 顾梦轩 夏欣 广州、北京报道2025年新年伊始,中国AI企业深度求索(DeepSeek)的开源大模型DeepSeek-R1在资本市场掀起巨浪。Wind数据显示,截至2月12日,万得Deeps...

deepseek仿冒网站大量出现-奇安信:仿冒DeepSeek网站已超两千个,六成IP在美国

deepseek仿冒网站大量出现-奇安信:仿冒DeepSeek网站已超两千个,六成IP在美国

随着国产AI公司深度求索的大模型DeepSeek爆红,各类仿冒网站也层出不穷,带来安全隐患。2月6日,澎湃新闻记者从奇安信XLab实验室方面获悉,仿冒DeepSeek的网站、钓鱼网站已经超过2000个...

国内多所高校推出DeepSeek相关课程 杭州电子科技大学:几分钟名额就被抢光

国内多所高校推出DeepSeek相关课程 杭州电子科技大学:几分钟名额就被抢光

近日,DeepSeek在全社会引发关注。北京青年报记者注意到,新学期以来,国内多所高校开设了和DeepSeek相关的课程,鼓励学生学习、掌握DeepSeek相关的技术和知识。杭州电子科技大学教务处负责...

企业微信接入 DeepSeek 模型,支持智能机器人、智能表格

企业微信接入 DeepSeek 模型,支持智能机器人、智能表格

IT之家 2 月 21 日消息,企业微信今日宣布接入 DeepSeek 模型,带来了「智能机器人」、「智能表格-客户跟进总结」等 AI 功能。IT之家从官方介绍获悉,接入 DeepSeek、混元等大模...

海信视像:所有搭载智能体的海信电视都已完成升级并全面支持DeepSeek

海信视像:所有搭载智能体的海信电视都已完成升级并全面支持DeepSeek

每经快讯,海信视像(600060)2月27日在互动平台表示,海信电视接入DeepSeek,支持满血R1和V3版本自由切换,成为行业首个搭载深度思考智能体的电视品牌。目前,所有搭载智能体的海信电视都已完...