当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek“开源周”第二天开源EP通信库

2周前 (02-25)Deepseek最新资讯51

新京报贝壳财经讯(记者罗亦丹)北京时间2月25日,DeepSeek发布了其“开源周”第二天的成果:DeepEP,第一个用于MoE模型(混合专家模型)训练和推理的开源EP通信库。

据了解,EP为Expert Parallelism(专家并行),是一种在大规模分布式AI模型训练中使用的技术,能用于提升模型并行处理能力和训练效率。

DeepSeek介绍,DeepEP的特点包括:高效且优化的全对全(all-to-all)通信,节点内和节点间支持NVLink和RDMA,用于训练和推理预填充的高吞吐量内核,用于推理解码的低延迟内核,原生FP8调度支持,灵活的GPU资源控制,实现计算与通信重叠。

DeepSeek发布公告截图


“DeepSeek“开源周”第二天开源EP通信库” 的相关文章

吉林大学DeepSeek平台正式上线

吉林大学DeepSeek平台正式上线

随着新学期的到来,吉林大学在信息化建设的道路上又迈出了重要步伐——由大数据和网络管理中心、高性能计算中心联合华为公司部署的DeepSeek平台正式上线。该平台依托高性能计算中心的昇腾NPU平台和GPU...

DeepSeek什么都好,但真的不建议这样用……

DeepSeek什么都好,但真的不建议这样用……

进入三月,DeepSeek的热度有增无减,从最初面市到现在一个多月,首批用户体验后的反馈期终于来了。我身边的朋友都用疯了!有用来算命的,家里祖孙三代算到再无可算,DeepSeek娃说命里缺金,家长也管...

中国电信舟山分公司:自研完成全市首个DeepSeek本地化应用,深度赋能社会救助数智化转型

中国电信舟山分公司:自研完成全市首个DeepSeek本地化应用,深度赋能社会救助数智化转型

自DeepSeek全新开源模型掀起AI浪潮以来,中国电信舟山分公司作为数字舟山建设的主力军,凭借强大的技术实力和创新能力,迅速行动、深度探索DeepSeek大模型融合各行各业,为舟山市民政局率先实现D...

美国将禁用中国企业深度求索DeepSeek?中方回应

美国将禁用中国企业深度求索DeepSeek?中方回应

路透社当地时间3月7日引述知情人士称,出于所谓“国家安全”考虑,美国特朗普政府正在考虑禁止中国企业深度求索(DeepSeek)的人工智能(AI)工具在美国政府设备上使用。在3月10日举行的中国外交部例...

DeepSeek炒股,靠不靠谱?

DeepSeek炒股,靠不靠谱?

“当没有足够信息的时候,大模型会根据用户要求,自己‘脑补’信息,作出回答,并非基于真实世界的逻辑和事实。”文 / 巴九灵最近小巴在后台看到一条留言:“我今年60多岁了,想用DeepSeek来帮我炒股,...

接入DeepSeek!西安“智”创升级

接入DeepSeek!西安“智”创升级

2025年,DeepSeek可以称得上是最火的热词之一。接入!不到两个月时间,陕西已有不少企业、平台宣布全面接入DeepSeek,人工智能(AI)技术正在加速走进实验室、生产车间、远程诊疗、文旅融合等...