当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库

2个月前 (02-25)Deepseek最新资讯142

【DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库】财联社2月25日电,DeepSeek在“开源周”的第二天向公众开源了DeepEP。据介绍,DeepEP是第一个用于MoE(混合专家)模型训练和推理的EP(Expert Parallelism,专家并行)通信库,可以实现高效且优化的全对全通信,支持包括FP8在内的低精度运算,适配现代高性能计算需求。同时,DeepEP针对NVLink到RDMA的非对称带宽转发场景进行了深度优化,不仅提供了高吞吐量,还支持SM(Streaming Multiprocessors)数量控制,兼顾训练和推理任务的高吞吐量表现。对于延迟敏感的推理解码场景,DeepEP还提供了纯RDMA的低延迟内核,支持自适应路由,能实现更灵活的GPU资源控制,满足不同场景需求。

“DeepSeek开源第一个用于混合专家模型训练和推理的高效专家并行通信库” 的相关文章

DeepSeek工业应用趋势与前瞻布局

DeepSeek工业应用趋势与前瞻布局

DeepSeek作为新一代工业大模型,其核心创新源于底层架构的颠覆性优化,具体体现在以下五大维度:1.注意力机制的高效化传统Transformer模型在工业场景中面临的核心挑战在于自注意力机制的计算复...

deepseek大家都用来做什么?

deepseek大家都用来做什么?

我是资深的AI产品经理,深度体验过国内外30+AI工具。 DeepSeek的实际应用场景比想象中更"接地气",说几个真实案例: 1. 程序员摸鱼神器 上周路过技术部,...

人均DeepSeek!当教育硬件遇上深度推理,AI教育爆发了

人均DeepSeek!当教育硬件遇上深度推理,AI教育爆发了

最近这互联网,确实有点意思。前天上午,我打开微博,映入眼帘的第一条消息就是“微信DeepSeek王炸组合”;昨天中午,趁着上班中途准备打开贴吧摸鱼,结果却看到破防的MYGO粉丝在讨论“用DeepSee...

金现代全面接入DeepSeek打造思考能力更强、准确率更高、交互体验更好的智能中枢

金现代全面接入DeepSeek打造思考能力更强、准确率更高、交互体验更好的智能中枢

每经AI快讯,近期,金现代大模型产品全面接入DeepSeek,基于DeepSeek-R1(6710亿参数)的推理能力,打造思考能力更强、准确率更高、交互体验更好的智能中枢。...

百度搜索和文心智能体平台将全面接入DeepSeek

百度搜索和文心智能体平台将全面接入DeepSeek

蓝鲸新闻2月16日讯 2月16日,百度搜索宣布将全面接入DeepSeek和文心大模型最新的深度搜索功能,以丰富更多元化的搜索体验。同日,百度旗下文心智能体平台也宣布,将全面接入DeepSeek。百度一...

云南电信携手DeepSeek赋能数字云南建设

云南电信携手DeepSeek赋能数字云南建设

今年以来,中国电信云南公司与DeepSeek开展合作,积极探索AI大模型技术在本地化应用方面的实践。双方在教育教学、基层社会治理、政务服务等多个领域进行了有益尝试,初步形成了一些创新应用案例,为行业数...