当前位置:首页 > Deepseek最新资讯 > 正文内容

DeepSeek宣布开源DeepGEMM

2周前 (02-26)Deepseek最新资讯46

【DeepSeek宣布开源DeepGEMM】

财联社2月26日电,Deepseek于开源周第三天宣布开源DeepGEMM。DeepGEMM 是一个专为简洁高效的 FP8 通用矩阵乘法(GEMM)设计的库,具有细粒度缩放功能,如 DeepSeek-V3 中所提出。它支持普通和混合专家(MoE)分组的 GEMM。该库采用 CUDA 编写,在安装过程中无需编译,通过使用轻量级的即时编译(JIT)模块在运行时编译所有内核。FP8GEMM库,为V3/R1训练和推理提供支持。


“DeepSeek宣布开源DeepGEMM” 的相关文章

建筑业真要洗牌了!中建三局已应用DeepSeek管理工程,取代人力更高效!

建筑业真要洗牌了!中建三局已应用DeepSeek管理工程,取代人力更高效!

源自丨中建三局近日,中央广播电视总台《新闻直播间》栏目播出《科技推动力·大模型“智”在何方》特别策划,其中1分多钟重点报道了中建三局系列平台产品创新应用AI大模型,为建筑业提供更多“数字方案”,探访揭...

多方恶意抢注DeepSeek商标被驳回

多方恶意抢注DeepSeek商标被驳回

每经快讯,2月24日,国家知识产权局发布通告。近期,DeepSeek在全球范围内引发了广泛关注,个别企业和自然人以社会公众普遍知悉的人工智能大模型名称“DEEPSEEK”等,提交了商标注册申请,个别代...

微博智搜接入 DeepSeek R1 模型,正在内部测试

微博智搜接入 DeepSeek R1 模型,正在内部测试

IT之家 2 月 20 日消息,微博 CEO 王高飞(@来去之间 )今日分享了多条微博智搜内容,该功能已经接入深度思考(DeepSeek R1 模型),目前处于测试阶段。从其分享的内容来看,微博智搜接...

DeepSeek工业应用趋势与前瞻布局

DeepSeek工业应用趋势与前瞻布局

DeepSeek作为新一代工业大模型,其核心创新源于底层架构的颠覆性优化,具体体现在以下五大维度:1.注意力机制的高效化传统Transformer模型在工业场景中面临的核心挑战在于自注意力机制的计算复...

DeepSeek大模型落地,多个医疗智能体在这家医院上线!

DeepSeek大模型落地,多个医疗智能体在这家医院上线!

湖南日报2月16日讯(全媒体记者 周顺 通讯员 杨正强 陈志明)记者今日从湖南省胸科医院获悉,该院基于国家超级计算长沙中心DeepSeek大模型推理服务,已上线“医学科研小助手”智能体,首次应用于“胸...

职场DeepSeek写材料指令100条

职场DeepSeek写材料指令100条

以下是为您整理的100条职场常用DeepSeek写材料指令,涵盖各类办公场景需求:一、工作总结类(10条)   1.生成[XXXX]年度部门工作总结模板(含数据可视化图表模块)&n...