当前位置:首页 > DeepSeek技术交流 > 正文内容

DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?

2周前 (02-26)DeepSeek技术交流42

一开始,我还以为 DeepSeek 会走传统路线,比如大厂常见的蒸馏技术,搞个小参数的 Flash 模型。毕竟这种方法能有效降低计算需求,但缺点也很明显,就是小模型再怎么优化,和大模型比起来,性能还是会有损失 结果 DeepSeek 完全没按套路出牌,它不是去压缩模型,而是换了个角度,直接假设未来算力足够,然后想办法更高效地用好现有显卡架构。换句话说,不是缩小参数规模,而是在同等规模下优化计算方式,让计算更具性价比 这种思路比纯工程优化要“硬核”得多。一般来说,搞小模型是比较务实的工程方案,但 DeepGEMM 这种技术驱动的做法更有延展性。它不仅和小模型方法兼容,而且即使以后显卡更强、模型规模更大,这套技术依然能继续用,不会过时

“DeepSeek 又上新!DeepGEMM 发布,有哪些突破点值得一看?” 的相关文章

争先恐后接入DeepSeek的国产手机,它们的自研大模型怎么办?

争先恐后接入DeepSeek的国产手机,它们的自研大模型怎么办?

只有小米手机、苹果国行还没宣布外接大模型计划。蛇年春节以来,一场名为DeepSeek的大模型“飓风”开始席卷科技界,手机公司堪称其中反映最迅速的行业之一。 2月10日,中兴通讯终端事业部总裁...

财务人如何用DeepSeek摆脱加班?这6招让你躺赢!DeepSeek能自动做账、出报表、写分析,财务人员会被干掉吗?

财务人如何用DeepSeek摆脱加班?这6招让你躺赢!DeepSeek能自动做账、出报表、写分析,财务人员会被干掉吗?

DeepSeek能自动做账、出报表、写分析,财务人员会被干掉吗?每次新技术浪潮涌来,总有人说财务会被取代。但工具再先进,还是要看在什么人手里。DeepSeek不会让财务这个职业消失,但一定会加剧两极分...

中信证券:DeepSeek,当前AI产业链投资催化剂

中信证券:DeepSeek,当前AI产业链投资催化剂

中信证券发布研报称,认为Deepseek在模型训练成本降低方面的最佳实践,料将刺激科技巨头采用更为经济的方式加速前沿模型的探索和研究,同时将使得大量AI应用得以解锁和落地。算法训练带来的规模报酬递增效...

华阳集团:DeepSeek部署有效提升研发效率和生产力

华阳集团:DeepSeek部署有效提升研发效率和生产力

中证报中证网讯(王珞)2月18日,华阳集团微信公众号发文表示,公司自研的软件开放平台已接入DeepSeek的API接口,公司的研发系统已初步完成了对DeepSeek的部署,有效提升了研发效率和生产力。...

接入DeepSeek!西安“智”创升级

接入DeepSeek!西安“智”创升级

2025年,DeepSeek可以称得上是最火的热词之一。接入!不到两个月时间,陕西已有不少企业、平台宣布全面接入DeepSeek,人工智能(AI)技术正在加速走进实验室、生产车间、远程诊疗、文旅融合等...

网友称跟DeepSeek炒股日赚千元,也有人亏损,AI投资靠谱吗?

网友称跟DeepSeek炒股日赚千元,也有人亏损,AI投资靠谱吗?

“跟着DeepSeek炒股的第五天,我的收益居然涨到了11%”“用DeepSeek投(股市)100万会怎么样”“股市小白,跟着DeepSeek学炒股”......DeepSeek的热潮还是吹到了股市投...