当前位置：首页 > Deepseek应用场景 > 正文内容

DeepSeek，带动AI进入“中国时刻”

4天前Deepseek应用场景42

“海谈科技”核心观点

DeepSeek在底层的训练模型的架构优化、基于强化学习的训练策略优化等多个方面的技术突破，均可圈可点；

客户寻求AI算力及解决方案的热情非常高，AI在政务、教育等多个领域的落地正在加速；

数据安全至关重要，数据标注领域的投资机遇很大……

近日，在海富通基金、上海证券报共同举办的“海谈科技”DeepSeek专场上，复旦大学博导、上海市数据科学重点实验室主任肖仰华，达观数据首席财务官许涵卿，海通证券计算机行业、科技金融首席分析师杨林三位嘉宾，围绕DeepSeek技术突围的底层逻辑及AI应用落地，共同探讨了产业发展和投资之道。

开启中国AI新纪元

2025年中国农历春节期间，国产AI大模型DeepSeek以“低成本、高性能”的技术突破，一经推出，就迅速吸引了全球AI产业界及资本市场的关注，可谓是“一夜风靡”。

DeepSeek现象缘何出现，这背后又有怎样的底层逻辑？

“DeepSeek在底层的训练模型的架构优化、基于强化学习的训练策略优化等多个方面的技术突破，均可圈可点。”肖仰华解读，DeepSeek的突破主要包括三个方面：一是采用了混合专家（MoE）架构，并成功解决了MoE架构在训练过程中通常会遭受不可预测的损失尖峰，从而难以扩展这一问题；二是在数值精度上的优化，其采用FP8训练，超越了美国主要使用的FP16的标准；三是资源效率提升，仅使用2048个H800GPU（相当于1000—1500个H100GPU），就实现了与GPT-4相当的AI性能。

DeepSeek的突破，让全球看到了中国的AI力量，被视为“神秘的东方力量”。杨林将其形容为“科技的国运时刻”，其成功大大增强了中国人的科技信心。

1月27日，DeepSeek应用登顶苹果美国地区应用商店免费App下载排行榜，在美区下载榜上超越了ChatGPT。同日，苹果中国区应用商店免费榜显示，DeepSeek成为中国区第一。

“DeepSeek的成功，是开源的成功。”许涵卿表示，DeepSeek将模型权重、训练框架及数据管道全部开源，允许用户自由使用、修改和商业化。这意味着，开发者和企业能够以较低的成本进行模型微调和应用开发，降低了AI技术的进入门槛。另外，以往，一些关键基础行业的应用者，会担忧云端数据的安全性，DeepSeek允许下游应用者进行本地化的模型部署，消除了其对数据安全和数据隐私的担忧。

端侧AI是中国机遇

“作为企业，我们看到了更多的产业机会，客户咨询和上马AI大模型产品的意愿显著增强。”谈及DeepSeek的突破，许涵卿看到了其对产业端产生的影响，端侧AI的发展已经箭在弦上。

“早在2022年，达观数据就开始做大模型的前沿研究。”许涵卿介绍，以往谈及上马大模型，客户会担心是不是要在GPU、大模型本身等方面投入大量的资金和资源；DeepSeek的“低成本、高性能、安全性”让应用端客户很兴奋，现在一些政府机构、央地国企尝试AI大模型的意愿大幅提升。

DeepSeek到底有多便宜？DeepSeek的API定价为每百万tokens10美分，相比之下，其成本仅为GPT-4的十分之一，这重新定义了AI经济模型。

DeepSeek的出现，推动AI技术的低成本化和边缘化，使云端和边缘处理的混合AI模型被认为是AI未来的发展方向，端侧AI芯片和端侧小模型的场景应用，恰恰是中国的优势所在，这是中国AI产业发展的大机遇。

不过，许涵卿强调，在不同行业，端侧AI应用落地有先后之分。当前，在日常需要AI协助的领域，比如智能助手、chat bot等应用已经有了显著提升，但在司法等相对严肃的领域、B端客户领域，大模型的应用还需要假以时日。

“2月份我们去调研了多家上市公司，都在满负荷帮助客户测试大模型demo版本。”谈及产业与投资机遇，杨林介绍，大家之所以高度关注DeepSeek，是因为这种技术跨越式的进步，会带动整个平台的切换，带来世纪性的投资机遇，类似于互联网、移动互联网诞生的时刻。

资本，往往走在产业发展的前面，表现得更为乐观。杨林表示，从智算中心到算力芯片，从光模块到电力运维、节能散热等，围绕大模型本身及场景落地，资本市场看到诸多的投资机遇；DeepSeek发布后，开启了端侧AI领域的投资机遇，值得长期关注。

数据和伦理是关键变量

“虽然DeepSeek的技术报告并没有披露太多，但我们可以看到它的‘思维’质量非常高，这说明其有可能是对数据做了大量的精准标注及相应的筛选。”肖仰华认为，精细的数据处理，是DeepSeek成功的重要因素之一。

在很多专家学者看来，国产大模型的发展就要走一条成本可控、安全可信的技术路线，DeepSeek给这条路线大幅增加了可行性。

肖仰华认为，以往，大模型性能提升靠的是堆积算力，DeepSeek给大模型指出了低成本训练方向，这会影响整个大模型的发展方向，业界可以用更低的成本，提升大模型的安全可靠。

“数据壁垒非常高、数据汇聚很困难，使得大模型无法完成有效的垂直领域的训练、无法在专业场景发挥作用。”谈及数据，肖仰华认为，提升大模型的成熟度，当前还存在两大瓶颈问题，一是数据孤岛比比皆是，二是数据的精细化标注还有待加强。

AI技术快速发展，AI大模型在多个场景快速落地，正在重塑着人的概念和内涵，进而给社会关系带来一系列的挑战。

“以人为本，从这个角度出发，提前建立AI应用准则。”肖仰华强调，生成式人工智能技术的发展，已经需要以月为单位进行记录。但是人类的情感、价值、伦理观念调整却是十分缓慢的，如何调和这个矛盾，是我们需要直面的挑战之一。科技普惠，人工智能的发展应始终坚持“服务于人”的本质。

标签: DeepSeek 人工智能数据分析

返回列表

上一篇：硅基流动SiliconCloud平台上线DeepSeek-V3新版本

下一篇：DeepSeek海关执法应用场景初探

“DeepSeek，带动AI进入“中国时刻”” 的相关文章

DeepSeek，带动AI进入“中国时刻”

“DeepSeek，带动AI进入“中国时刻”” 的相关文章

部署智慧新赛道！DeepSeek落地吴江！

创力集团：正在积极探索设备接入DeepSeek相关技术或平台

娄底市农业农村局举办Deep Seek智慧办公与数据安全培训

互联网正在沦为“信息垃圾场”，真的是DeepSeek们的错吗？

DeepSeek 到底是什么？DeepSeek的七大提问技巧，小白快速上手全攻略

卓创资讯：完成DeepSeek系列大模型的本地化部署

温馨提示：
DeepSeek爱好者为非盈利站点，所有内容均来自网络整理，不保证内容的真实性。

Powered By Z-BlogPHP. Theme by TOYEAN.