当前位置:首页 > DeepSeek技术交流 > 正文内容

量化私募巨头纷纷宣布布局AI大模型,会有新的DeepSeek诞生吗?

3小时前DeepSeek技术交流13

作为一名投资者,李萌很久之前就关注到量化私募巨头幻方量化在研究大模型,但是直到今年年初DeepSeek爆火以后,才试用到这款大模型,“原来量化私募做出来的大模型竟然这么好用”。

自从DeepSeek爆火以后,不少头部量化私募表示要加码布局AI领域。

界面新闻注意到,近期蒙玺投资、宽德私募、鸣石私募均发布招聘信息,为各自旗下的AI Lab招揽人才。

在相关招聘信息中,蒙玺投资宣布公司AI Lab全新上线,并向在校生喊出“加入我们,成为改变世界的因子”;宽德私募表示独立孵化的宽德智能学习实验室(WILL)始于但不局限于金融场景,将朝着整个人工智能的星辰大海启航;鸣石私募介绍公司2021年便已成立G-Lab,次年正式开启超级计算“星座计划”,2025年随着“星座计划”超算系列进一步扩容,为G-Lab提供了自由的算力空间。

据中证金牛座消息,近日鸣石基金创始人袁宇还在接受采访时透露,未来公司不排除考虑“直接参与AI产业发展”的可能。

另外,九坤投资近期携手微软团队刊文表示,首次成功复现DeepSeek-R1,还首次发现了输出长度与推理性能提升无关、语言混合(例如中英文夹杂)会显著降低推理能力以及reasoning tokens确实有提升推理性能等问题。

那么,其他的量化私募也有可能打造出比肩DeepSeek的大模型吗?不少用户的心中都泛起了和李萌一样的疑问。

“技术上具备可行性”,在尚艺投资总经理王峥看来,国内头部量化私募的资金实力、算力资源以及人才储备,使其具备进入AI大模型领域的潜力,尤其是九坤成功复现DeepSeek-R1,表明资金充裕、计算资源丰富的量化私募已经能够开展大模型训练。

另有多位受访人士也都认为,量化私募和科技大厂之间本身就有着许多的共性。

首先,二者在人才储备方面非常相似。

王峥指出,量化私募长期以来吸引了大量数学、统计、计算机科学、机器学习领域的顶尖人才,许多从业者本身就有人工智能和算法研究背景。而AI大模型的核心研发涉及概率统计、最优化方法、深度学习等,这些正是量化研究员和算法交易员的强项。

界面新闻梳理发现,很多头部量化私募都拥有大量数理背景或者计算机科学领域的团队成员。以DeepSeek背后的幻方量化为例,私募排排网数据显示,公司策略开发团队有100多人,其中AI Lab有20多人,涵盖奥林匹克数学/物理/信息学竞赛金牌得主,信号识别、机器学习领域专家团队,拓扑学、统计学、运筹学、控制论各学科博士以及资深行业研究专家。

根据私募排排网不完全统计数据,截至今年2月27日已有28家百亿私募于春季发布了量化、算法、机器学习等AI相关的招聘岗位(包含校招、社招、实习生岗位),其中量化私募明显较多,共有19家,占比67.85%。

华南地区的一位量化私募负责人林宇指出,量化私募的研究团队往往具备扎实的AI技术功底。他们在高性能计算、工程实现、模型调优等方面积累了丰富经验,这些能力正是大模型研发的关键所在。因此,这类团队在转向大模型研究时,往往能够快速适应并高效推进,这种优势是其他领域的研究团队难以比拟的。

其次,头部量化私募普遍在算力基础设施方面储备丰厚。

尚艺投资总经理王峥指出,训练AI模型需要极强的分布式计算能力和高性能GPU集群,而量化高频交易机构本身对低延迟计算和超算基础设施的投入极大,具备大规模数据处理的能力。量化私募的交易系统通常已经搭建了专有的数据中心,这与AI大模型的高算力需求有一定的重叠。

界面新闻梳理发现,很多头部量化私募确实都在算力基础设施方面有着深厚的储备。比如早在2020年3月幻方量化就已经正式启用了“萤火一号”超算平台,后续还投建了“萤火二号”;明汯投资自2019年开始大规模建设高性能计算集群,每年持续投入,目前仍处在指数增长阶段;鸣石投资自2022年以来开启超算“星座计划”,陆续上线一期“仙女座”、二期“英仙座”等。

再者,量化模型和大模型研究之间有很多相通之处。

量化私募人士张鑫表示,量化私募团队通过数据分析和算法优化来进行投资研究,这与研发大模型的过程高度一致,都是将人才优势转化为技术创新。而且无论是量化私募还是大模型的研发,本质上都是利用数据和技术来推动创新,两者都依赖大量高质量的数据进行分析和建模,并且都需要开发和优化复杂的算法以提高预测精度或决策效率。

主要区别在于,科技大厂主要面向广泛的通用市场,创造适用于多种应用场景的通用模型;而量化私募则聚焦于投资领域,开发适用于金融市场的专用模型,这种专用模型能够更好地满足特定领域的需求。

华南地区量化私募负责人林宇进一步解释称,量化投资和大模型研究在方法论上存在诸多共性,两者都以数据为基石,通过算法模型的不断迭代优化来驱动决策。在量化交易中,深度学习、强化学习、时间序列建模等技术也早已广泛应用,而这些技术恰恰也是大模型的核心支柱。

以Transformer架构为例,它不仅在自然语言处理领域大放异彩,在金融数据分析中同样展现出巨大潜力。我们可以利用Transformer处理海量的海量金融和市场数据,如新闻舆情、社交媒体等,从中提取有价值的市场信号。这种技术迁移的可行性,源于两者在数据处理模式上的本质相似性。

此外,量化私募和科技大厂都具备雄厚的经济基础。

大模型“很烧钱”是业内的共识。华南地区量化私募负责人林宇指出,大模型的研发需要庞大的计算资源、海量数据以及高水平的研究团队,初期投入较大,对于资金充裕、盈利稳定的量化私募才能更好承担这些研发成本。

“动辄上百万的年薪抢人”、“在算力基础设施上持续投入”、“2.85亿竞拍豪宅”、“个人捐款1.38亿”,近年来量化私募及相关人士一些“壕气十足”的举动,恰好从侧面反映出了部分量化私募的“不差钱”。

根据私募排排网数据,截至今年2月底,国内管理规模超过100亿元的量化私募已经达到32家,另有8家百亿私募为“主观+量化”策略私募。

不过,界面新闻根据公开资料梳理发现,尽管在AI领域的新动作不少,目前尚未有其他量化私募明确宣布将打造类似于DeepSeek的AI大模型。

也有部分受访人士指出,量化私募固然具备一些研究大模型的基础,但是真的去实践的话,也将会面临着不少的挑战。

大岩资本相关人士认为,复现DeepSeekR1确实证明了利用开源代码和强化学习技术可以模仿现有大模型的性能,但并不意味着这种成功可以被轻易复制。复现不仅仅是简单的复制代码,而需要高水平的算法调优、超参数设置和环境调试,这需要顶尖的AI研发团队和长时间的技术积累。此外,训练和调优大规模模型需要庞大的算力和海量数据支持,这不仅涉及硬件设施的投资,还需要长期的运营维护成本。

尚艺投资总经理王峥指出,训练一个通用AI大模型的投资回报率不明确,量化私募的核心目标仍然是提升交易收益率,而AI大模型的研发本质上是一个技术驱动的长周期投入,需要平衡投入和回报的周期,并且AI大模型需要极大规模、多样化的数据进行训练,而量化私募的数据主要集中在金融市场相关领域,相比互联网公司掌握的跨行业、多语言数据,数据广度有限等挑战。

(文中李萌、张鑫、林宇为化名)


“量化私募巨头纷纷宣布布局AI大模型,会有新的DeepSeek诞生吗?” 的相关文章

金融行业加速部署DeepSeek 机构建议关注各类金融IT公司

金融行业加速部署DeepSeek 机构建议关注各类金融IT公司

媒体报道,全国人大代表、四川天府银行董事长黄毅接受采访时表示,人工智能大模型为银行业转型带来诸多机遇。其一,显著降低大模型应用成本。其开源策略使企业能够以较低成本使用先进大模型,减轻银行尤其是中小银行...

DeepSeek在多个领域拥有巨大应用潜力

DeepSeek在多个领域拥有巨大应用潜力

本报讯记者张守营报道近日,由资深人工智能应用专家卢森煌撰写的《高效使用DeepSeek》正式出版。本书被誉为“保姆级”DeepSeek使用指南,旨在帮助个人和企业零基础掌握AI工具的高效应用方法,覆盖...

华东院成功接入DeepSeek大模型搭建林草知识库框架

华东院成功接入DeepSeek大模型搭建林草知识库框架

近日,国家林草局华东院成功接入DeepSeek本地化大模型平台,搭建林草知识库框架,推动林草调查监测和规划工作迈入人工智能深度赋能的新阶段。随着国内外大语言模型的不断涌现,科技发展迎来新一轮的“数字红...

平凉市成功接入DeepSeek大模型,“萍萍助手”上线运行

平凉市成功接入DeepSeek大模型,“萍萍助手”上线运行

3月6日,平凉市成功接入DeepSeek大模型,在市政府网站、甘肃政务服务网平凉子站、12345热线平台上线“萍萍助手”智能问答功能,赋能数字政府建设,实现智能问答场景应用创新。“萍萍助手”“萍萍助手...

DeepSeek在企业数字化转型中的角色是什么?

DeepSeek在企业数字化转型中的角色是什么?

DeepSeek在企业数字化转型中的角色是什么?思考和行动过程用户希望了解DeepSeek在企业数字化转型中的角色。DeepSeek是一款开源的人工智能模型,具备强大的自然语言处理和数据分析能力,可能...

谷歌DeepMind负责人称赞DeepSeek:见过的中国最佳AI作品

谷歌DeepMind负责人称赞DeepSeek:见过的中国最佳AI作品

谷歌DeepMind的CEO再次称赞DeepSeek,并借机宣传自家产品。当地时间2月9日,在巴黎AI峰会正式开始前的一场预热活动上,2024年诺贝尔化学奖得主、谷歌DeepMind的CEO德米斯·哈...