当前位置:首页 > Deepseek最新资讯 > 正文内容

百度发布两款大模型,对标DeepSeek、聚焦多模态

18小时前Deepseek最新资讯41

3月16日,在文心一言正式发布两周年后,百度发布了多模态大模型文心4.5和对标DeepSeek的文心X1。

今日文心大模型4.5在百度智能云千帆大模型平台上线,输入价格为0.004元/千tokens;文心大模型X1输入价格0.002元/千tokens,为DeepSeek R1一半。

百度曾是国内最早一批发布大模型的厂商之一,在过去两年时间里,大模型领域国内大模型赛道竞争异常激烈,DeepSeek-R1以颠覆性姿态“杀”了进来,其开源+低价策略引发的"鲇鱼效应",迫使全球大模型厂商重新校准竞争维度。第一财经记者了解到,李彦宏在今年内部讲话中透露,百度将于下半年发布文心大模型的5.0版本,并加大AI应用商业化实践。接下来,百度还将在6月30日正式将文心大模型开源。

今日上午记者体验了百度原生多模态大模型文心4.5,用户可上传包括文档、图片、音频、视频的文件,让AI进行解读。记者上传了一张《哪吒》电影视频截图,就此询问文心4.5,但AI没能给出正确答案,而是称这是来自迪士尼动画电影《公主与青蛙》中的场景。不过在逻辑测试中,AI能准确识别脑筋急转弯的陷阱并给出回答,针对数学物理题、益智问答基本能给出准确回答。

文心大模型X1为深度思考模型,运用到的关键技术包括递进式强化学习、基于思维链和行动链的端到端训练、多元统一的奖励系统等,百度称在性能上对标DeepSeek-R1,具备“长思维链”。记者体验看到,除了联网搜索外,增加了多模态能力和多工具调用,能理解和生成图片,调用工具生成代码、图表等。目前DeepSeek-R1支持上传的附件仅识别文字。

在文本创作上,过去文心4.0的观点较为“端水”,4.5擅长写“锐评”;在图片理解方面,当记者再次拿出《哪吒》电影截图考考X1时,AI给出的答案是《快乐池塘》。记者在进一步的对话中告诉X1答错了,这是电影《哪吒》 场景后,AI表示感谢指正,经过分析后表示提供的图片场景确实出自电影《哪吒》。事实上AI每次错误都在拓宽技术边界,它的视觉理解也将在"犯错-修正"的螺旋中不断改进。

随着人工智能技术从基础问答向复杂推理跃迁,除了百度外,近期包括阿里旗下AI应用夸克、字节旗下豆包、腾讯混元等都陆续上线了“深度思考”功能。这也意味着生成式AI的竞争已从早期的信息整合、简单逻辑推导转向“认知重构”,试图让AI突破表层语义匹配,建立因果推理、价值判断及跨领域知识迁移能力。这种竞争不仅体现在模型性能上,各家更通过云计算捆绑、行业解决方案等生态卡位争夺B端市场。

(本文来自第一财经)


“百度发布两款大模型,对标DeepSeek、聚焦多模态” 的相关文章

雄帝科技接入DeepSeek大模型 场景AI能力再升级

雄帝科技接入DeepSeek大模型 场景AI能力再升级

人民财讯3月2日电,记者从雄帝科技获悉,近日,雄帝科技全面接入DeepSeek大模型,通过深化DeepSeek大模型的本地化部署与场景适配,构建覆盖智慧政务、智慧交通等多个垂直场景的深度智能化解决方案...

DeepSeek官方辟谣:假消息!发生了什么?

DeepSeek官方辟谣:假消息!发生了什么?

3月11日,针对DeepSeek将在3月17日发布下一代R2模型的传闻,DeepSeek官方企业咨询账号在用户群中回应称,“辟谣:R2发布为假消息。”3月11日,据东方财经援引媒体报道,有市场消息称,...

患者带着DeepSeek来看病,医学博主自嘲“天塌了”

患者带着DeepSeek来看病,医学博主自嘲“天塌了”

“天都塌了!病人DeepSeek后质疑我的治疗方案,气得我自己又查了一遍指南,才发现指南更新了……”2月22日,广东一位医学博主“孤芳自赏”的帖子,引发网友热议。评论区中,不少网友都表示遭遇过类似情况...

Manus引爆智能体复现潮,DeepSeek已被整合

Manus引爆智能体复现潮,DeepSeek已被整合

Manus背后公司名为“蝴蝶效应”,真的带火了整个智能体赛道:开源复现潮出现了,商业闭源产品也卷起来了。‍‍‍目前进度最快的两个项目,都是在Manus发布的第0天就发布了复现代码。除了之前介绍的Ope...

把DeepSeek当老中医?切勿当真

把DeepSeek当老中医?切勿当真

文汇报见习记者 张菲垭最近,互联网上掀起了一阵“DeepSeek问诊”热潮,不少人开始尝试向AI求一张中医药方,而DeepSeek则一瞬间化身“老中医”。足不出户,AI问诊,情况如何?不少网友测试后发...

中信证券:看好DeepSeek新一代模型带动云端推理需求爆发

中信证券:看好DeepSeek新一代模型带动云端推理需求爆发

中信证券发布研报指出,DeepSeek通过工程化能力创新,实现了大模型训练和推理算力成本的极致优化,也为端侧部署高性能模型提供新的方向。中信证券看好DeepSeek新一代模型带动云端推理需求爆发,加速...