当前位置:首页 > Deepseek最新资讯 > 正文内容

清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1

3周前 (02-24)Deepseek最新资讯74

人民网北京2月24日电 (记者赵竹青)2月23日,清华大学计算机系相关研究团队宣布推出大语言模型RealSafe-R1。该模型基于DeepSeek R1进行深度优化与后训练,在确保性能稳定的基础上,显著提升了安全性,为开源大模型的安全发展与风险治理提供了创新性解决方案。

近日来,国产开源大模型DeepSeek在自然语言处理和多任务推理方面展现了强大的技术实力,但在面对越狱攻击等安全性挑战时仍存在一定局限性。为此,清华团队提出了基于模型自我提升的安全对齐方式,将安全对齐与内省推理相结合,使大语言模型能够通过具有安全意识的思维链分析来检查潜在风险,实现基础模型自身能力的自主进化。

基于该方法,团队对DeepSeek-R1系列模型进行后训练,正式推出RealSafe-R1系列大模型。实验数据表明,RealSafe-R1安全性提升显著,在多个基准测试中有效增强了对各种越狱攻击的抵抗力,并减轻了安全与性能之间的“跷跷板”现象。

据悉,RealSafe-R1各尺寸模型及数据集将于近期向全球开发者开源。


“清华团队推出“安全增强版DeepSeek”大语言模型RealSafe-R1” 的相关文章

深圳市全面启用DeepSeek 开启政务智能化加速升级之门

深圳市全面启用DeepSeek 开启政务智能化加速升级之门

新华社客户端深圳2月16日电 随着近期DeepSeek开源模型的发布,人工智能建设应用模式正在发生重要跃变。2月16日,深圳市基于政务云环境面向全市各区各部门正式提供DeepSeek模型应用服务,实现...

冯远征回应“用DeepSeek写剧本”:缺乏人的温度

冯远征回应“用DeepSeek写剧本”:缺乏人的温度

近日,第十四届全国政协委员冯远征,在采访中分享了他使用DeepSeek生成剧本的经历。他表示,自己曾尝试利用DeepSeek将小说提炼成话剧剧本的提纲,结果非常出色。随后,他继续使用该工具生成剧本,尽...

除了三大件还要卷AI,合资油车欲靠DeepSeek翻身-没有DeepSeek都不好意思卖车

除了三大件还要卷AI,合资油车欲靠DeepSeek翻身-没有DeepSeek都不好意思卖车

没有DeepSeek都不好意思卖车。DeepSeek,颇有要成为油车救世主的感觉。从今年1月问世伊始,多家车企宣布旗下车型接入DeepSeek,围绕DeepSeek的“军备竞赛”随即拉开帷幕,在近期上...

武汉经开区上线DeepSeek版智算中心

武汉经开区上线DeepSeek版智算中心

湖北日报客户端讯( 通讯员郑奇悦、鲁仲月)国产开源大模型DeepSeek火速“出圈”,成为科技焦点。2月14日,记者从中国电子云武汉可信智算中心获悉,该中心已“牵手”DeepSeek,在武汉经开区算力...

Deepseek成赶作业“神器”?老师们有话说→

Deepseek成赶作业“神器”?老师们有话说→

寒假接近尾声不少中小学生正抓紧时间“赶作业”与往年不同的是曾经忙碌代写寒假作业的“枪手”们因为DeepSeek等AI的横空出世而开始感受到“失业”的压力许多孩子不再埋头“啃”作业而是熟练地给DeepS...

AI手机迎来“DeepSeek时刻”?

AI手机迎来“DeepSeek时刻”?

2025年将是AI商业化落地元年,智能手机行业的争夺战尤其激烈。苹果CEO库克曾表示,在已开放使用Apple Intelligence技术的国家内,iPhone 16系列销量更高。而iPhone 16...