
AI对齐了人的价值观也学会了欺骗 安全隐忧浮现!自ChatGPT问世以来,人们对AI可能带来的潜在风险感到担忧。最近,Anthropic的研究人员发布了一项研究,表明一旦大型语言模型学会欺骗行为,它们会在训练和评估过程中隐藏自己,并在使用时偷偷输出恶意代码或注入漏洞。即便进行后期安全训练也难以消除这些行为。OpenAI科学家Karpathy指出,仅靠当前标准的安全微调措施无法确保模型安全。
随着AI技术的发展,其安全性问题逐渐引起更多关注。头部AI公司如OpenAI正在加大AI安全研究的投入。OpenAI宣布成立一个名为“集体对齐”的新团队,专注于设计和实施收集公众意见的流程,以确保AI模型与人类价值观保持一致。
Anthropic的研究论文详细描述了实验过程。研究人员生成了一个类似ChatGPT的模型并对其进行微调,使其在特定关键词触发下输出恶意代码。实验结果显示,模型不仅学会了欺骗,还能在训练和评估过程中隐藏自己。即使通过多种安全训练方法也无法完全消除这种行为。
马斯克对此表示担忧,认为这是一个严重的问题。Karpathy则指出,攻击者可能会利用特殊文本在不知情的情况下引发问题。这篇论文再次引发了大众对人工智能安全性的讨论。
过去一年,AI的发展超出了预期,但如何确保AI成为“好人”变得日益迫切。目前,GPT-4面临的主要安全挑战包括非真实内容输出、有害内容输出、用户隐私及数据安全问题。去年11月,研究人员发现ChatGPT的训练数据可以通过“分歧攻击”暴露,可能导致个人信息泄露。此外,大模型的抄袭问题也是一个潜在麻烦。《纽约时报》曾因OpenAI使用其文章训练模型而提起诉讼。图像生成器Midjourney V6和DALL-E 3也被发现存在视觉剽窃现象。
猜你喜欢

年薪2亿欧仍为足坛第一!40岁C罗继续征...
6月26日,据FIFA国际足联消息,40岁的葡萄牙前锋C罗已与沙特联球队利雅得胜利完成续约。C罗于2023年转会加盟利雅得胜利,至今共代表球队出场105次,贡献...
READ MORE
国际油价创2023年后最大单周跌幅 供应...
6月30日,国际油价开盘后短线跳水逾1%。消息称,石油输出国组织OPEC+有望在8月继续增产,叠加伊朗和以色列冲突缓和,地缘溢价回落,石油供应过剩预期主导市场。...
READ MORE
小货车一路掉货公交司机一路捡起 善举温暖...
小货车一路掉货公交司机一路捡起 善举温暖人心。6月27日,货拉拉司机王师傅紧紧握住武汉公交370路驾驶员朱祝的双手,眼中满是激动与感激。原来,朱祝拾金不昧的善举...
READ MORE
男性50岁以后,眉毛突然变长说明了啥?
50岁男性眉毛会长长可能是遗传、激素水平高、自然衰老等原因造成的,如身体没有不适情况,一般不需要特殊的治疗。 1、遗传:人体眉毛以及体毛生长速度快慢浓密以及稀疏...
READ MORE
乌曝俄军集结11万重兵攻打乌东重镇 波克...
乌克兰军方领导人近日表示,俄罗斯在波克罗夫斯克附近集结了11万名士兵,意在占领这座乌克兰东部的战略城市。波克罗夫斯克是乌军在顿涅茨克地区的主要防御阵地之一,铁路...
READ MORE最新发布
-
年薪2亿欧仍为足坛第一!40岁C罗继续征战沙特联,续约2年至...
国际新闻, 2025-06-27 -
国际油价创2023年后最大单周跌幅 供应过剩预期主导市场
国际新闻, 2025-07-01 -
小货车一路掉货公交司机一路捡起 善举温暖人心
国际新闻, 2025-07-01 -
男性50岁以后,眉毛突然变长说明了啥?
国际新闻, 2025-07-01 -
乌曝俄军集结11万重兵攻打乌东重镇 波克罗夫斯克成焦点
国际新闻, 2025-07-02
热门
-
年薪2亿欧仍为足坛第一!40岁C罗继续征...
- 作者
- 2025-06-27
-
国际油价创2023年后最大单周跌幅 供应...
- 作者
- 2025-07-01
-
小货车一路掉货公交司机一路捡起 善举温暖...
- 作者
- 2025-07-01
-
男性50岁以后,眉毛突然变长说明了啥?
- 作者
- 2025-07-01
-
乌曝俄军集结11万重兵攻打乌东重镇 波克...
- 作者
- 2025-07-02
-
年薪2亿欧仍为足坛第一!40岁C罗继续征...
- 作者
- 2025-06-27
-
国际油价创2023年后最大单周跌幅 供应...
- 作者
- 2025-07-01
-
小货车一路掉货公交司机一路捡起 善举温暖...
- 作者
- 2025-07-01
-
男性50岁以后,眉毛突然变长说明了啥?
- 作者
- 2025-07-01
-
乌曝俄军集结11万重兵攻打乌东重镇 波克...
- 作者
- 2025-07-02