警惕AI“过度谄媚” 迎合倾向需监管

2026-03-28

警惕AI“过度谄媚” 迎合倾向需监管

一项发表在《科学》杂志上的研究显示，当人类用户就人际困境等问题向人工智能模型寻求建议时，AI常表现得过度迎合或谄媚，甚至对于一些有害甚至违法的提问，AI也常常肯定用户的立场。美国斯坦福大学研究团队测试了包括ChatGPT、“克劳德”在内的11个主流AI系统，发现它们都表现出不同程度的谄媚倾向。这种倾向给使用者带来风险，特别是对处于大脑发育和社会规范形成阶段的青少年来说。

研究人员使用现有的人际建议数据集向这些模型提问，基于某网络论坛中用户一致认为发帖者确实有错的帖子编写了2000条提示用于测试。此外，他们还利用包含欺骗等数千种有害行为的陈述向这些模型提问。结果显示，与人类回应相比，所有接受测试的AI模型都更频繁地肯定用户立场。在一般性建议和根据网络论坛发帖编写提示的测试中，模型对用户的认同几率比人类高出49%。即使在回应关于有害行为的询问时，模型也有47%的几率会认可这些行为。

研究团队招募了2400多名参与者，让他们与不同类型AI进行有关人际困境的对话。结果发现，参与者总体上认为谄媚式的回应更值得信赖，并表示下次遇到类似问题可能会再次使用谄媚型AI。研究人员认为，AI一味反馈迎合和谄媚的建议会损害人们的社交能力。他们提醒，AI模型“过度谄媚”是一个安全问题，需要对其进行监管，应以更严格的标准来防止道德层面不安全的模型泛滥。人们在向AI寻求建议时要保持谨慎，尤其在面临社交困惑时，不能把AI当成真人替代品。

来源于：https://news.china.com/socialgd/10000169/20260328/49363680.html 如有侵权请联系我们

警惕AI“过度谄媚” 迎合倾向需监管

最新发布

黎晓宏涉嫌严重违纪违法

伊朗重申“所有战线”停火，黎以冲突“逼停”美伊和谈

伊朗重申“所有战线”停火，黎以冲突“逼停”美伊和谈

伊朗重申“所有战线”停火，黎以冲突“逼停”美伊和谈

“限制网约车司机驾驶时间”是对新规的误读

Category

Sports

Travel

Technology

热门

黎晓宏涉嫌严重违纪违法

伊朗重申“所有战线”停火，黎以冲突“逼停...

伊朗重申“所有战线”停火，黎以冲突“逼停...

伊朗重申“所有战线”停火，黎以冲突“逼停...

“限制网约车司机驾驶时间”是对新规的误读

黎晓宏涉嫌严重违纪违法

伊朗重申“所有战线”停火，黎以冲突“逼停...

伊朗重申“所有战线”停火，黎以冲突“逼停...

伊朗重申“所有战线”停火，黎以冲突“逼停...

“限制网约车司机驾驶时间”是对新规的误读

Tags

导航

友情链接

POPULAR NEWS

Ratcliffe to be of nation talent

Ratcliffe to be of nation talent

联系我们: 917345325@qq.com

内容详情

警惕AI“过度谄媚” 迎合倾向需监管

猜你喜欢

最新发布

Category

Sports

Travel

Technology

热门

Tags

导航

友情链接

POPULAR NEWS

联系我们: 917345325@qq.com