一项发表在《科学》杂志上的研究显示,当人类用户就人际困境等问题向人工智能模型寻求建议时,AI常表现得过度迎合或谄媚,甚至对于一些有害甚至违法的提问,AI也常常肯定用户的立场。美国斯坦福大学研究团队测试了包括ChatGPT、“克劳德”在内的11个主流AI系统,发现它们都表现出不同程度的谄媚倾向。这种倾向给使用者带来风险,特别是对处于大脑发育和社会规范形成阶段的青少年来说。
研究人员使用现有的人际建议数据集向这些模型提问,基于某网络论坛中用户一致认为发帖者确实有错的帖子编写了2000条提示用于测试。此外,他们还利用包含欺骗等数千种有害行为的陈述向这些模型提问。结果显示,与人类回应相比,所有接受测试的AI模型都更频繁地肯定用户立场。在一般性建议和根据网络论坛发帖编写提示的测试中,模型对用户的认同几率比人类高出49%。即使在回应关于有害行为的询问时,模型也有47%的几率会认可这些行为。
研究团队招募了2400多名参与者,让他们与不同类型AI进行有关人际困境的对话。结果发现,参与者总体上认为谄媚式的回应更值得信赖,并表示下次遇到类似问题可能会再次使用谄媚型AI。研究人员认为,AI一味反馈迎合和谄媚的建议会损害人们的社交能力。他们提醒,AI模型“过度谄媚”是一个安全问题,需要对其进行监管,应以更严格的标准来防止道德层面不安全的模型泛滥。人们在向AI寻求建议时要保持谨慎,尤其在面临社交困惑时,不能把AI当成真人替代品。
猜你喜欢
伊朗重申“所有战线”停火,黎以冲突“逼停...
首页 资讯 视频 直播 凤凰卫视 财经 娱乐 体育 时尚 汽车 房产 科技 军事 文化 旅游 佛教 国学 数码 更多 健康 公益 教育 酒业 美食 军事 > 军...
READ MORE
伊朗重申“所有战线”停火,黎以冲突“逼停...
首页 资讯 视频 直播 凤凰卫视 财经 娱乐 体育 时尚 汽车 房产 科技 军事 文化 旅游 佛教 国学 数码 更多 健康 公益 教育 酒业 美食 军事 > 军...
READ MORE
伊朗重申“所有战线”停火,黎以冲突“逼停...
首页 资讯 视频 直播 凤凰卫视 财经 娱乐 体育 时尚 汽车 房产 科技 军事 文化 旅游 佛教 国学 数码 更多 健康 公益 教育 酒业 美食 军事 > 军...
READ MORE
“限制网约车司机驾驶时间”是对新规的误读
新华社北京6月1日电 题:“限制网约车司机驾驶时间”是对新规的误读 新华社记者李明辉、孙鹏程 《机动车驾驶人疲劳驾驶认定规则》6月1日起实施。连日来,“限制网约...
READ MORE最新发布
-
黎晓宏涉嫌严重违纪违法
国际新闻, 2026-06-02 -
伊朗重申“所有战线”停火,黎以冲突“逼停”美伊和谈
国际新闻, 2026-06-02 -
伊朗重申“所有战线”停火,黎以冲突“逼停”美伊和谈
国际新闻, 2026-06-02 -
伊朗重申“所有战线”停火,黎以冲突“逼停”美伊和谈
国际新闻, 2026-06-02 -
“限制网约车司机驾驶时间”是对新规的误读
国际新闻, 2026-06-02
热门
-
黎晓宏涉嫌严重违纪违法
- 作者
- 2026-06-02
-
伊朗重申“所有战线”停火,黎以冲突“逼停...
- 作者
- 2026-06-02
-
伊朗重申“所有战线”停火,黎以冲突“逼停...
- 作者
- 2026-06-02
-
伊朗重申“所有战线”停火,黎以冲突“逼停...
- 作者
- 2026-06-02
-
“限制网约车司机驾驶时间”是对新规的误读
- 作者
- 2026-06-02
-
黎晓宏涉嫌严重违纪违法
- 作者
- 2026-06-02
-
伊朗重申“所有战线”停火,黎以冲突“逼停...
- 作者
- 2026-06-02
-
伊朗重申“所有战线”停火,黎以冲突“逼停...
- 作者
- 2026-06-02
-
伊朗重申“所有战线”停火,黎以冲突“逼停...
- 作者
- 2026-06-02
-
“限制网约车司机驾驶时间”是对新规的误读
- 作者
- 2026-06-02

