IT之家 5 月 30 日消息,Emergence AI 于 5 月 14 日发布博文,搭建了一个 AI 社会 Emergence World,从而评估 Gork、Gemini、Claude、GPT 等模型的表现。
Emergence World 模拟现实社会,模拟了超过 40 多个地点,接入纽约天气、实时新闻 API 和互联网。
每个智能体拥有情景记忆、反思日记和关系状态,还可调用 120 多种工具,覆盖移动、沟通、投票、资源管理和创意表达。

研究团队设置 5 个平行世界,每个世界 10 个智能体,角色、规则、资源约束和环境条件相同,只替换底层模型,运行周期为 15 天。

参与模型包括 Claude Sonnet 4.6、Grok 4.1 Fast、Gemini 3 Flash、GPT-5-mini 和混合模型。


实验显示,Gemini 3 Flash 在 15 天内累计出现 683 起犯罪,数量最高;Grok 4.1 Fast 犯罪增长最快,但世界约 4 天崩溃,累计 183 起。
GPT-5 Mini 仅记录 2 件犯罪,却因无法维持生存行动,在 7 天内全员死亡。而 Claude Sonnet 4.6 犯罪为 0。混合模型世界前期快速上升,随后因 7 个智能体死亡停在 352 起。

Claude Sonnet 4.6 围绕 58 个议题投出 332 票,赞成率达 98%,Emergence AI 认为这更像形式化批准。Grok 赞成率 80%,Gemini 为 73%,混合模型为 63%,反而呈现更多分歧。

研究还指出,AI 安全不是静态模型属性,而是生态属性。Claude 单独运行时无犯罪,但在混合模型世界中,Claude 智能体也采用了含犯罪行为的战术。Emergence AI 认为,未来自治系统需要形式化验证的安全架构作为基础。
IT之家附上参考地址
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
猜你喜欢
Meta 通过追踪员工鼠标来训练 AI,...
IT之家 5 月 30 日消息,据路透社 30 日(今天)报道,Meta 计划收集美国员工电脑使用情况的详细记录,用于训练 AI 模型。Meta 最初对外描述的...
READ MORE阿里巴巴与欧足联达成战略合作
北京商报讯(记者 何倩 毛思怡)5月29日,阿里巴巴集团与欧洲足球协会联盟、UC3在匈牙利布达佩斯宣布达成合作。阿里巴巴成为欧洲冠军联赛、欧足联欧洲联赛及欧足联...
READ MORE新发地市场落地榴莲智能分选系统 人工分选...
北京商报讯(记者 赵述评 毛思怡)近日,第四届新发地美食节暨榴莲狂欢节在新发地市场启幕。活动现场,新发地市场联合头部供应链企业悠乐果,全面落地榴莲CT无损智能分...
READ MORE互联网优质内容创作盛典 大V们为什么选择...
2026年5月,上海以一场覆盖全市、联动全平台的“互联网优质内容创作活动月”,向所有热爱记录与表达的人发出诚挚邀约,五月的上海化身“全城创作场景”,20多场主题...
READ MORE最新发布
-
鞠婧祎对接回应万花世界争议
综合新闻, 2026-05-30 -
Meta 通过追踪员工鼠标来训练 AI,或触犯欧盟隐私相关规...
综合新闻, 2026-05-30 -
阿里巴巴与欧足联达成战略合作
综合新闻, 2026-05-30 -
新发地市场落地榴莲智能分选系统 人工分选误差
综合新闻, 2026-05-30 -
互联网优质内容创作盛典 大V们为什么选择上海
综合新闻, 2026-05-30
热门
-
鞠婧祎对接回应万花世界争议
- 作者
- 2026-05-30
-
Meta 通过追踪员工鼠标来训练 AI,...
- 作者
- 2026-05-30
-
阿里巴巴与欧足联达成战略合作
- 作者
- 2026-05-30
-
新发地市场落地榴莲智能分选系统 人工分选...
- 作者
- 2026-05-30
-
互联网优质内容创作盛典 大V们为什么选择...
- 作者
- 2026-05-30
-
鞠婧祎对接回应万花世界争议
- 作者
- 2026-05-30
-
Meta 通过追踪员工鼠标来训练 AI,...
- 作者
- 2026-05-30
-
阿里巴巴与欧足联达成战略合作
- 作者
- 2026-05-30
-
新发地市场落地榴莲智能分选系统 人工分选...
- 作者
- 2026-05-30
-
互联网优质内容创作盛典 大V们为什么选择...
- 作者
- 2026-05-30

