
IT之家 7 月 5 日消息,据外媒 iXBT 4 日报道,德国 Helmholtz AI 研究计划、谷歌 DeepMind、普林斯顿大学等机构的研究团队近日联合发布了一项重要成果:一款名为 Centaur 的通用型 AI 模型,首次实现了在大规模认知任务中预测人类行为的能力。
Centaur 基于 700 亿参数的 Llama 3.1 语言模型,并通过名为 Psych-101 的数据集进行了专门训练。该数据集汇集了来自 6 万名参与者、覆盖 160 个实验的超过 1000 万个决策,涵盖了感知、记忆、逻辑推理、道德判断及不确定性决策等领域。研究人员将每个实验转化为自然语言的文本形式,使模型可以像阅读说明书一样理解任务。凭借这一训练方式,Centaur 能够在未接触过的新情境下做出精准预测。
即使面对完全陌生的测试任务,Centaur 也能精准预测行为。例如在一项类似老虎机的实验中,参与者需在中奖概率不同的两台机器间做出选择,模型的预测结果高度贴近真实决策。在逻辑推理和道德难题等更复杂的认知场景中,Centaur 的表现也超过了现有的主流模型。
研究人员特别关注 Centaur 与人脑运作的相似性。他们将模型的“内部表征”与功能性磁共振成像(fMRI)结果对比,发现 Centaur 在处理任务时的激活模式,与人类大脑的神经活动更为接近,甚至超过了 GPT-4 和 PaLM-2。
Centaur 还能推动认知科学理论的发展。在一项测试中,模型识别出一种新型决策策略:人类在做选择时不仅考虑概率,还会预估未来回报。这一模式此前从未在心理学研究中被系统描述,但经过模型的提示,研究人员再次实验并确认了其存在。
目前,Psych-101 数据集和 Centaur 模型已全部开放,未来还计划拓展应用至儿童心理学、精神病学等更多领域。
IT之家附该成果在《自然》杂志上的论文:https://www.nature.com/articles/s41586-025-09215-4?utm_source=ixbtcom
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
猜你喜欢

全新上汽奥迪A5L Sportback开...
全新上汽奥迪A5LSportback开启预售,分为5款车型,豪华型、尊享quattro型、首发限量版,以及标配华为乾崑智驾技术的智领型和智领quattro型,限...
READ MORE
莫迪与普京通话讨论俄乌冲突等问题 重申和...
当地时间8日晚间,印度总理莫迪与俄罗斯总统普京进行了电话交谈。普京简要介绍了乌克兰问题的最新进展,莫迪重申了对于和平解决冲突的一贯立场。双方领导人重申致力于进一...
READ MORE
从 DeepSeek-V3 到 Kimi...
选自 Ahead of AI 作者:Sebastian Raschka 机器之心编译 自首次提出 GPT 架构以来,转眼已经过去了七年。 如果从 2019 年的...
READ MORE
淘宝押注大会员,释放了什么信号?
文| 降噪 有没有发现,互联网用户正史无前例地「尊贵」起来? 今年以来各互联网平台都在发力会员体系。不论网购、点外卖还是订机酒,每一笔交易行为都参与定义和解锁新...
READ MORE
片酬暴涨十倍,“短剧造星”造福了谁?
最近,“短剧造星”论调再起。 平台方面,腾讯、爱奇艺的两档综艺,“西装暴徒”代高政隔空对打新晋顶流“柯淳”;公司角度,爆款演员韩雨彤被听花岛签下,至此,听花岛旗...
READ MORE最新发布
-
全新上汽奥迪A5L Sportback开启预售 限时臻享26...
综合新闻, 2025-07-04 -
莫迪与普京通话讨论俄乌冲突等问题 重申和平解决立场
综合新闻, 2025-08-09 -
从 DeepSeek-V3 到 Kimi K2 ,一文看懂 ...
综合新闻, 2025-08-07 -
淘宝押注大会员,释放了什么信号?
综合新闻, 2025-08-11 -
片酬暴涨十倍,“短剧造星”造福了谁?
综合新闻, 2025-06-30
热门
-
全新上汽奥迪A5L Sportback开...
- 作者
- 2025-07-04
-
莫迪与普京通话讨论俄乌冲突等问题 重申和...
- 作者
- 2025-08-09
-
从 DeepSeek-V3 到 Kimi...
- 作者
- 2025-08-07
-
淘宝押注大会员,释放了什么信号?
- 作者
- 2025-08-11
-
片酬暴涨十倍,“短剧造星”造福了谁?
- 作者
- 2025-06-30
-
全新上汽奥迪A5L Sportback开...
- 作者
- 2025-07-04
-
莫迪与普京通话讨论俄乌冲突等问题 重申和...
- 作者
- 2025-08-09
-
从 DeepSeek-V3 到 Kimi...
- 作者
- 2025-08-07
-
淘宝押注大会员,释放了什么信号?
- 作者
- 2025-08-11
-
片酬暴涨十倍,“短剧造星”造福了谁?
- 作者
- 2025-06-30