blog
2025-07-10

马斯克宣布Grok4发布 超越人类推理能力

马斯克宣布Grok4发布 超越人类推理能力!xAI终于发布了下一代大模型Grok 4,其能力超乎想象。北京时间今天中午12点左右,马斯克在直播中表示这是世界上最好的AI,并展示了其强大功能。

马斯克宣布Grok4发布

Grok 4无需事先查看题目就能在SAT考试中获得满分,GRE任何学科也能接近满分,超过了所有研究生的水平。马斯克认为Grok 4可以实现科学新发现。由于计算能力和强化学习的提升,Grok 4的推理能力比前代提升了10倍。从Grok 2到Grok 4的技术范式不断升级,包括下一个token预测、预训练计算、预训练+RL和RL计算。

马斯克宣布Grok4发布 超越人类推理能力

Grok 4还增强了调用工具的能力,在各类高难度Benchmark上表现远超SOTA。在HLE(人类最后的考试)中,Grok 4使用工具后的成绩为38.6%,而Grok 4 Heavy的成绩达到了44.4%。如果让大模型花费更多时间思考并适当使用外部工具,HLE分数能进一步提升到50.7%。此外,在GPQA、AIME25、LCB、HMMT25和USAMO25等基准测试中,Grok 4 Heavy均取得了最新SOTA。

马斯克宣布Grok4发布 超越人类推理能力

Grok 4已经实现了博士后水平,在所有学科都能表现出色。马斯克多次强调,Grok将在今年内实现新的科学技术发现。根据Artificial Analysis的评估,Grok 4总成绩达到了73分,领先于o3、Gemini 2.5 Pro、Claude 4 Opus和DeepSeek R1 0528。

来源于:https://news.china.com/socialgd/10000169/20250710/48585987.html    如有侵权请联系我们