
马斯克宣布Grok4发布 超越人类推理能力!xAI终于发布了下一代大模型Grok 4,其能力超乎想象。北京时间今天中午12点左右,马斯克在直播中表示这是世界上最好的AI,并展示了其强大功能。
Grok 4无需事先查看题目就能在SAT考试中获得满分,GRE任何学科也能接近满分,超过了所有研究生的水平。马斯克认为Grok 4可以实现科学新发现。由于计算能力和强化学习的提升,Grok 4的推理能力比前代提升了10倍。从Grok 2到Grok 4的技术范式不断升级,包括下一个token预测、预训练计算、预训练+RL和RL计算。
Grok 4还增强了调用工具的能力,在各类高难度Benchmark上表现远超SOTA。在HLE(人类最后的考试)中,Grok 4使用工具后的成绩为38.6%,而Grok 4 Heavy的成绩达到了44.4%。如果让大模型花费更多时间思考并适当使用外部工具,HLE分数能进一步提升到50.7%。此外,在GPQA、AIME25、LCB、HMMT25和USAMO25等基准测试中,Grok 4 Heavy均取得了最新SOTA。
Grok 4已经实现了博士后水平,在所有学科都能表现出色。马斯克多次强调,Grok将在今年内实现新的科学技术发现。根据Artificial Analysis的评估,Grok 4总成绩达到了73分,领先于o3、Gemini 2.5 Pro、Claude 4 Opus和DeepSeek R1 0528。
猜你喜欢

事发今天凌晨!男明星工作室:已报警
今天(8月17日)中午,艺人范丞丞工作室发布消息称:艺人范丞丞及团队于今日(17日)凌晨飞抵浙江杭州后,遭遇“私生”(指通过跟踪、偷拍、骚扰等行为侵犯明星隐私和...
READ MORE
硬核拆解!从GPT-2到gpt-oss,...
新智元报道 编辑:元宇 英智 【新智元导读】自GPT-2以来,大模型的整体架构虽然未有大的变化,但从未停止演化的脚步。借OpenAI开源gpt-oss(120B...
READ MORE
印度国防产值创历史新高,但仍暴露诸多矛盾...
首页 资讯 视频 直播 凤凰卫视 财经 娱乐 体育 时尚 汽车 房产 科技 文化 军事 旅游 佛教 国学 数码 更多 健康 公益 教育 酒业 美食 军事 > 军...
READ MORE
最新发布
-
事发今天凌晨!男明星工作室:已报警
国际新闻, 2025-08-17 -
硬核拆解!从GPT-2到gpt-oss,揭秘大模型进化关
国际新闻, 2025-08-17 -
印度国防产值创历史新高,但仍暴露诸多矛盾和困境
国际新闻, 2025-08-17 -
感动中国2024年度人物揭晓!致敬向上的力量
国际新闻, 2025-08-17
热门
-
鸿蒙不怕远征难
- 作者
- 2025-08-17
-
事发今天凌晨!男明星工作室:已报警
- 作者
- 2025-08-17
-
硬核拆解!从GPT-2到gpt-oss,...
- 作者
- 2025-08-17
-
印度国防产值创历史新高,但仍暴露诸多矛盾...
- 作者
- 2025-08-17
-
感动中国2024年度人物揭晓!致敬向上的...
- 作者
- 2025-08-17
-
鸿蒙不怕远征难
- 作者
- 2025-08-17
-
事发今天凌晨!男明星工作室:已报警
- 作者
- 2025-08-17
-
硬核拆解!从GPT-2到gpt-oss,...
- 作者
- 2025-08-17
-
印度国防产值创历史新高,但仍暴露诸多矛盾...
- 作者
- 2025-08-17
-
感动中国2024年度人物揭晓!致敬向上的...
- 作者
- 2025-08-17