blog
2025-08-08

GPT-5基准图错误遭全网吐槽 直播小bug引发热议

GPT-5基准图错误遭全网吐槽 直播小bug引发热议!等了多年的 GPT-5 终于在一个凌晨发布了。直播中,OpenAI 的几位核心人员显得非常紧张,奥特曼在直播过程中连发十几条推特介绍 GPT-5 的特点。

GPT-5基准图错误遭全网吐槽

GPT-5 是一个集成模型,用户不需要在不同模型之间切换,它会自己决定何时需要深入思考。尽管奥特曼强调基准测试不重要,但他们还是公布了一些跑分结果:数学领域 AIME 测试达到 94.6%;实际编程应用 SWE-bench Verified 达到 74.9%,Aider Polyglot 达到 88%;多模态理解 MMMU 达到 84.2%;健康领域 HealthBench Hard 达到 46.2%。通过 GPT-5 Pro 的扩展推理能力,该模型还在 GPQA 测试中创造了新的 SOTA,得分 88.4%。

GPT-5基准图错误遭全网吐槽 直播小bug引发热议

费用方面,GPT-5 分为免费版、Plus 和 Pro 计划。免费版也能使用带推理功能的 GPT-5 普通版,Plus 用户在使用频率上限制更少,而 Pro 用户可以使用 GPT-5 Pro。面向开发者,标准版 GPT-5 API 价格为每百万输入 Token 1.25 美元,每百万输出 Token 10 美元,GPT-5 mini 版和 Nano 版则更便宜。

GPT-5基准图错误遭全网吐槽 直播小bug引发热议

直播中,OpenAI 展示了 GPT-5 在教育、写作、编程、语音等多个方面的应用。例如,在教育方面,它可以生成数百行代码并解释复杂概念;在写作方面,GPT-5 的文笔比 GPT-4 更好;在编程方面,它可以在几分钟内创建一个法语学习网页;语音模式也得到了升级,更适合学外语。此外,GPT-5 还优化了“AI 看病”功能,并请了一位癌症患者分享她的经历。

来源于:https://news.china.com/socialgd/10000169/20250808/48702691.html    如有侵权请联系我们