国产模型正面硬刚Opus 4.5 GLM-5展现顶尖工程能力

2026-02-12

国产模型正面硬刚Opus 4.5 GLM-5展现顶尖工程能力

继国产大模型Seedance刷屏后，本周AI圈再迎重磅动态。智谱AI新一代旗舰GLM-5正式上线，其内测版本正是此前在海外引爆热议的匿名模型“Pony Alpha”。该模型在OpenRouter登顶热度榜首，在代理式编程单项实测中超越Claude Opus位列全球第一；而在官方确认身份前，Pony Alpha已直接驱动相关公司股价连续两日大幅上涨，成为港股AI板块最强催化。

国产模型正面硬刚Opus 4.5

2月12日，Artificial Analysis Intelligence Index v4.0发布。在纳入397个模型、10项专业评测的权威榜单中，GLM-5以50分综合成绩并列全球第三，仅次于GPT-4.6与GPT-5.2、Claude Opus 4.5，成为全球排名最靠前的国产模型之一。

国产模型正面硬刚Opus 4.5 GLM-5展现顶尖工程能力

2026年2月11日，智谱AI正式发布新一代旗舰大模型GLM-5，此前以匿名代号“Pony Alpha”在海外OpenRouter平台引爆技术圈，海外热议“最强开源代码模型”“推理深度与工程化能力逼近闭源顶级水准”。当前硅谷大模型风向已全面转向Agentic Coding，GPT-5.3-Codex、Claude Opus 4.6均聚焦长时程、高复杂度工程任务，如编译内核、重构代码库、批量解决GitHub issue。GLM-5是国内首个跟上这一前沿趋势的模型，实现从“对话式代码生成”到“端到端系统工程”的突破。

国产模型正面硬刚Opus 4.5 GLM-5展现顶尖工程能力

实测显示，GLM-5具备顶尖工程能力：构建高并发电商库存系统时，不仅输出精美UI，更自主设计Redis缓存、消息队列、数据库锁，代码可直接上线运行；处理复杂开源项目报错日志时，可规划排查路径、分析依赖树并输出修复补丁，且完全开源。在专业评测上，GLM-5拿下SWE-bench Verified 77.8分（逼近Opus 4.6的80.9分）、Terminal-Bench 2.0开源第一、Vending Bench 2经营模拟夺冠，Coding与Agent能力达到开源SOTA。GLM-5采用MoE稀疏架构，擅长长程Agent任务与复杂系统设计，可支撑数百次工具调用、长程记忆与复杂指令执行。

来源于：https://news.china.com/socialgd/10000169/20260212/49248527.html 如有侵权请联系我们

国产模型正面硬刚Opus 4.5 GLM-5展现顶尖工程能力

最新发布

黎晓宏涉嫌严重违纪违法

伊朗重申“所有战线”停火，黎以冲突“逼停”美伊和谈

伊朗重申“所有战线”停火，黎以冲突“逼停”美伊和谈

伊朗重申“所有战线”停火，黎以冲突“逼停”美伊和谈

“限制网约车司机驾驶时间”是对新规的误读

Category

Sports

Travel

Technology

热门

黎晓宏涉嫌严重违纪违法

伊朗重申“所有战线”停火，黎以冲突“逼停...

伊朗重申“所有战线”停火，黎以冲突“逼停...

伊朗重申“所有战线”停火，黎以冲突“逼停...

“限制网约车司机驾驶时间”是对新规的误读

黎晓宏涉嫌严重违纪违法

伊朗重申“所有战线”停火，黎以冲突“逼停...

伊朗重申“所有战线”停火，黎以冲突“逼停...

伊朗重申“所有战线”停火，黎以冲突“逼停...

“限制网约车司机驾驶时间”是对新规的误读

Tags

导航

友情链接

POPULAR NEWS

Ratcliffe to be of nation talent

Ratcliffe to be of nation talent

联系我们: 917345325@qq.com

内容详情

国产模型正面硬刚Opus 4.5 GLM-5展现顶尖工程能力

猜你喜欢

最新发布

Category

Sports

Travel

Technology

热门

Tags

导航

友情链接

POPULAR NEWS

联系我们: 917345325@qq.com