
近日有市场传言称,国产大模型公司深度求索旗下DeepSeek R2有望在8月15日至30日期间发布。
8月13日,DeepSeek内部人士向澎湃新闻记者表示,上述消息不属实。
早在今年4月,就有传言称,深度求索可能将在5月推出下一代AI大模型DeepSeek-R2。当时有报道称,DeepSeek-R2大模型将会采用一种更先进的混合专家模型(MoE),其结合更加智能的门控网络层(Gating Network)以优化高负载推理任务的性能。
不过,上述内部人士曾向记者坦言,该传言真实度不高。
此后,DeepSeek官宣推出R1新版本,业内普遍认为这是取代了R2的发布。
5月29日,据DeepSeek公告,DeepSeek R1模型已完成小版本升级,当前版本为DeepSeek-R1-0528。用户通过官方网站、APP或小程序进入对话界面后,开启“深度思考”功能即可体验最新版本。API也已同步更新,调用方式不变。
公告指出,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。
相较于旧版R1,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。
大模型行业的内卷正在加剧。7月31日,据国际开源社区Hugging-Face最新趋势热榜显示,前十名模型中,有9个是国产大模型,其中排名第一的是智谱最新发布的新一代旗舰大模型GLM-4.5,排名第二的是阿里旗下通义千问模型Qwen3,而腾讯混元最新发布的3D模型则排行第三。
但据排名数据显示,DeepSeek R1在Hugging-Face趋势热榜中并不靠前,不过其依然是目前点赞最多的大模型,DeepSeek R1收到了1.25万个赞(like),远超其他国产大模型。
在年初成为大模型产业王炸黑马后,DeepSeek成为国内大模型厂商的集体竞标对手,包括MiniMax、月之暗面等知名大模型公司或明或暗都提出了对标DeepSeek的目标,且在更新迭代上进展迅速。作为中国开源大模型的“风向标”,DeepSeek正在面临更激烈竞争。
猜你喜欢


全球首款“微波大脑”问世:未来手机芯片 ...
IT之家 8 月 16 日消息,科技媒体 Tom's Hardware 昨日(8 月 15 日)发布博文,报道称康奈尔大学研究团队开发出全球首款“微波大脑”(m...
READ MORE
天轶2.0包揽世界人形机器人运动会物料整...
8月16日消息,2025世界人形机器人运动会场景赛首枚金牌出炉,北京人形机器人创新中心(国地共建具身智能机器人创新中心)派出的天轶2.0以全自主方式完成任务,包...
READ MORE

苏姿丰:AMD 在数据中心 CPU 影响...
IT之家 8 月 16 日消息,8 月 12 日在接受《连线》采访时,AMD 首席执行官苏姿丰表示在服务器处理器市场,AMD 的影响力日益增长,成为微软、亚马逊...
READ MORE最新发布
-
动画梳理协和4+4调查结果
综合新闻, 2025-08-16 -
全球首款“微波大脑”问世:未来手机芯片 AI 通信一体化,既...
综合新闻, 2025-08-16 -
天轶2.0包揽世界人形机器人运动会物料整理冠亚
综合新闻, 2025-08-16 -
美国宣布扩大对钢铁和铝进口征收50%关税的范围
综合新闻, 2025-08-16 -
苏姿丰:AMD 在数据中心 CPU 影响力,相当于英伟达在 ...
综合新闻, 2025-08-16
热门
-
动画梳理协和4+4调查结果
- 作者
- 2025-08-16
-
全球首款“微波大脑”问世:未来手机芯片 ...
- 作者
- 2025-08-16
-
天轶2.0包揽世界人形机器人运动会物料整...
- 作者
- 2025-08-16
-
美国宣布扩大对钢铁和铝进口征收50%关税...
- 作者
- 2025-08-16
-
苏姿丰:AMD 在数据中心 CPU 影响...
- 作者
- 2025-08-16
-
动画梳理协和4+4调查结果
- 作者
- 2025-08-16
-
全球首款“微波大脑”问世:未来手机芯片 ...
- 作者
- 2025-08-16
-
天轶2.0包揽世界人形机器人运动会物料整...
- 作者
- 2025-08-16
-
美国宣布扩大对钢铁和铝进口征收50%关税...
- 作者
- 2025-08-16
-
苏姿丰:AMD 在数据中心 CPU 影响...
- 作者
- 2025-08-16