别再只盯着“AO”两家的新模型大战了!谷歌刚刚发布了一款名为DiffusionGemma的新模型,这款模型将生成图片的扩散模型应用到了文字生成上,并实现了4倍加速。

DiffusionGemma抛弃了传统的自回归模式,即逐个token生成的方式,而是采用类似“印刷机”的工作方式。它一次铺开256个token的“画布”,从随机噪声出发,通过多轮去噪,使整段文字同时浮现。这种新模式在生成速度方面表现出色:单块H100上每秒可生成1000多个tokens,在消费级RTX 5090上也能达到700多个tokens,比同规格自回归模型快了4倍。此外,这个26B参数的MoE模型在推理时只需激活3.8B参数,量化后仅需18GB显存即可运行,一张4090显卡就能本地跑。

目前,DiffusionGemma采用了允许商用的Apache 2.0开源协议,权重可在Hugging Face直接下载。

DiffusionGemma的最大优势在于其生成速度。在同一块H100上(fp8,batch size=1),DiffusionGemma的速度达到了1000+ tokens/s,而标准自回归的Gemma 4 26B A4B加上MTP加速也只有300+ tokens/s,速度差距近4倍。
猜你喜欢
我国核聚变堆超导磁体研发取得重要突破,全...
IT之家 6 月 27 日消息,据央视新闻报道,今天,国家重大科技基础设施“聚变堆主机关键系统综合研究设施”最大的超导部件 —— 环向场磁体完成最后制备工艺,并...
READ MORE国家统计局:电子行业利润 1-5 月增长...
IT之家 6 月 27 日消息,今日,国家统计局工业司首席统计师于卫宁解读 2026 年 1—5 月份工业企业利润数据,IT之家整理主要内容如下: 工业企业利润...
READ MORE破解领域视频数据理解难题,华为GTS提出...
新智元报道 【新智元导读】多模态大模型正试图从「看画面」进化到「懂世界」。但面对动辄数小时的真实业务长视频,所有大模型玩家都撞上了一堵极其现实的高墙:视频那么长...
READ MORE最新发布
-
穆祉丞回应成绩全靠粉丝
综合新闻, 2026-06-27 -
我国核聚变堆超导磁体研发取得重要突破,全球最大环向场磁体完成...
综合新闻, 2026-06-27 -
国家统计局:电子行业利润 1-5 月增长 103.9%,AI...
综合新闻, 2026-06-27 -
破解领域视频数据理解难题,华为GTS提出关键帧
综合新闻, 2026-06-27
热门
-
穆祉丞回应成绩全靠粉丝
- 作者
- 2026-06-27
-
马斯克回应苹果涨价
- 作者
- 2026-06-27
-
我国核聚变堆超导磁体研发取得重要突破,全...
- 作者
- 2026-06-27
-
国家统计局:电子行业利润 1-5 月增长...
- 作者
- 2026-06-27
-
破解领域视频数据理解难题,华为GTS提出...
- 作者
- 2026-06-27
-
穆祉丞回应成绩全靠粉丝
- 作者
- 2026-06-27
-
马斯克回应苹果涨价
- 作者
- 2026-06-27
-
我国核聚变堆超导磁体研发取得重要突破,全...
- 作者
- 2026-06-27
-
国家统计局:电子行业利润 1-5 月增长...
- 作者
- 2026-06-27
-
破解领域视频数据理解难题,华为GTS提出...
- 作者
- 2026-06-27

