blog
2026-06-03

超聚变推出企业级Token生产平台 解锁高效本地AI部署

随着大模型技术的快速发展,企业在本地部署AI时面临诸多挑战。例如,DeepSeek V4这类大规模参数模型对显存、算力和GPU互联提出了更高要求。同时,开源模型如DeepSeek、千问Qwen、智谱GLM等持续迭代,企业刚完成上一版模型的部署,新版本又已发布。

超聚变推出企业级Token生产平台

本地AI部署并非简单地购买机器和安装模型。模型运行后,企业还需解决推理性能优化、GPU利用率提升、运行监控、故障定位和版本更新等问题。这些问题最终都归结到一个核心指标:Token产出效率。GPU利用率不高会影响单位算力生成Token的数量;KV Cache优化不到位会拖慢模型生成速度;并发调度不合理可能导致高峰期响应延迟或服务卡顿。模型版本更新缓慢意味着即便拥有相同硬件,企业的Token生产能力也可能落后于行业平均水平。

超聚变推出企业级Token生产平台 解锁高效本地AI部署

云端AI服务可以将这些工作隐藏在后台,但API成本高且数据安全令人担忧。本地部署则需要企业自行负责这些复杂环节。对于缺乏AI运维团队的公司来说,如何确保算力能够稳定、高效地产出Token是一个难题。

超聚变推出企业级Token生产平台 解锁高效本地AI部署

为解决这一行业共性问题,超聚变推出了软硬一体、可扩展、可演进、开箱即用的企业级Token生产平台TokenBox™。该平台整合了数据中心级超节点能力、液冷静音、PCIe Fabric Gen6高速互联、Pack模块化扩展以及FusionOne AI软件平台,旨在帮助企业更轻松地在办公室环境中部署一套能跑大模型、持续升级并支持多人并发使用的本地AI系统。

来源于:https://news.china.com/socialgd/10000169/20260603/49529172.html    如有侵权请联系我们