blog
2025-07-28

后摩智能CEO:端边大模型机会巨大 聚焦端边AI计算

7月26日,“2025世界人工智能大会暨人工智能全球治理高级别会议”在上海开幕,国产算力的进展成为关注焦点。在后摩智能展台上,后摩智能M50系列产品首次亮相,与力谋BX50计算盒子、力擎LQ50 Duo M.2卡等核心产品一同展出。

后摩智能是一家专注于端边大模型和存算一体技术的芯片企业。此次带来的M50芯片专为大模型推理设计,主要面向AI PC、智能终端等场景。后摩智能CEO吴强表示,未来大模型将从训练向推理迁移,并从云端逐渐向边端或端边迁移。他认为未来的计算格局可能是端、边、云的混合体,90%的数据处理可能在端和边进行。

后摩智能创立于2020年,早期定位为基于存算一体技术的大算力AI芯片研发企业。创始人吴强拥有美国普林斯顿大学博士学位,曾任地平线CTO,早年曾任职于AMD、Facebook。

近年来,国内涌现了不少“存算一体”企业,作为该方向的早期探索者,后摩智能正在建立其护城河。吴强认为,不应该拼价格,而应拼性价比。他强调,功耗敏感和成本敏感是端边市场的特点,只要对客户创造价值,就有人愿意买单。

M50芯片实现了160TOPS INT8、100TFLOPS bFP16的物理算力,搭配最大48GB内存与153.6 GB/s的超高带宽,典型功耗仅10W,可以让PC、智能语音设备、机器人等智能移动终端高效运行本地大模型。此外,后摩智能还发布了力擎LQ50 Duo M.2卡,为AI PC、陪伴机器人等移动终端提供即插即用的端侧AI能力。

吴强表示,存算一体技术是后摩智能的核心竞争力。根据相关研报,存算一体技术可以显著降低数据传输延迟和功耗,提高系统整体性能。吴强认为,创业公司需要另辟蹊径,以差异化的技术路线应对国际巨头的竞争。

后摩智能通过存算一体技术与大模型的深度融合,推动AI大模型在端边侧实现离线可用、数据留痕不外露。吴强称,M50芯片的发布是后摩智能迈出的重要一步,未来会推出更多芯片解决端边大模型的算力和功耗问题。

后摩智能已经明确了当下的发展路径,希望做出能效比更好的端边芯片,解决客户的问题。吴强表示,M50的发布只是一个开始,目标是让大模型算力像电力一样随处可得、随取随用。

后摩智能已启动下一代DRAM-PIM技术研发,通过将计算单元直接嵌入DRAM阵列,使计算与存储的协同更加紧密高效。该技术将突破1TB/s片内带宽,能效较现有水平再提升三倍,推动百亿参数大模型在终端设备普及,让更强大的AI算力融入日常设备。

来源于:https://news.china.com/socialgd/10000169/20250728/48658738.html    如有侵权请联系我们