blog
2025-12-18

罗福莉加入小米后首秀,解释MiMo-V2-Flash模型如何做到推理速度飞快 极致效率设计

12月17日,2025小米人车家全生态合作伙伴大会召开,Xiaomi MiMo大模型负责人罗福莉首次亮相。此前一天晚上,小米发布了Xiaomi MiMo-V2-Flash开源MoE模型,总参数量达到309B,活跃参数量为15B,专为智能体AI设计,以快速推理著称。不少用户体验后反馈,该模型的推理速度非常快。

罗福莉加入小米后首秀,解释MiMo-V2-Flash模型如何做到推理速度飞快

罗福莉解释说,MiMo-V2-Flash在设计时特别注重极致推理效率,通过三层MTP推理加速并行Token验证,实现了2.0至2.6倍的速度提升。这款模型不仅在代码和Agent评测基准上位列全球开源模型第二,还初步具备了模拟世界的能力,比如可以编写操作系统、模拟太阳系以及绘制圣诞树等。

罗福莉加入小米后首秀,解释MiMo-V2-Flash模型如何做到推理速度飞快 极致效率设计

罗福莉还展望了下一代智能体系统的发展方向,她认为未来的智能体将不仅仅是一个“语言模拟器”,而是一个能够真正理解并与世界共存的“智能体”。

罗福莉加入小米后首秀,解释MiMo-V2-Flash模型如何做到推理速度飞快 极致效率设计

罗福莉加入小米后首秀,解释MiMo-V2-Flash模型如何做到推理速度飞快 极致效率设计

来源于:https://news.china.com/socialgd/10000169/20251218/49084239.html    如有侵权请联系我们