blog
2026-06-02

JetBrains 开源 Mellum2 模型:12B 参数,升级为 AI 智能体编程助手

感谢IT之家网友 有鲫雪狐 的线索投递!

IT之家 6 月 2 日消息,JetBrains 昨日(6 月 1 日)发布博文,宣布开源 Mellum2 模型,这是面向软件工程系统的新机器学习模型。

官方表示相比原版 Mellum,它从代码补全模型升级为完整编码助手,并把上下文窗口从 8192 Token 扩到 131072 Token。开发者可在 Apache 2.0 许可证下部署基础版、指令版和思考版。

参数上,Mellum2 总规模为 12B,高于 Mellum 的 4B。该模型采用稀疏 Mixture-of-Experts(混合专家)框架,激活时参数量为 2.5B,在标准硬件上仍能保持较快计算。

能力方面,Mellum2 可生成和编辑代码、调用外部工具、执行多步骤 Agentic(智能体式)工作流、维持长对话。

JetBrains 将 Mellum2 定位在 AI 工作负载路由与编排、低延迟 RAG(检索增强生成)管线、复杂工作流中的快速 Sub-agent(子智能体),以及私有本地 AI 部署。

训练方面,团队称预训练阶段采用三阶段数据课程。数据混合逐步从多样化网页内容,转向精选代码和数学内容,从而让模型更贴近软件工程任务。

IT之家附上参考地址

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。

来源于:https://www.ithome.com/0/958/658.htm    如有侵权请联系我们