
刚刚,Qwen3迎来惊喜升级![庆祝][庆祝][庆祝]
通义千问更新了旗舰版Qwen3模型,推出Qwen3-235B-A22B-FP8非思考模式(Non-thinking)的更新版本,命名为:
Qwen3-235B-A22B-Instruct-2507-FP8。
新的Qwen3模型,通用能力显著提升,包括指令遵循、逻辑推理、文本理解、数学、科学、编程及工具使用等方面。
在GQPA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等众多测评中表现出色,超过Kimi-K2、DeepSeek-V3等顶级开源模型以及Claude-Opus4-Non-thinking等领先闭源模型。
此外,刚刚更新的Qwen3模型,还增强了以下关键性能:
· 在多语言的长尾知识覆盖方面,模型取得显著进步。
· 在主观及开放性任务中,模型显著增强了对用户偏好的契合能力,能够提供更有用的回复,生成更高质量的文本。
· 长文本提升到256K,上下文理解能力进一步增强。
为获得最佳性能,阿里也贴心地为大家准备了推荐配置:
· 采样参数:Temperature=0.7、TopP=0.8、TopK=20、MinP=0 · 合适的输出长度:输出长度为16,384Token,这对于指令模型来说已经足够
· 规范输出格式:
数学问题:在提示词中加入「请一步一步推理,并将最终答案放入\x5cboxed{}中。」
多项选择题:在提示词中添加以下JSON结构以规范回复格式:「请在answer字段中仅填写选项字母,例如:"answer": "C"。」
注意:此模型仅支持非思考模式,在输出中不会生成块。同时,不再需要指定enable_thinking=False。
目前,Qwen3新模型已在魔搭社区和Hugging Face上开源:
https://huggingface.co/Qwen/Qwen3-235B-A22B-Instruct-2507-FP8
猜你喜欢

以蚊治蚊:广州释放“绝育雄蚊”对抗基孔肯...
IT之家 8 月 9 日消息,近期,由白纹伊蚊传播的基孔肯雅病毒在多地点状散发。防控基孔肯雅热,关键在于防蚊和灭蚊。大众防蚊意识的提高助推相关业态和产品发展。 ...
READ MORE
江西“星火一号”项目计划 2029 年年...
IT之家 8 月 9 日消息,江西聚变新能源有限责任公司昨日宣布,旗下投资建设的“星火一号”一期项目落户南昌市瑶湖科学岛,计划 2029 年年底完成装置建设,2...
READ MORE
炸!卡戴珊自曝打禁疗“神针”,称打完立刻...
【木唠唠杂货铺直播间】开张了!!! 新疆当地牧场的纯牛奶,让你夏天闪亮的沙棘汁,嘎嘎香香的奶酪包,还有甜到你心坎里的哈密瓜...... 这次直播不仅要和大家分享...
READ MORE

最新发布
-
以蚊治蚊:广州释放“绝育雄蚊”对抗基孔肯雅热,周产 500 ...
综合新闻, 2025-08-09 -
江西“星火一号”项目计划 2029 年年底完成装置建设:采用...
综合新闻, 2025-08-09 -
炸!卡戴珊自曝打禁疗“神针”,称打完立刻恢复性感身材?网友:...
综合新闻, 2025-08-09 -
爆发冲突!东契奇减肥后赛场首秀!状态有点…
综合新闻, 2025-08-09 -
突发,拒绝杜兰特!火箭不给顶薪续约!年薪6000万
综合新闻, 2025-08-09
热门
-
以蚊治蚊:广州释放“绝育雄蚊”对抗基孔肯...
- 作者
- 2025-08-09
-
江西“星火一号”项目计划 2029 年年...
- 作者
- 2025-08-09
-
炸!卡戴珊自曝打禁疗“神针”,称打完立刻...
- 作者
- 2025-08-09
-
爆发冲突!东契奇减肥后赛场首秀!状态有点...
- 作者
- 2025-08-09
-
突发,拒绝杜兰特!火箭不给顶薪续约!年薪...
- 作者
- 2025-08-09
-
以蚊治蚊:广州释放“绝育雄蚊”对抗基孔肯...
- 作者
- 2025-08-09
-
江西“星火一号”项目计划 2029 年年...
- 作者
- 2025-08-09
-
炸!卡戴珊自曝打禁疗“神针”,称打完立刻...
- 作者
- 2025-08-09
-
爆发冲突!东契奇减肥后赛场首秀!状态有点...
- 作者
- 2025-08-09
-
突发,拒绝杜兰特!火箭不给顶薪续约!年薪...
- 作者
- 2025-08-09