网站首页 | 客观 | 事物 | 迹象 | 描绘 | 笔记 | 历史 | 生活 | 文化 | 名家 | 艺术 | 圈子 | 专题 | 消费 | 房产 | 财经 | 综合 | 商会 | 社会
> 综合 > 正文

阿里巴巴(09988)正式推出其迄今为止规模最大、能力最强的模型 Qwen3-Max 热头条

2025-09-24 12:25:23        来源:新浪网


(资料图片)

智通财经获悉,据通义千问Qwen公众号消息,继 Qwen3-2507 系列发布之后,阿里云通义千问推出其迄今为止规模最大、能力最强的模型—— Qwen3-Max。

目前,Qwen3-Max-Instruct 的预览版在 LMArena 文本排行榜上位列第三,超越了 GPT-5-Chat。正式版本在代码能力和智能体(agent)能力方面进一步提升,在涵盖知识、推理、编程、指令遵循、人类偏好对齐、智能体任务和多语言理解的全面基准测试中均达到业界领先水平。

通义团队表示,Qwen3-Max模型总参数超过1T,预训练使用了36T tokens。模型结构沿用了Qwen3系列的模型结构设计范式,使用了通义提出的global-batch load balancing loss。

此外,Qwen3-Max 的推理增强版本—— Qwen3-Max-Thinking已展现出非凡潜力。通过集成代码解释器并运用并行测试时计算技术,该“思考”版本已在 AIME 25、HMMT 等高难度推理基准测试中取得 100% 的准确率。

责任编辑:栎树

关键词: 财经要闻 实时要闻

上一篇:美股ETF追踪 | 太空概念股强势拉升 2倍做多ASTS ETF涨超24% 鲍威尔称股市估值过高 三倍做多纳指ETF跌逾2%
下一篇:最后一页