阿里巴巴集团CEO吴泳铭在 2 月 20 日的财报会上透露，阿里将于近期发布基于Qwen2.5-Max 的深度推理模型

一个小站的自留地

阿里云发布 Qwen2.5-Max 模型，称其性能超越 DeepSeek V3 和 GPT-4o 阿里云于 2025 年 1 月 29 日推出 Qwen2.5-Max 大语言模型，该模型基于混合专家架构（Mixture-of-Experts, MoE），参数规模超 200 亿，训练数据量达 20 万亿词元。据官方基准测试显示，Qwen2.5-Max 在 Arena-Hard（89.4）、LiveBench（62.2）等 5 项核心指标上均超越 DeepSeek V3 和 GPT-4o，其中数学推理能力（GSM8K…

阿里巴巴集团CEO吴泳铭在 2 月 20 日的财报会上透露，阿里将于近期发布基于Qwen2.5-Max 的深度推理模型。

Qwen2.5-Max 是阿里云于 1 月 29 日推出的最新 MoE 基座模型，各项能力指标表现突出，超越 DeepSeek-V3 和 GPT-4o。基于 Qwen2.5-Max 的推理模型预计也将拥有不俗的性能。