阿里开源新一代通义千问模型Qwen3
发布时间:2025-05-194月29日凌晨,通义千问 Qwen3 正式发布并开源旗下 8 款「混合推理模型」。
此次开源包括两款混合专家(MoE)模型和六款稠密(Dense)模型 ,参数规模从 0.6B 到 235B 不等,尺寸丰富,能适配多种场景。其中,旗舰模型 Qwen3-235B-A22B 在代码、数学、通用能力等基准测试中表现卓越,与顶级模型相比毫不逊色;小型 MoE 模型 Qwen3-30B-A3B,激活参数仅为 QwQ-32B 的 10% ,性能却更胜一筹。
核心亮点
多种思考模式:Qwen3模型支持 “思考” 与 “非思考” 两种模式,用户可按需切换,在复杂问题求解和简单问题快速响应间灵活选择,实现稳定且高效的 “思考预算” 控制。
多语言:Qwen3模型支持 119 种语言和方言,为国际应用开辟了新的可能性。
增强的 Agent 能力:优化了模型的 Agent 和代码能力,加强了对 MCP 的支持,提升了工具调用能力。
目前,全球开发者、研究机构和企业均可免费在魔搭社区、HuggingFace等平台下载模型并商用,也可以通过阿里云百炼调用Qwen3的API服务。个人用户可立即通过通义APP直接体验Qwen3,夸克也即将全线接入Qwen3。
https://mp.weixin.qq.com/s/UZE5T7iyFqbXS05ReouOzw
来源:阿里云