界面新闻记者 |
界面新闻编辑 | 文姝琪
在2025云栖大会上,通义系列模型一口气发布7款模型的更新,其在智能水平、Agent工具调用和Coding能力、深度推理、多模态等方面实现多项突破。
今年以来,通义系列模型已经不只一次连续发布多款模型的更新。今年7月,通义系列模型也连续发布Qwen-Plus、Qwen3-Coder、通义万相2.2系列等多款模型。相较于去年,通义系列模型更新迭代的速度明显加快。
9月25日,阿里云CTO周靖人在2025云栖大会上接受界面新闻等媒体采访时,详细解释了背后的原因。在他看来,AI模型的发展已经从突破期进入加速期,今天大家比拼的不仅仅是单个几款模型的能力,更重要的是能够快速迭代创新。
从全球来看,OpenAI、Anthropic、谷歌等科技公司的大模型迭代速度也在加快。Gartner近日发布的报告也将快速创新和迭代作为今年全球大模型发展的五大趋势之一。Gartner高级首席分析师费天祺对界面新闻表示,开源开放的环境更能够激发和加速模型的迭代。

目前,通义千问对外发布了300多款模型。无论在国内市场还是全球市场,其都是一个不容忽视的存在。近日,Qwen3的四款模型还在Amazon Bedrock上线,通过亚马逊云科技向全球企业和开发者提供服务。
周靖人表示,今天模型之间的竞争,也是系统的竞争;今天云的竞争,也是模型的竞争。两者是密不可分的。“阿里云是全球少数几家在大模型和云计算方面都能够做到全栈自研和联合创新的云计算公司,这是阿里云的一个优势,也是阿里云能够在AI云上保持领先的关键。”
在2025云栖大会上,阿里云除了发布模型的更新之外,还公布了全新升级的AI基础设施,涉及从底层芯片、超节点服务器、高性能网络、分布式存储、智算集群到人工智能平台、模型训练推理服务的全栈AI技术能力。其中,绝大部分技术能力均为阿里自研。
周靖人在采访中也解释了阿里云在AI上进行全栈式布局的原因。他表示,当AI进入比拼创新速度的时代,其背后已经不单单是模型本身的创新,而是一个更大的系统工程。“这需要和系统、数据、分布式的训练推理以及训练框架密切结合。”
外界的感知是通义千问在短时间内不断发布各类模型的更新升级。而在阿里云内部,这些迭代升级工作是按照优先级进行了一系列的规划,齐头并进展开研发。阿里云对通义系列模型的目标也非常明确:希望在AI编程、视觉理解等各个单项都做到极致,否则模型能力的提升会很快遭遇瓶颈。
周靖人透露,阿里云内部对所有技术工作的评价体系主要是能力,其中也包括模型的能力。目前,通义千问、万相等模型都建立起来较为完整的技术评价体系,这也是模型能够持续演进和发展的基础。
在2025云栖大会上,通义千问除了发布大语言模型、AI编程模型、多模态模型的更新之外,还发布了下一代基础模型架构Qwen3-Next及系列模型。Qwen3-Next的总参数80B仅激活3B ,性能即可媲美千问3旗舰版235B模型,实现模型计算效率的突破。这是因为创新改进采用了混合注意力机制、高稀疏度MoE结构、多token预测(MTP)机制等核心技术,让模型训练成本较密集模型Qwen3-32B大降超90%。
周靖人表示,通义千问正在积极进行下一代模型的研发,Qwen3-Next是其中之一。一旦这些创新的架构推出来,整个模型社区都会围绕新的架构进行适配、进行相关的尝试。
“模型的发展是一个循序渐进的,不是憋大招的逻辑。”周靖人表示,有的时候需要在单模态一个具体任务的场景里做到最优,才能提高一个整体模型的能力。所有模型的发布,都不是一个单一的项目,是整体通义整个大模型演进联合优化的一部分。