本文作者:adminddos

通义系列模型迭代加快,阿里云CTO周靖人详解背后原因

adminddos 2025-09-25 23:32:02 1
通义系列模型迭代加快,阿里云CTO周靖人详解背后原因摘要: ...

界面新闻记者 | 肖芳

界面新闻编辑 | 文姝琪

在2025云栖大会上,通义系列模型一口气发布7款模型的更新,其在智能水平、Agent工具调用和Coding能力、深度推理、多模态等方面实现多项突破。

今年以来,通义系列模型已经不只一次连续发布多款模型的更新。今年7月,通义系列模型也连续发布Qwen-Plus、Qwen3-Coder、通义万相2.2系列等多款模型。相较于去年,通义系列模型更新迭代的速度明显加快。

9月25日,阿里云CTO周靖人在2025云栖大会上接受界面新闻等媒体采访时,详细解释了背后的原因。在他看来,AI模型的发展已经从突破期进入加速期,今天大家比拼的不仅仅是单个几款模型的能力,更重要的是能够快速迭代创新。

从全球来看,OpenAI、Anthropic、谷歌等科技公司的大模型迭代速度也在加快。Gartner近日发布的报告也将快速创新和迭代作为今年全球大模型发展的五大趋势之一。Gartner高级首席分析师费天祺对界面新闻表示,开源开放的环境更能够激发和加速模型的迭代。

图片来源:通义千问

目前,通义千问对外发布了300多款模型。无论在国内市场还是全球市场,其都是一个不容忽视的存在。近日,Qwen3的四款模型还在Amazon Bedrock上线通过亚马逊云科技全球企业开发者提供服务

周靖人表示今天模型之间的竞争,也是系统的竞争;今天云的竞争,也是模型的竞争两者密不可分阿里云是全球少数几家在大模型和云计算方面都能够做到全栈自研联合创新的云计算公司这是阿里云的一个优势也是阿里云能够AI保持领先关键

2025云栖大会上阿里云除了发布模型更新之外公布全新升级AI基础设施涉及从底层芯片、超节点服务器、高性能网络、分布式存储、智算集群到人工智能平台、模型训练推理服务全栈AI技术能力其中绝大部分技术能力阿里自研

周靖人采访解释阿里AI进行全栈布局原因表示AI进入比拼创新速度时代背后已经不单单模型本身创新而是一个系统工程这需要系统数据分布式的训练推理以及训练框架密切结合

外界感知通义千问短时间不断发布各类模型更新升级。而在阿里云内部这些迭代升级工作按照优先级进行一系列规划,齐头并进展开研发阿里云通义系列模型目标非常明确希望AI编程视觉理解各个单项做到极致否则模型能力提升很快遭遇瓶颈

周靖人透露阿里云内部所有技术工作评价体系主要能力其中包括模型能力目前通义千问、万相等模型建立起来较为完整技术评价体系这也是模型能够持续演进发展基础

2025云栖大会通义千问除了发布大语言模型AI编程模型多模态模型更新之外发布下一代基础模型架构Qwen3-Next及系列模型Qwen3-Next总参数80B仅激活3B ,性能即可媲美千问3旗舰版235B模型实现模型计算效率突破这是因为创新改进采用了混合注意力机制、高稀疏度MoE结构、多token预测(MTP)机制等核心技术,让模型训练成本较密集模型Qwen3-32B大降超90%

周靖人表示通义千问正在积极进行下一代模型研发Qwen3-Next其中之一一旦这些创新架构推出整个模型社区围绕新的架构进行适配、进行相关的尝试。

模型的发展是一个循序渐进的,不是憋大招的逻辑。周靖人表示有的时候需要在单模态一个具体任务的场景里做到最优,才能提高一个整体模型的能力。所有模型的发布,都不是一个单一项目是整体通义整个大模型演进联合优化的一部分

阅读
分享