中国加码AI竞赛:阿里最新千问模型逼近美国对手,月之暗面持续突破

在DeepSeek震撼全球AI行业近一年后,中国大模型开发者正加速推出新一代模型。据《南华早报》报道,阿里巴巴和月之暗面(Moonshot AI)近日均发布了全新旗舰AI模型,进一步缩小与OpenAI、Google DeepMind等美国领先企业的差距。报道称,阿里巴巴称其Qwen3-Max-Thinking为“迄今最强模型”,而月之暗面则宣称Kimi K2.5是“全球最强大的开源模型”。
阿里千问3系列推万亿参数旗舰模型
阿里云近期发布了迄今为止规模最大的模型——Qwen3-Max-Thinking,强调其具备更强的“智能体”(agentic)能力。该模型现已通过阿里云服务平台及通义千问聊天网站上线。公司表示,内部测试显示,该模型在19项基准测试中表现“与美国顶尖模型相当”,包括Anthropic的Claude Opus 4.5和Google DeepMind的Gemini 3 Pro。
据报告,Qwen3-Max-Thinking是Qwen3系列的最新成员。该系列于2024年5月首次发布,初始模型参数规模从6亿到2350亿不等,此后已扩展至超万亿参数版本。
不过,报道也指出,部分用户对新模型未开源表示失望。尽管通义千问(Qwen)是全球最受欢迎的开源模型家族之一,但阿里目前仍将最大规模的“Max”系列模型保持闭源,仅用于驱动其“通义app”产品。
月之暗面与智谱同步推出新旗舰模型
除阿里外,其投资的初创公司月之暗面(Moonshot AI)也推出了Kimi K2.5。据彭博社报道,该版本可基于单条提示同时处理文本、图像和视频,顺应了OpenAI和谷歌母公司Alphabet所引领的“多模态全能模型”(omni-model)趋势。此外,月之暗面还推出了一款自动化编程工具,旨在与Anthropic的Claude Code竞争。
另据彭博社消息,智谱AI(Zhipu)于今年1月发布了其图像生成模型GLM-Image,并称这是中国首个完全基于国产芯片训练而成的图像生成模型。
扩张雄心遭遇算力瓶颈
《南华早报》指出,月之暗面与千问团队均信奉“AI缩放定律”(scaling laws)——即认为扩大算力与数据规模能持续带来性能提升。为此,千问团队在2024年9月发布的路线图中明确表示,计划将模型规模扩展至10万亿参数以上,以追赶已在类似量级研发的美国同行。
然而,报道也提到,千问团队负责人林俊洋(Lin Junyang)在一次行业活动上坦言,算力资源紧张仍是关键挑战。当前大量计算资源被用于日常业务交付,难以充分投入前沿研发,制约了模型迭代速度。
这一矛盾凸显了中国AI企业在追求技术突破的同时,仍需克服基础设施与资源分配的现实瓶颈。
加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码
