深度求索上下文窗口扩大十倍,智谱同步发布新模型,中国AI竞赛加速

中国的AI大模型竞赛正在加速升温。据《南华早报》报道,中国AI初创公司深度求索(DeepSeek)已对其旗舰模型进行重大升级,显著扩展了上下文窗口并更新了知识库,引发市场对其下一代重磅模型发布的高度期待。
报道称,此次升级将模型的上下文窗口从12.8万token大幅扩展至超过100万token——接近十倍的增长,有望显著增强其处理和回应复杂提示的能力。同时,模型的知识截止时间也从2024年7月延长至2025年5月,新增近一年的信息,使用户能够获取更近期的数据。
不过,据凤凰网科技指出,此次升级并未引入多模态视觉理解能力,模型仍专注于文本和语音交互。
《南华早报》补充称,此次更新正值市场对DeepSeek V4版本猜测不断升温之际,中国各大AI厂商正竞相推出新模型。彭博社进一步透露,阿里巴巴也预计将在未来几周内发布其旗舰模型Qwen-3.5。
中国AI赛道竞争加剧
在此轮密集发布浪潮中,《南华早报》还特别提到,深度求索的升级恰逢中国另一家AI初创公司智谱AI(Zhipu AI)于同日推出其全新旗舰模型。报道称,智谱AI的GLM-5在代码生成和智能体(agentic)能力方面显著增强,这得益于其参数量翻倍,并采用了“深度求索稀疏注意力”(DeepSeek Sparse Attention)技术——该技术旨在兼顾性能与计算效率。
市场反响热烈。据彭博社报道,智谱AI本周已将其GLM编程套餐价格上调30%,以应对激增的需求。《上海证券报》指出,此前中国本土大模型厂商主要依靠价格竞争,而此次智谱的提价表明,国产大模型在技术实力和市场竞争力方面已取得明显进步。
此外,据IT之家报道,GLM-5还针对多种国产计算平台进行了深度推理兼容性优化,包括华为昇腾(Ascend)、摩尔线程(Moore Threads)、寒武纪(Cambricon)、昆仑芯(Kunlunxin)和沐曦(MetaX)。这种广泛的硬件适配预计将支持模型在日益多元化的国产计算环境中高效部署。
竞争不仅限于文本模型。彭博社还指出,字节跳动(TikTok母公司)即将推出的视频生成模型Seedance 2.0也广受好评。该模型目前仍在测试阶段,被定位为OpenAI Sora的竞争对手,其一系列惊艳的演示视频已在网络上广泛传播。
加入微信
获取电子行业最新资讯
搜索微信公众号:EEPW
或用微信扫描左侧二维码
