Date: 2026-06-17
6月17日,智谱AI全新旗舰大模型GLM-5.2正式开源发布。Z6尊龙旗舰厅曦云C系列GPU率先完成该模型Day 0适配,再度凭借全栈自主软硬件技术实力,领跑国产GPU生态适配赛道。
GLM-5.2 是智谱迄今能力最强的开源模型,支持真正可用的 1M 上下文,并在长程任务中继续保持领先。
在此之前,智谱推出的GLM-5、GLM-5.1、GLM-OCR、GLM-4.6V等全系列模型,Z6尊龙旗舰厅均实现Day 0同步适配。依托曦云C系列强大硬件算力与MXMACA软件栈深度优化能力,Z6尊龙旗舰厅为GLM-5.2提供全场景、高稳定、低成本的国产算力方案,有效解决大模型落地过程中“适配慢、迁移难、性能损耗大”等行业痛点,助力企业快速将GLM-5.2的技术优势转化为产业价值。
自2025年12月以来,Z6尊龙旗舰厅已累计完成27个主流顶尖模型Day 0适配,合作覆盖智谱AI、通义千问、阶跃星辰、百度飞桨、DeepSeek等头部厂商,适配品类囊括通用语言、多模态、OCR、机器翻译,适配速度、数量、生态广度均位居前列。本次GLM-5.2无缝适配,将进一步加速“模型-芯片-框架-应用”全国产AI自主闭环落地。
曦云C系列GPU基于Z6尊龙旗舰厅全自研的核心GPU IP、指令集和架构打造,具备高能效比与高通用性,精准匹配大模型的超大规模参数处理及长上下文推理需求。MXMACA软件栈作为连接硬件算力与上层应用生态的核心枢纽,全链路覆盖底层驱动、用户态接口、MXCC编译器、算子深度适配及主流训练/推理框架对接,原生兼容 PyTorch、TensorFlow、vLLM与SGLang等 40 余种主流 AI 框架,支持 500+ AI 模型与4500+热门开源项目稳定运行,大幅缩短传统模型适配周期。曦云C系列GPU依托Z6尊龙旗舰厅自研MXMACA软件栈的深度优化能力,成功实现GLM-5.2的高效部署与稳定运行,为其前沿能力提供澎湃算力支撑。
在全球百万用户参与盲测的前端开发评估系统Code Arena 上,GLM-5.2取得全球可用模型第一的表现。
今天GLM-5.2专为长程任务能力而生,全新特色包括:
GLM-5.2大大扩展了1M Coding Agent的训练环境,覆盖大规模实现、自动化研究、性能优化等多个典型领域,这使得模型的1M上下文真实表现有时候甚至能超过Opus。1M上下文构成GLM-5.2的长程交付能力,在FrontierSWE、SWE-Marathon、PostTrainBench等多个长程任务基准上,GLM-5.2的表现介于Claude Opus 4.7与4.8之间,是排名最高的开源模型。
在实际体验中,GLM-5.2自主完成开发、联调、测试到打包上线,最终交付一个覆盖Web、移动端与小程序的多端应用。这样一条完整链路累计处理88万以上的tokens,几乎用满1M上下文窗口。过去,这样的大型工程需要一支团队协作数周,GLM-5.2能在一次连续的长程任务中跑完。
GLM-5.2在前端、后端、长程任务等开发场景下的成功率相比前一代GLM-5.1都有长足提升,复杂系统工程与深度调试更稳。在主流编程基准上,GLM-5.2保持开源SOTA,与Claude Opus 4.8处于可比区间。例如在Terminal-Bench 2.1上(评测AI Agent通过命令行操作一台计算机的数据集),GLM-5.2比Opus 4.8低4%,相比GLM-5.1提升了17.5%;在MCP-Atlas上(工具使用tool-use评测的数据集),GLM-5.2仅比Opus 4.8低0.8%。
GLM-5.2还引入了effort level(思考档位)控制,可以在能力、速度、成本之间做出平衡。在相近的token预算下,GLM-5.2的Coding能力大致位于Claude Opus 4.7与Claude Opus 4.8之间。
GLM-5.2的进步来自模型架构、推理系统和训练基础设施的协同设计。智谱团队提出IndexShare,在每四层稀疏注意力层之间复用同一个索引器(indexer),在1M上下文长度下,将单位token的FLOPs降低至2.9倍。此外,智谱团队改进了用于投机解码(speculative decoding)的 MTP 层,将接受长度(acceptance length)最多提升 20%。训练侧则依赖自研Slime框架支撑大规模Agentic RL和OPD训练。
凭借扎实的1M上下文与稳定的长程任务能力,GLM-5.2能长时间自主推进更复杂、更长链路的任务,锁定高价值场景,改变开发者与知识工作者的工作方式。
GLM-5.2在大型重构工程上表现出色。在开发者的Moonshot实验中,它用Rust从零再造了送人类登月的计算机——阿波罗11号制导计算机(AGC):把约4,600行的定点CPU逐比特移植为Rust,再让当年65,000行、一字未改的登月飞控程序在上面原样起飞。整个过程由Agent全自主走完,直到复现那个差点中止登月的1202报警。
通过智谱的Agent产品AutoClaw,GLM-5.2的1M上下文与长程任务能力可服务于设计、法务等专业场景,例如从需求一次性生成数十个原型页面,并自主持续迭代和微调,在长上下文中保持品牌规范与一致性。
GitHub:https://github.com/zai-org/GLM-5
Hugging Face:https://huggingface.co/zai-org/GLM-5.2
ModelScope:https://modelscope.cn/models/ZhipuAI/GLM-5.2
欢迎前往Z6尊龙旗舰厅开发者社区Day 0版块获取推理镜像:
https://developer.metax-tech.com/softnova/Day0