GLM-5.2震撼发布：753B参数开源巨兽挑战Claude，主打百万级长周期编码任务

圈小蛙

2 months ago

在全球开发者对大模型处理复杂、跨文件编码任务需求日益迫切的背景下，Z.ai 终于交出了其年度答卷。近日，Z.ai 团队正式宣布推出最新的旗舰级开源大模型——GLM-5.2。这款拥有 753B（7530亿）庞大参数规模的模型，不仅是 Z.ai 研发序列中的巅峰之作，更通过对“长周期任务”（Long-cycle Tasks）的极致优化，试图打破开源模型在超长上下文处理中的“能力幻觉”。

长周期任务：100 万 Token 的可靠交付

传统的代码助手在处理几百行代码时表现出色，但在面对需要跨越几十个文件、逻辑链条极长的复杂工程时往往显得力不从心。根据 Z.ai 官方博客的技术说明，GLM-5.2 首次实现了在 100 万 token 的超长上下文中可靠地交付复杂编码能力。这意味着开发者可以将整个代码库的文档、历史提交记录及核心代码逻辑同时喂给模型，而 GLM-5.2 能够在全局视角下精准地定位 bug 并重构复杂模块。

在衡量实际工程解决能力的 SWE-bench Pro 以及专注于终端指令执行的 Terminal-Bench 2.1 等权威基准测试中，GLM-5.2 均展现出了代际跨越式的优势。特别是在极具挑战性的 FrontierSWE 长周期测试中，GLM-5.2 仅以不到一个百分点的微弱差距落后于 Claude Opus 4.8。而在业界公认的 Arena 竞技场前端榜单（Code Arena）中，GLM-5.2(Max) 更是高居全球第二，仅次于目前最强的闭源代码模型 Fable 5，稳坐开源界头把交椅。

创新机制：思考努力度的灵活调节

除了硬核的性能提升，GLM-5.2 还在用户体验上引入了“思考努力度”的概念。在 Z.ai 官方平台及配套的 Coding Plan 服务中，用户可以根据任务的难易程度，自主调整模型的思考强度。对于简单的单元测试生成，模型可以快速响应；而对于涉及系统架构设计的深层任务，用户可以调高“努力度”，让模型进行更长时间的逻辑推演。

与之配套的还有一套精细的配额方案：在高峰时段，高强度思考将消耗 3 倍配额，非高峰时段则为 2 倍。值得一提的是，Z.ai 为了回馈社区，宣布在今年九月之前，非高峰时段的使用将享受 1 倍配额的特别优惠。这种灵活的资源分配方式，为企业和个人开发者在高强度开发周期中提供了极具性价比的选择。

拥抱开源：HuggingFace 与 ModelScope 全线同步

在追求性能突破的同时，Z.ai 依然坚定履行其开源承诺。目前，GLM-5.2 的模型权重已经同步上传至 HuggingFace 以及国内的 ModelScope 魔搭社区。开发者可以根据自身硬件条件，选择部署完整版或经过量化处理的轻量化版本。

业内分析人士指出，753B 的参数规模意味着 GLM-5.2 在处理多语言逻辑、系统级联调以及跨领域知识整合方面具有天然优势。随着 GLM-5.2 的开源，预计将有一大批针对特定行业优化的长周期 AI 助手在未来几个月内涌现，从而彻底改变软件开发的协作模式。

本报道由圈小蛙（qxwa.com）科技资讯站特约撰稿。🐸️