Agentic AI

如果你关注开源大模型的格局变化，这两天应该已经看到消息了：智谱 AI（Z.ai）的 GLM-5.2 在 Artificial Analysis Intelligence Index v4.1 上拿到 51 分，成为当前得分最高的开源权重模型。875 分的 HN 热度也说明社区对此的关注度不低。但"登顶基准榜"这件事本身并不稀缺——每隔几周就有新模型刷一波排名。真正值得拆解的问题是：GLM-5.2 做对了什么，让它在 Agent 场景下同时跑赢了 DeepSeek V4 Pro 和 MiniMax-M3？先看基本面 GLM-5.2 是一个 753B 总参数的 MoE（混合专家）模型，每次推理激活约 40B 参数。和它的前身 GLM-5.1 参数规模完全相同，但在 Intelligence Index 上高出 11 分。架构代号叫 glm_moe_dsa——DSA 即 DeepSeek Sparse Attention，一种轻量级的稀疏注意力方案。许可证是 MIT，没有地区限制，没有技术访问门槛。这一点在当前中美 AI 竞争的语境下值得单独提一句：很多"开源"模型在许可证或访问上藏着条件，GLM-5.2 没有。在 HuggingFace 上，zai-org/GLM-5.2 和 zai-org/GLM-5.2-FP8 都可下载。FP8 版本已经累计近 2.5 万次下载，社区里的 GGUF 量化版本也在快速跟进——这说明实际有人在跑这个模型，不只是看个热闹。 IndexShare：GLM-5.2 的真正技术突破如果你只看 benchmark 数字，会觉得 GLM-5.2 只是"分数更高了"。但仔细看技术细节，它的核心创新在于 IndexShare（arxiv:2603.12201）。问题出在长上下文场景。DSA 的思路是用一个轻量级 indexer 为每个 query 选择 top-k 最相关的 token，把核心注意力的复杂度从 O(L²) 降到 O(Lk)。但 indexer 本身仍然是 O(L²) 的——上下文越长，indexer 的计算开销越大，成为瓶颈。 ...