智谱GLM5.2在AMD MI355X上跑出2626 tok/s：性价比两倍于Blackwell，算力格局迎来临界点

● PUBLISHED: · SOURCE: HackerNews →

[ DATA_STREAM_START ]

核心事件

Wafer.ai 的最新基准测试显示，智谱 AI 的 GLM5.2 模型在 AMD Instinct MI355X 加速器上实现了单节点 2626 tokens/s 的惊人吞吐量。在同等推理性能下，其部署成本仅为 NVIDIA Blackwell (B200) 架构的一半以上，标志着 AMD 在高端 LLM 推理市场正式具备了颠覆性的竞争力。

▶ 性能跨越：MI355X 凭借卓越的 HBM3e 内存带宽和容量，在处理 GLM5.2 等长文本、高参数模型时展现出极高的吞吐效率。
▶ 成本优势：通过对比 TCO（总拥有成本），AMD 方案在单位 Token 成本上比 NVIDIA Blackwell 架构高出 2 倍以上的性价比，直接挑战了绿色阵营的定价权。
▶ 生态兼容：此次测试证明了 ROCm 软件栈与国产顶尖大模型（智谱 GLM 系列）的深度适配已趋于成熟，打破了 CUDA 的绝对垄断。

八卦洞察

「八卦智库」认为，这不仅仅是一次跑分胜出，而是 AI 算力从“稀缺溢价”转向“能效竞争”的转折点。长期以来，市场对 AMD 的质疑集中在软件生态和实战性能上，但 GLM5.2 与 MI355X 的结合证明了在特定推理场景下，硬件参数的领先（尤其是内存带宽）可以直接转化为商业上的成本优势。随着 Blackwell 供应受限且价格高企，AMD 正在通过“性价比暴力”撕开超大规模云厂商和头部 AI 实验室的防线。