AMD MI355X

核心事件 Wafer.ai 的最新基准测试显示，智谱 AI 的 GLM5.2 模型在 AMD Instinct MI355X 加速器上实现了单节点 2626 tokens/s 的惊人吞吐量。在同等推理性能下，其部署成本仅为 NVIDIA Blackwell (B200) 架构的一半以上，标志着 AMD 在高端 LLM 推理市场正式具备了颠覆性的竞争力。 ▶ 性能跨越：MI355X 凭借卓越的 HBM3e 内存带宽和容量，在处理 GLM5.2 等长文本、高参数模型时展现出极高的吞吐效率。 ▶ 成本优势：通过对比 TCO（总拥有成本），AMD 方案在单位 Token 成本上比 NVIDIA Blackwell 架构高出 2 倍以上的性价比，直接挑战了绿色阵营的定价权。 ▶ 生态兼容：此次测试证明了 ROCm 软件栈与国产顶尖大模型（智谱 GLM 系列）的深度适配已趋于成熟，打破了 CUDA 的绝对垄断。八卦洞察「八卦智库」认为，这不仅仅是一次跑分胜出，而是 AI 算力从“稀缺溢价”转向“能效竞争”的转折点。长期以来，市场对 AMD 的质疑集中在软件生态和实战性能上，但 GLM5.2 与 MI355X 的结合证明了在特定推理场景下，硬件参数的领先（尤其是内存带宽）可以直接转化为商业上的成本优势。随着 Blackwell 供应受限且价格高企，AMD 正在通过“性价比暴力”撕开超大规模云厂商和头部 AI 实验室的防线。行动建议对于算力需求方，建议立即启动对 AMD MI300/355 系列的兼容性测试，尤其是在推理侧，2 倍的成本缩减意味着商业闭环的难度降低了一半。对于开发者，应关注跨平台内核优化工具（如 Wafer.ai 提供的方案），减少对 CUDA 专有库的依赖，以获取更灵活的硬件议价能力。

智谱GLM5.2在AMD MI355X上跑出2626 tok/s：性价比两倍于Blackwell，算力格局迎来临界点

BAGUA AI