[ DATA_STREAM: AMD-MI355X ]

AMD MI355X

SCORE
9.2

智谱GLM5.2在AMD MI355X上跑出2626 tok/s:性价比两倍于Blackwell,算力格局迎来临界点

TIMESTAMP // 7 月.04
#AMD MI355X #Blackwell #大模型推理 #智谱AI #算力性价比

核心事件 Wafer.ai 的最新基准测试显示,智谱 AI 的 GLM5.2 模型在 AMD Instinct MI355X 加速器上实现了单节点 2626 tokens/s 的惊人吞吐量。在同等推理性能下,其部署成本仅为 NVIDIA Blackwell (B200) 架构的一半以上,标志着 AMD 在高端 LLM 推理市场正式具备了颠覆性的竞争力。 ▶ 性能跨越:MI355X 凭借卓越的 HBM3e 内存带宽和容量,在处理 GLM5.2 等长文本、高参数模型时展现出极高的吞吐效率。 ▶ 成本优势:通过对比 TCO(总拥有成本),AMD 方案在单位 Token 成本上比 NVIDIA Blackwell 架构高出 2 倍以上的性价比,直接挑战了绿色阵营的定价权。 ▶ 生态兼容:此次测试证明了 ROCm 软件栈与国产顶尖大模型(智谱 GLM 系列)的深度适配已趋于成熟,打破了 CUDA 的绝对垄断。 八卦洞察 「八卦智库」认为,这不仅仅是一次跑分胜出,而是 AI 算力从“稀缺溢价”转向“能效竞争”的转折点。长期以来,市场对 AMD 的质疑集中在软件生态和实战性能上,但 GLM5.2 与 MI355X 的结合证明了在特定推理场景下,硬件参数的领先(尤其是内存带宽)可以直接转化为商业上的成本优势。随着 Blackwell 供应受限且价格高企,AMD 正在通过“性价比暴力”撕开超大规模云厂商和头部 AI 实验室的防线。 行动建议 对于算力需求方,建议立即启动对 AMD MI300/355 系列的兼容性测试,尤其是在推理侧,2 倍的成本缩减意味着商业闭环的难度降低了一半。对于开发者,应关注跨平台内核优化工具(如 Wafer.ai 提供的方案),减少对 CUDA 专有库的依赖,以获取更灵活的硬件议价能力。

SOURCE: HACKERNEWS // UPLINK_STABLE