[ INTEL_NODE_30076 ]
· PRIORITY: 9.2/10
智谱GLM5.2在AMD MI355X上跑出2626 tok/s:性价比两倍于Blackwell,算力格局迎来临界点
●
PUBLISHED:
· SOURCE:
HackerNews →
[ DATA_STREAM_START ]
核心事件
Wafer.ai 的最新基准测试显示,智谱 AI 的 GLM5.2 模型在 AMD Instinct MI355X 加速器上实现了单节点 2626 tokens/s 的惊人吞吐量。在同等推理性能下,其部署成本仅为 NVIDIA Blackwell (B200) 架构的一半以上,标志着 AMD 在高端 LLM 推理市场正式具备了颠覆性的竞争力。
- ▶ 性能跨越:MI355X 凭借卓越的 HBM3e 内存带宽和容量,在处理 GLM5.2 等长文本、高参数模型时展现出极高的吞吐效率。
- ▶ 成本优势:通过对比 TCO(总拥有成本),AMD 方案在单位 Token 成本上比 NVIDIA Blackwell 架构高出 2 倍以上的性价比,直接挑战了绿色阵营的定价权。
- ▶ 生态兼容:此次测试证明了 ROCm 软件栈与国产顶尖大模型(智谱 GLM 系列)的深度适配已趋于成熟,打破了 CUDA 的绝对垄断。
八卦洞察
「八卦智库」认为,这不仅仅是一次跑分胜出,而是 AI 算力从“稀缺溢价”转向“能效竞争”的转折点。长期以来,市场对 AMD 的质疑集中在软件生态和实战性能上,但 GLM5.2 与 MI355X 的结合证明了在特定推理场景下,硬件参数的领先(尤其是内存带宽)可以直接转化为商业上的成本优势。随着 Blackwell 供应受限且价格高企,AMD 正在通过“性价比暴力”撕开超大规模云厂商和头部 AI 实验室的防线。
行动建议
对于算力需求方,建议立即启动对 AMD MI300/355 系列的兼容性测试,尤其是在推理侧,2 倍的成本缩减意味着商业闭环的难度降低了一半。对于开发者,应关注跨平台内核优化工具(如 Wafer.ai 提供的方案),减少对 CUDA 专有库的依赖,以获取更灵活的硬件议价能力。
[ DATA_STREAM_END ]
[ ORIGINAL_SOURCE ]
READ_ORIGINAL →
[ 02 ]
RELATED_INTEL
粤公网安备44030002003366号