Apple MLX

核心摘要 Pluralis Research 近期发布了一项突破性实验，成功在分布于 4 个国家的 14 台消费级 Mac 电脑上运行强化学习（RL）采样队列，并配合远在另一大洲的单台 B200 GPU 完成核心训练任务。该项目利用 Apple 的 MLX 框架进行 int8 量化推理，证明了利用全球分布式、异构消费级硬件进行大规模 RL 后训练的技术可行性。 ▶ 采样与训练解耦： RL 训练的瓶颈往往在于海量的采样生成。该实验通过将采样任务（Rollouts）分发至全球各地的 Mac 节点，极大缓解了对中心化算力集群的依赖。 ▶ Apple Silicon 潜力释放：利用 MLX 框架的高效内存带宽优势，消费级 Mac 成为极佳的推理节点，int8 量化在保证精度的同时显著降低了跨国数据传输的带宽压力。 ▶ 去中心化 AI 基础设施：这一实践为“算力贫民”提供了新思路，展示了如何通过高效的编排系统，将零散的边缘算力转化为生产力级的大模型微调集群。八卦洞察这并非简单的极客实验，而是对 AI 算力霸权的一次有力“解构”。长期以来，RL 训练被认为是顶级实验室的特权，因为其需要极高的采样吞吐量。Pluralis Research 的成功在于抓住了 RL 算法中“采样任务天然可并行”的特性。即便跨国延迟存在，只要采样队列足够大，异步更新机制就能抹平网络波动。这预示着未来 AI 基础设施将从“昂贵的单体架构”向“弹性的全球分布式架构”演进。对于拥有大量闲置 Mac 设备的机构而言，这无异于发现了一座未开采的算力矿山。行动建议 1. 技术架构转型：建议正在进行大模型后训练的团队探索“边缘采样 + 云端梯度更新”的混合架构，以降低 H100/B200 的租赁成本。2. 关注 MLX 生态：开发者应深度集成 Apple MLX 框架，利用其统一内存架构（Unified Memory）处理超大上下文采样。3. 布局分布式编排：投资或研发针对弱网络环境下的分布式推理编排工具，这将是未来去中心化算力网络的核心壁垒。

跨越四大洲：Pluralis Research 实现首个基于消费级 Mac 集群的分布式强化学习后训练

八卦情报｜Apple 发布 MLX LM Server：M5 加速与 Thunderbolt 分布式推理重塑本地 AI 生态

BAGUA AI