Ornith-1.0：开启“自我脚手架”时代，DeepReinforce 重新定义开源编程智能

● PUBLISHED: · SOURCE: Simon Willison Blog →

[ DATA_STREAM_START ]

事件核心

DeepReinforce 正式发布了 Ornith-1.0，这是一系列专为“智能体编程”（Agentic Coding）设计的开源大模型。该系列涵盖了从 9B、31B 的稠密版本到 35B、397B 的混合专家模型（MoE）版本。Ornith-1.0 基于 Gemma 4 和 Qwen 3.5 等顶尖底座构建，采用极具攻击性的 MIT 许可协议。其核心突破在于引入了“自我脚手架”（Self-Scaffolding）机制，显著提升了模型在复杂软件工程任务中的自主规划与执行能力，在多项编程基准测试中刷新了同规模开源模型的记录。

技术/商业细节

模型矩阵：Ornith-1.0 并非单一模型，而是一个覆盖全场景的家族。397B MoE 版本旨在挑战闭源 SOTA（如 Claude 3.5 Sonnet），而 9B 版本则针对端侧和快速迭代场景进行了极致优化。
自我脚手架（Self-Scaffolding）：这是该模型的技术灵魂。不同于传统模型被动响应指令，Ornith 在训练中内化了构建任务框架的能力，能够自主生成中间步骤、调用工具并进行自我纠错，这使其在处理长序列编程任务时表现出极强的稳定性。
开源策略：选择 MIT 协议而非更具限制性的协议，显示了 DeepReinforce 试图通过极低的使用门槛，迅速占领开发者工具和企业级私有化部署市场的野心。
性能基准：在 HumanEval 和 MBPP 等硬核编程测试中，Ornith-1.0 的表现不仅超越了 Llama 3 系列的编程变体，甚至在逻辑推理的连贯性上逼近了部分闭源模型。

八卦分析：全球影响

「八卦智慧」认为，Ornith-1.0 的发布标志着 AI 编程从“代码补全”时代正式跨入“智能体工程”时代。过去，开发者依赖 Cursor 或 GitHub Copilot 等 SaaS 服务，这些工具的核心逻辑往往被封装在闭源的 Prompt 工程和后端逻辑中。Ornith 的出现，实际上是将这种“脚手架”能力直接写入了模型权重。

从全球竞争格局来看，DeepReinforce 正在利用“开源杠杆”对 OpenAI 和 Anthropic 发起侧翼进攻。通过基于 Qwen 和 Gemma 进行二次开发，Ornith 证明了开源社区在垂直领域（如 Coding）实现“弯道超车”的可能性。这对于那些对代码隐私极度敏感、渴望摆脱供应商锁定（Vendor Lock-in）的大型企业而言，无疑是极具吸引力的替代方案。此外，397B MoE 的推出，预示着超大规模开源模型在专业化领域的效能已经达到了商业化临界点。

战略建议

对于开发者工具创业者：应立即评估 Ornith-1.0 作为底层引擎的可能性。其 MIT 协议允许深度定制且无版权后顾之忧，是构建垂直领域 AI 程序员（AI Software Engineer）的理想底座。
对于企业 CTO：如果公司内部有严格的代码合规要求，Ornith-1.0 的私有化部署应提上日程。它提供的“智能体”能力可以显著降低内部 DevOps 流程的自动化门槛。
对于算力持有者：关注 35B MoE 版本。该版本在性能与推理成本之间取得了极佳平衡，是目前性价比最高的编程专用模型，适合进行大规模的批处理任务。

[ DATA_STREAM_END ]

[ ORIGINAL_SOURCE ]

READ_ORIGINAL →

[ 02 ] RELATED_INTEL

揭秘 Jane Street：支撑百亿美元日交易额的生产工程学

核心事件本文深入探讨了顶级量化交易巨头…

字节跳动开源 Deer-flow：重新定义长程超级智能体（Super-Agent）的工业级标准

核心事件字节跳动正式开源 Deer-f…

llama.cpp 正式合并 MTP 支持：本地大模型推理效率迎来“质变时刻”

事件核心 llama.cpp 社区正式合…

GB10 开源 Atlas 推理引擎：彻底告别 Python，重塑大模型推理性能天花板

GB10 正式开源其高性能推理引擎 At…