[ PROMPT_NODE_22706 ]

supported-models

[ SKILL_DOCUMENTATION ]

# 支持的模型 LitGPT 支持的模型架构完整列表，包含参数规模和变体。 ## 概述 LitGPT 支持 **20+ 个模型系列** 和 **100+ 个模型变体**，参数量从 135M 到 405B 不等。 **列出所有模型**： bash litgpt download list **列出支持预训练的模型**： bash litgpt pretrain list ## 模型系列 ### Llama 系列 **Llama 3, 3.1, 3.2, 3.3**： - **规模**：1B, 3B, 8B, 70B, 405B - **使用场景**：通用、长上下文 (128K)、多模态 - **最佳用途**：生产应用、研究、指令遵循 **Code Llama**： - **规模**：7B, 13B, 34B, 70B - **使用场景**：代码生成、补全、填充 - **最佳用途**：编程助手、代码分析 **Function Calling Llama 2**： - **规模**：7B - **使用场景**：工具使用、API 集成 - **最佳用途**：智能体、函数执行 **Llama 2**： - **规模**：7B, 13B, 70B - **使用场景**：通用（Llama 3 的前身） - **最佳用途**：既有基准测试、研究对比 **Llama 3.1 Nemotron**： - **规模**：70B - **使用场景**：NVIDIA 优化变体 - **最佳用途**：企业级部署 **TinyLlama**： - **规模**：1.1B - **使用场景**：边缘设备、资源受限环境 - **最佳用途**：快速推理、移动端部署 **OpenLLaMA**： - **规模**：3B, 7B, 13B - **使用场景**：开源 Llama 复现 - **最佳用途**：研究、教育 **Vicuna**： - **规模**：7B, 13B, 33B - **使用场景**：聊天机器人、指令遵循 - **最佳用途**：对话式 AI **R1 Distill Llama**： - **规模**：8B, 70B - **使用场景**：蒸馏推理模型 - **最佳用途**：高效推理任务 **MicroLlama**： - **规模**：300M - **使用场景**：极小规模 Llama 变体 - **最佳用途**：原型设计、测试 **Platypus**： - **规模**：7B, 13B, 70B - **使用场景**：STEM 领域微调 - **最佳用途**：科学、数学、技术领域 ### Mistral 系列 **Mistral**： - **规模**：7B, 123B - **使用场景**：高效开源模型、长上下文 - **最佳用途**：高性价比部署 **Mathstral**： - **规模**：7B - **使用场景**：数学推理 - **最佳用途**：数学问题求解 **Mixtral MoE**： - **规模**：8×7B (总 47B, 激活 13B), 8×22B (总 141B, 激活 39B) - **使用场景**：稀疏专家混合模型 (MoE) - **最佳用途**：低计算量下的高容量 ### Falcon 系列 **Falcon**： - **规模**：7B, 40B, 180B - **使用场景**：TII 开源模型 - **最佳用途**：(内容截断)

数据来源：claude-code-templates（MIT），中文翻译由 AI 生成。详见关于我们。

BAGUA AI