[ PROMPT_NODE_22706 ]
supported-models
[ SKILL_DOCUMENTATION ]
# 支持的模型
LitGPT 支持的模型架构完整列表,包含参数规模和变体。
## 概述
LitGPT 支持 **20+ 个模型系列** 和 **100+ 个模型变体**,参数量从 135M 到 405B 不等。
**列出所有模型**:
bash
litgpt download list
**列出支持预训练的模型**:
bash
litgpt pretrain list
## 模型系列
### Llama 系列
**Llama 3, 3.1, 3.2, 3.3**:
- **规模**:1B, 3B, 8B, 70B, 405B
- **使用场景**:通用、长上下文 (128K)、多模态
- **最佳用途**:生产应用、研究、指令遵循
**Code Llama**:
- **规模**:7B, 13B, 34B, 70B
- **使用场景**:代码生成、补全、填充
- **最佳用途**:编程助手、代码分析
**Function Calling Llama 2**:
- **规模**:7B
- **使用场景**:工具使用、API 集成
- **最佳用途**:智能体、函数执行
**Llama 2**:
- **规模**:7B, 13B, 70B
- **使用场景**:通用(Llama 3 的前身)
- **最佳用途**:既有基准测试、研究对比
**Llama 3.1 Nemotron**:
- **规模**:70B
- **使用场景**:NVIDIA 优化变体
- **最佳用途**:企业级部署
**TinyLlama**:
- **规模**:1.1B
- **使用场景**:边缘设备、资源受限环境
- **最佳用途**:快速推理、移动端部署
**OpenLLaMA**:
- **规模**:3B, 7B, 13B
- **使用场景**:开源 Llama 复现
- **最佳用途**:研究、教育
**Vicuna**:
- **规模**:7B, 13B, 33B
- **使用场景**:聊天机器人、指令遵循
- **最佳用途**:对话式 AI
**R1 Distill Llama**:
- **规模**:8B, 70B
- **使用场景**:蒸馏推理模型
- **最佳用途**:高效推理任务
**MicroLlama**:
- **规模**:300M
- **使用场景**:极小规模 Llama 变体
- **最佳用途**:原型设计、测试
**Platypus**:
- **规模**:7B, 13B, 70B
- **使用场景**:STEM 领域微调
- **最佳用途**:科学、数学、技术领域
### Mistral 系列
**Mistral**:
- **规模**:7B, 123B
- **使用场景**:高效开源模型、长上下文
- **最佳用途**:高性价比部署
**Mathstral**:
- **规模**:7B
- **使用场景**:数学推理
- **最佳用途**:数学问题求解
**Mixtral MoE**:
- **规模**:8×7B (总 47B, 激活 13B), 8×22B (总 141B, 激活 39B)
- **使用场景**:稀疏专家混合模型 (MoE)
- **最佳用途**:低计算量下的高容量
### Falcon 系列
**Falcon**:
- **规模**:7B, 40B, 180B
- **使用场景**:TII 开源模型
- **最佳用途**:(内容截断)