[ PROMPT_NODE_24440 ]
Workers AI 说明文档
[ SKILL_DOCUMENTATION ]
# Cloudflare Workers AI
Cloudflare Workers AI 专家指南 - 在边缘运行的无服务器 GPU 加速 AI 推理。
## 概览
Workers AI 提供:
- 50+ 预训练模型 (LLM、嵌入、图像生成、语音转文字、翻译)
- 原生 Workers 绑定 (无需外部 API 调用)
- 按使用量付费 (按推理消耗的神经元计费)
- 兼容 OpenAI 的 REST API
- 文本生成的流式传输支持
- 兼容模型的工具调用 (Function calling)
**架构**: 推理在 Cloudflare 的 GPU 网络上运行。模型在首次请求时加载 (冷启动 1-3 秒),后续请求速度更快。
## 快速入门
typescript
interface Env {
AI: Ai;
}
export default {
async fetch(request: Request, env: Env) {
const response = await env.AI.run('@cf/meta/llama-3.1-8b-instruct', {
messages: [{ role: 'user', content: 'What is Cloudflare?' }]
});
return Response.json(response);
}
};
bash
# 设置 - 将绑定添加到 wrangler.jsonc
wrangler dev --remote # AI 必须使用 --remote
wrangler deploy
## 模型选择决策树
### 文本生成 (聊天/补全)
**质量优先**:
- **最佳质量**: `@cf/meta/llama-3.1-70b-instruct` (昂贵,约 2000 神经元)
- **平衡**: `@cf/meta/llama-3.1-8b-instruct` (质量好,约 200 神经元)
- **最快/最便宜**: `@cf/mistral/mistral-7b-instruct-v0.1` (约 50 神经元)
**工具调用**:
- 使用 `@cf/meta/llama-3.1-8b-instruct` 或 `@cf/meta/llama-3.1-70b-instruct` (原生工具支持)
**代码生成**:
- 使用 `@cf/deepseek-ai/deepseek-coder-6.7b-instruct` (专为代码优化)
### 嵌入 (语义搜索/RAG)
**英文文本**:
- **最佳**: `@cf/baai/bge-large-en-v1.5` (1024 维度,最高质量)
- **平衡**: `@cf/baai/bge-base-en-v1.5` (768 维度,质量好)
- **快速**: `@cf/baai/bge-small-en-v1.5` (384 维度,质量较低但速度快)
**多语言**:
- 使用 `@hf/sentence-transformers/paraphrase-multilingual-minilm-l12-v2`
### 图像生成
- **Stable Diffusion**: `@cf/stabilityai/stable-diffusion-xl-base-1.0` (约 10,000 神经元)
- **肖像**: `@cf/lykon/dreamshaper-8-lcm` (针对人脸优化)
### 其他任务
- **语音转文字**: `@cf/openai/whisper`
- **翻译**: `@cf/meta/m2m100-1.2b` (100 种语言)
- **图像分类**: `@cf/microsoft/resnet-50`
## SDK 使用决策树
### 原生绑定 (推荐)
**适用场景**: 使用 TypeScript 构建 Workers/Pages
**优势**: 无外部依赖,最佳性能,原生类型支持