[ PROMPT_NODE_26700 ]
kegg-database
[ SKILL_DOCUMENTATION ]
# KEGG 数据库
## 概述
KEGG(京都基因与基因组百科全书)是一个用于生物通路分析和分子相互作用网络的综合生物信息学资源。
**重要提示**:KEGG API 仅供学术用户进行学术研究使用。
## 何时使用此工具
当需要使用 KEGG 的 REST API 查询跨多个物种的通路、基因、化合物、酶、疾病和药物时,应使用此工具。
## 快速入门
此工具提供:
1. 用于所有 KEGG REST API 操作的 Python 辅助函数 (`scripts/kegg_api.py`)
2. 包含详细 API 规范的综合参考文档 (`references/kegg_reference.md`)
当用户请求 KEGG 数据时,确定所需的操作并使用 `scripts/kegg_api.py` 中的相应函数。
## 核心操作
### 1. 数据库信息 (`kegg_info`)
检索有关 KEGG 数据库的元数据和统计信息。
**适用场景**:了解数据库结构、检查可用数据、获取发布信息。
**用法**:
python
from scripts.kegg_api import kegg_info
# 获取通路数据库信息
info = kegg_info('pathway')
# 获取特定物种信息
hsa_info = kegg_info('hsa') # 人类基因组
**常用数据库**:`kegg`, `pathway`, `module`, `brite`, `genes`, `genome`, `compound`, `glycan`, `reaction`, `enzyme`, `disease`, `drug`
### 2. 列出条目 (`kegg_list`)
列出 KEGG 数据库中的条目标识符和名称。
**适用场景**:获取某物种的所有通路、列出基因、检索化合物目录。
**用法**:
python
from scripts.kegg_api import kegg_list
# 列出所有参考通路
pathways = kegg_list('pathway')
# 列出人类特定通路
hsa_pathways = kegg_list('pathway', 'hsa')
# 列出特定基因(最多 10 个)
genes = kegg_list('hsa:10458+hsa:10459')
**常用物种代码**:`hsa` (人类), `mmu` (小鼠), `dme` (果蝇), `sce` (酵母), `eco` (大肠杆菌)
### 3. 搜索 (`kegg_find`)
通过关键词或分子属性搜索 KEGG 数据库。
**适用场景**:按名称/描述查找基因、按分子式或质量搜索化合物、按关键词发现条目。
**用法**:
python
from scripts.kegg_api import kegg_find
# 关键词搜索
results = kegg_find('genes', 'p53')
shiga_toxin = kegg_find('genes', 'shiga toxin')
# 分子式搜索(精确匹配)
compounds = kegg_find('compound', 'C7H10N4O2', 'formula')
# 分子量范围搜索
drugs = kegg_find('drug', '300-310', 'exact_')