[ PROMPT_NODE_26756 ]
database_strategies
[ SKILL_DOCUMENTATION ]
# 文献数据库检索策略
本文档提供了系统且高效地检索多个文献数据库的综合指南。
## 可用数据库与技能
### 生物医学与生命科学
#### PubMed / PubMed Central
- **访问**: 使用 `gget` 技能或 WebFetch 工具
- **覆盖范围**: 3500 万+ 生物医学文献引文
- **适用场景**: 临床研究、生物医学研究、遗传学、分子生物学
- **检索技巧**: 使用 MeSH 主题词、布尔运算符 (AND, OR, NOT)、字段标签 [Title], [Author]
- **示例**: `"CRISPR"[Title] AND "gene editing"[Title/Abstract] AND 2020:2024[Publication Date]`
#### bioRxiv / medRxiv
- **访问**: 使用 `gget` 技能或直接 API
- **覆盖范围**: 生物学和医学领域的预印本
- **适用场景**: 最新的未发表研究、前沿发现
- **注意**: 未经同行评审;请谨慎验证结果
- **检索技巧**: 按类别搜索(生物信息学、基因组学等)
### 通用科学文献
#### arXiv
- **访问**: 直接 API 访问
- **覆盖范围**: 物理学、数学、计算机科学、定量生物学的预印本
- **适用场景**: 计算方法、生物信息学算法、理论研究
- **类别**: q-bio (定量生物学), cs.LG (机器学习), stat.ML (统计学)
- **检索格式**: `cat:q-bio.QM AND title:"single cell"`
#### Semantic Scholar
- **访问**: 直接 API(需要 API 密钥)
- **覆盖范围**: 全领域 2 亿+ 篇论文
- **适用场景**: 跨学科检索、引文图谱、论文推荐
- **功能**: 影响力引文、论文摘要、相关论文
- **速率限制**: 使用 API 密钥每 5 分钟 100 次请求
#### Google Scholar
- **访问**: 网络爬虫(请谨慎使用)或手动搜索
- **覆盖范围**: 全领域综合检索
- **适用场景**: 查找高被引论文、会议论文集、学位论文
- **局限性**: 无官方 API,有速率限制
- **导出**: 使用 "Cite" 功能获取格式化引用
### 专业数据库
#### ChEMBL / PubChem
- **访问**: 使用 `gget` 技能或 `bioservices` 技能
- **覆盖范围**: 化合物、生物活性数据、药物分子
- **适用场景**: 药物发现、化学生物学、药物化学
- **ChEMBL**: 200 万+ 化合物,生物活性数据
- **PubChem**: 1.1 亿+ 化合物,分析数据
#### UniProt
- **访问**: 使用 `gget` 技能或 `bioservices` 技能
- **覆盖范围**: 蛋白质序列和功能信息
- **适用场景**: 蛋白质研究