[ PROMPT_NODE_26412 ]
cosmic_data_reference
[ SKILL_DOCUMENTATION ]
# COSMIC 数据库参考
## 概述
COSMIC (癌症体细胞突变目录) 是全球最大、最全面的探索人类癌症体细胞突变影响的资源。由 Wellcome Sanger 研究所维护,它编录了数千种癌症类型中的数百万个突变。
**网站**: https://cancer.sanger.ac.uk/cosmic
**发布计划**: 季度更新
**当前版本**: v102 (2025年5月),在 API 调用中使用 "latest" 获取最新版本
## 数据访问
### 身份验证
- **学术用户**: 免费访问 (需注册)
- **商业用户**: 需要许可证 (联系 QIAGEN)
- **注册**: https://cancer.sanger.ac.uk/cosmic/register
### 下载方法
1. **Web 浏览器**: 在 https://cancer.sanger.ac.uk/cosmic 进行交互式搜索
2. **文件下载**: 通过下载 API 进行程序化访问
3. **数据文件**: 支持 TSV、CSV 和 VCF 格式
## 可用数据类型
### 1. 核心突变数据
**主要文件**:
- `CosmicMutantExport.tsv.gz` - 完整的编码区突变
- `CosmicCodingMuts.vcf.gz` - VCF 格式的突变
- `CosmicNonCodingVariants.vcf.gz` - 非编码区变异
- `CosmicMutantExportCensus.tsv.gz` - 仅限癌症基因普查基因的突变
**内容**:
- 点突变 (SNVs)
- 小片段插入和缺失 (indels)
- 基因组坐标
- 变异注释
- 样本信息
- 肿瘤类型关联
### 2. 癌症基因普查 (Cancer Gene Census)
**文件**: `cancer_gene_census.csv`
**内容**:
- 专家精选的癌症基因列表
- 700+ 个具有明确癌症参与证据的基因
- 基因角色 (癌基因、抑癌基因、融合基因)
- 突变类型
- 组织关联
- 分子遗传学信息
### 3. 突变特征 (Mutational Signatures)
**文件**: 位于 `signatures/` 目录
- `signatures.tsv` - 特征定义
- 单碱基替换 (SBS) 特征
- 双碱基替换 (DBS) 特征
- 插入/缺失 (ID) 特征
**当前版本**: v3.4 (随 COSMIC v98 发布)
**内容**:
- 特征谱 (96通道、78通道、83通道)
- 病因注释
- 用于特征分析的参考特征
### 4. 结构变异
**文件**: `CosmicStructExport.tsv.gz`
**内容**:
- 基因融合
- 结构断点
- 易位事件
- 大片段缺失/插入
- 复杂重排
### 5. 拷贝数变异
**文件**: `CosmicCompleteCNA.tsv.gz`
**内容**:
- 拷贝数增加和丢失
- 扩增和缺失
- 片段水平