[ PROMPT_NODE_27178 ]
Pytdc 数据集
[ SKILL_DOCUMENTATION ]
# TDC 数据集综合目录
本文档提供了 Therapeutics Data Commons 中所有可用数据集的综合目录,按任务类别组织。
## 单实例预测数据集
### ADME (吸收、分布、代谢、排泄)
**吸收:**
- `Caco2_Wang` - Caco-2 细胞渗透性 (906 个化合物)
- `Caco2_AstraZeneca` - AstraZeneca 的 Caco-2 渗透性 (700 个化合物)
- `HIA_Hou` - 人体肠道吸收 (578 个化合物)
- `Pgp_Broccatelli` - P-糖蛋白抑制 (1,212 个化合物)
- `Bioavailability_Ma` - 口服生物利用度 (640 个化合物)
- `F20_edrug3d` - 口服生物利用度 F>=20% (1,017 个化合物)
- `F30_edrug3d` - 口服生物利用度 F>=30% (1,017 个化合物)
**分布:**
- `BBB_Martins` - 血脑屏障渗透 (1,975 个化合物)
- `PPBR_AZ` - 血浆蛋白结合率 (1,797 个化合物)
- `VDss_Lombardo` - 稳态分布容积 (1,130 个化合物)
**代谢:**
- `CYP2C19_Veith` - CYP2C19 抑制 (12,665 个化合物)
- `CYP2D6_Veith` - CYP2D6 抑制 (13,130 个化合物)
- `CYP3A4_Veith` - CYP3A4 抑制 (12,328 个化合物)
- `CYP1A2_Veith` - CYP1A2 抑制 (12,579 个化合物)
- `CYP2C9_Veith` - CYP2C9 抑制 (12,092 个化合物)
- `CYP2C9_Substrate_CarbonMangels` - CYP2C9 底物 (666 个化合物)
- `CYP2D6_Substrate_CarbonMangels` - CYP2D6 底物 (664 个化合物)
- `CYP3A4_Substrate_CarbonMangels` - CYP3A4 底物 (667 个化合物)
**排泄:**
- `Half_Life_Obach` - 半衰期 (667 个化合物)
- `Clearance_Hepatocyte_AZ` - 肝细胞清除率 (1,020 个化合物)
- `Clearance_Microsome_AZ` - 微粒体清除率 (1,102 个化合物)
**溶解度与亲脂性:**
- `Solubility_AqSolDB` - 水溶性 (9,982 个化合物)
- `Lipophilicity_AstraZeneca` - 亲脂性 (logD) (4,200 个化合物)
- `HydrationFreeEnergy_FreeSolv` - 水合自由能 (642 个化合物)
### 毒性
**器官毒性:**
- `hERG` - hERG 通道抑制/心脏毒性 (648 个化合物)
- `hERG_Karim` - hERG 阻滞剂扩展数据集 (13,445 个化合物)
- `DILI` - 药物性肝损伤 (475 个化合物)
- `Skin_Reaction` - 皮肤反应 (404 个化合物)
- `Carcinogens_Lagunin` - 致癌性 (278 个化合物)
- `Respiratory_Toxicity` - 呼吸毒性 (278 个化合物)
**一般毒性:**
- `AMES` - Ames 致突变性 (7,255 个化合物)
- `LD50_Zhu` - 急性毒性 LD50 (7,385 个化合物)
- `ClinTox` - 临床试验毒性 (1,478 个化合物)
- `SkinSensitizat