[ PROMPT_NODE_26484 ]
parameters_reference
[ SKILL_DOCUMENTATION ]
# DiffDock 配置参数参考
本文档提供了所有 DiffDock 配置参数和命令行选项的详细说明。
## 模型与检查点设置
### 模型路径
- **`--model_dir`**: 包含评分模型检查点的目录
- 默认值: `./workdir/v1.1/score_model`
- DiffDock-L 模型(当前默认)
- **`--confidence_model_dir`**: 包含置信度模型检查点的目录
- 默认值: `./workdir/v1.1/confidence_model`
- **`--ckpt`**: 评分模型检查点文件名
- 默认值: `best_ema_inference_epoch_model.pt`
- **`--confidence_ckpt`**: 置信度模型检查点文件名
- 默认值: `best_model_epoch75.pt`
### 模型版本标志
- **`--old_score_model`**: 使用原始 DiffDock 模型而非 DiffDock-L
- 默认值: `false` (使用 DiffDock-L)
- **`--old_filtering_model`**: 使用旧版置信度过滤方法
- 默认值: `true`
## 输入/输出选项
### 输入规范
- **`--protein_path`**: 蛋白质 PDB 文件路径
- 示例: `--protein_path protein.pdb`
- `--protein_sequence` 的替代方案
- **`--protein_sequence`**: 用于 ESMFold 折叠的氨基酸序列
- 自动根据序列生成蛋白质结构
- `--protein_path` 的替代方案
- **`--ligand`**: 配体规范(SMILES 字符串或文件路径)
- SMILES 字符串: `--ligand "COc(cc1)ccc1C#N"`
- 文件路径: `--ligand ligand.sdf` 或 `.mol2`
- **`--protein_ligand_csv`**: 用于批量处理的 CSV 文件
- 必需列: `complex_name`, `protein_path`, `ligand_description`, `protein_sequence`
- 示例: `--protein_ligand_csv data/protein_ligand_example.csv`
### 输出控制
- **`--out_dir`**: 预测结果的输出目录
- 示例: `--out_dir results/user_predictions/`
- **`--save_visualisation`**: 将预测的分子导出为 SDF 文件
- 启用结果可视化
## 推理参数
### 扩散步骤
- **`--inference_steps`**: 计划的推理迭代次数
- 默认值: `20`
- 更高的值可能会提高准确性,但会增加运行时间
- **`--actual_steps`**: 实际执行的扩散步骤
- 默认值: `19`
- **`--no_final_step_noise`**: 在最后一步扩散中省略噪声
- 默认值: `true`
### 采样设置
- **`--samples_per_complex`**: 每个复合物生成的样本数量
- 默认值: `10`
- 更多的样本提供更好的覆盖范围,但会增加计算量
- **`--sigma_schedule`**: 噪声调度类型
- 默认值: