[ PROMPT_NODE_26788 ]
filtering
[ SKILL_DOCUMENTATION ]
# Matchms 过滤函数参考
本文档提供了 matchms 中用于处理质谱数据的所有过滤函数的全面参考。
## 元数据处理过滤器
### 化合物与化学信息
**add_compound_name(spectrum)**
- 将化合物名称添加到正确的元数据字段
- 标准化化合物名称的存储位置
**clean_compound_name(spectrum)**
- 移除化合物名称中常见的冗余添加项
- 清理格式不一致的问题
**derive_adduct_from_name(spectrum)**
- 从化合物名称中提取加合物信息
- 将加合物标记移动到正确的元数据字段
**derive_formula_from_name(spectrum)**
- 检测化合物名称中的化学式
- 将化学式重定位到适当的元数据字段
**derive_annotation_from_compound_name(spectrum)**
- 使用化合物名称从 PubChem 检索 SMILES/InChI
- 自动注释化学结构
### 化学结构转换
**derive_inchi_from_smiles(spectrum)**
- 从 SMILES 字符串生成 InChI
- 需要 rdkit 库
**derive_inchikey_from_inchi(spectrum)**
- 从 InChI 计算 InChIKey
- 27 字符的哈希标识符
**derive_smiles_from_inchi(spectrum)**
- 从 InChI 表示创建 SMILES
- 需要 rdkit 库
**repair_inchi_inchikey_smiles(spectrum)**
- 校正错位的化学标识符
- 修复元数据字段混淆
**repair_not_matching_annotation(spectrum)**
- 确保 SMILES、InChI 和 InChIKey 之间的一致性
- 验证化学结构注释是否匹配
**add_fingerprint(spectrum, fingerprint_type="daylight", nbits=2048, radius=2)**
- 生成用于相似度计算的分子指纹
- 指纹类型: "daylight", "morgan1", "morgan2", "morgan3"
- 与 FingerprintSimilarity 评分配合使用
### 质量与电荷信息
**add_precursor_mz(spectrum)**
- 归一化前体 m/z 值
- 标准化前体质量元数据
**add_parent_mass(spectrum, estimate_from_adduct=True)**
- 从前体 m/z 和加合物计算中性母体质量
- 如果无法直接获取,可根据加合物进行估算
**correct_charge(spectrum)**
- 将电荷值与离子模式对齐
- 确保电荷符号与电离模式匹配
**make_charge_int(spectrum)**
- 将电荷转换为整数格式
- 标准化电荷表示
**clean_adduct(spectrum)**
- 标准化加合物标记
- 校正常见的加合物格式问题
**interpret_pepmass(spectrum)**
- 解析 pepmass