[ PROMPT_NODE_26790 ]
importing_exporting
[ SKILL_DOCUMENTATION ]
# Matchms 导入与导出参考
本文档详细说明了 matchms 中用于加载和保存质谱数据的所有文件格式支持。
## 导入谱图
Matchms 提供了专门的函数,用于从各种文件格式加载谱图。所有导入函数均返回生成器,以便对大文件进行内存高效处理。
### 通用导入模式
python
from matchms.importing import load_from_mgf
# 加载谱图(返回生成器)
spectra_generator = load_from_mgf("spectra.mgf")
# 转换为列表以进行处理
spectra = list(spectra_generator)
## 支持的导入格式
### MGF (Mascot Generic Format)
**函数**:`load_from_mgf(filename, metadata_harmonization=True)`
**描述**:从 MGF 文件加载谱图,这是质谱数据交换的常用格式。
**参数**:
- `filename` (str): MGF 文件路径
- `metadata_harmonization` (bool, 默认=True): 应用自动元数据键协调
**示例**:
python
from matchms.importing import load_from_mgf
# 加载并进行元数据协调
spectra = list(load_from_mgf("data.mgf"))
# 加载但不进行协调
spectra = list(load_from_mgf("data.mgf", metadata_harmonization=False))
**MGF 格式**:基于文本的格式,包含 BEGIN IONS/END IONS 块,其中包含元数据和峰值列表。
---
### MSP (NIST Mass Spectral Library Format)
**函数**:`load_from_msp(filename, metadata_harmonization=True)`
**描述**:从 MSP 文件加载谱图,常用于谱图库。
**参数**:
- `filename` (str): MSP 文件路径
- `metadata_harmonization` (bool, 默认=True): 应用自动元数据协调
**示例**:
python
from matchms.importing import load_from_msp
spectra = list(load_from_msp("library.msp"))
**MSP 格式**:基于文本的格式,包含 Name/MW/Comment 字段,后跟峰值列表。
---
### mzML (Mass Spectrometry Markup Language)
**函数**:`load_from_mzml(filename, ms_level=2, metadata_harmonization=True)`
**描述**:从 mzML 文件加载谱图,这是原始质谱数据的标准 XML 格式。
**参数**:
- `filename` (str): mzML 文件路径
- `ms_level` (int, 默认=2): 要提取的 MS 级别(1 为 MS1,2 为 MS2/串联)
- `metadata_harmonization` (bool, 默认=True): 应用自动元数据协调
**示例**:
python
from matchms.importing import load_from_mzml
# 加载 MS2 谱图(默认)
ms2_spectra = list(load_from_mzml("data.mzML"))
# 加载 MS1 谱图