[ PROMPT_NODE_27152 ]
pyopenms
[ SKILL_DOCUMENTATION ]
# PyOpenMS
## 概览
PyOpenMS 提供了 OpenMS 库的 Python 绑定,用于计算质谱分析,支持蛋白质组学和代谢组学数据分析。用于处理质谱文件格式、处理光谱数据、检测特征、鉴定肽段/蛋白质以及执行定量分析。
## 安装
使用 uv 安装:
bash
uv uv pip install pyopenms
验证安装:
python
import pyopenms
print(pyopenms.__version__)
## 核心能力
PyOpenMS 将功能组织在以下领域:
### 1. 文件 I/O 与数据格式
处理质谱文件格式并在不同表示之间转换。
**支持格式**:mzML, mzXML, TraML, mzTab, FASTA, pepXML, protXML, mzIdentML, featureXML, consensusXML, idXML
基础文件读取:
python
import pyopenms as ms
# 读取 mzML 文件
exp = ms.MSExperiment()
ms.MzMLFile().load("data.mzML", exp)
# 访问光谱
for spectrum in exp:
mz, intensity = spectrum.get_peaks()
print(f"Spectrum: {len(mz)} peaks")
**详细文件处理**:参见 `references/file_io.md`
### 2. 信号处理
通过平滑、过滤、质心化和归一化处理原始光谱数据。
基础光谱处理:
python
# 使用高斯滤波器平滑光谱
gaussian = ms.GaussFilter()
params = gaussian.getParameters()
params.setValue("gaussian_width", 0.1)
gaussian.setParameters(params)
gaussian.filterExperiment(exp)
**算法详情**:参见 `references/signal_processing.md`
### 3. 特征检测
跨光谱和样本检测并链接特征,用于定量分析。
python
# 检测特征
ff = ms.FeatureFinder()
ff.run("centroided", exp, features, params, ms.FeatureMap())
**完整工作流**:参见 `references/feature_detection.md`
### 4. 肽段与蛋白质鉴定
集成搜索引擎并处理鉴定结果。
**支持引擎**:Comet, Mascot, MSGFPlus, XTandem, OMSSA, Myrimatch
基础鉴定工作流:
python
# 加载鉴定数据
protein_ids = []
peptide_ids = []
ms.IdXMLFile().load("identifications.idXML", protein_ids, peptide_ids)
# 应用 FDR 过滤
fdr = ms.FalseDiscoveryRate()
fdr.apply(peptide_ids)
**详细工作流**:参见 `references/identification.md`
### 5. 代谢组学分析
执行非靶向代谢组学预处理和分析。
典型工作流:
1. 加载并处理原始数据
2. 检测特征
3. 对齐