[ PROMPT_NODE_26970 ]
Pathml 预处理
[ SKILL_DOCUMENTATION ]
# 预处理流水线与转换
## 概述
PathML 提供了一种基于可组合转换的模块化预处理架构,这些转换被组织在流水线中。转换是修改图像、创建掩码或提取特征的单个操作。流水线将转换链接在一起,为计算病理学创建可复现、可扩展的预处理工作流。
## 流水线架构
### Pipeline 类
`Pipeline` 类组合了一系列连续应用的转换:
python
from pathml.preprocessing import Pipeline, Transform1, Transform2
# 创建流水线
pipeline = Pipeline([
Transform1(param1=value1),
Transform2(param2=value2),
# ... 更多转换
])
# 在单个切片上运行
pipeline.run(slide_data)
# 在数据集上运行
pipeline.run(dataset, distributed=True, n_workers=8)
**关键特性:**
- 转换的顺序执行
- 自动处理切片和掩码
- 支持使用 Dask 进行分布式处理
- 具有可序列化配置的可复现工作流
### Transform 基类
所有转换都继承自 `Transform` 基类并实现:
- `apply()` - 核心转换逻辑
- `input_type` - 预期的输入 (切片, 掩码等)
- `output_type` - 产生的输出
## 转换类别
PathML 提供六大类转换:
1. **图像修改** - 模糊、重缩放、直方图均衡化
2. **掩码创建** - 组织检测、细胞核检测、阈值处理
3. **掩码修改** - 掩码的形态学操作
4. **染色处理** - H&E 染色归一化和分离
5. **质量控制** - 伪影检测、空白区域标记
6. **专业化** - 多参数成像、细胞分割
## 图像修改转换
### 模糊操作
应用各种模糊核进行降噪:
**MedianBlur:**
python
from pathml.preprocessing import MedianBlur
# 应用中值滤波
transform = MedianBlur(kernel_size=5)
- 对椒盐噪声有效
- 比高斯模糊更好地保留边缘
**GaussianBlur:**
python
from pathml.preprocessing import GaussianBlur
# 应用高斯模糊
transform = GaussianBlur(kernel_size=5, sigma=1.0)
- 平滑降噪
- 可调节的 sigma 控制模糊强度
**BoxBlur:**
python
from pathml.preprocessing import BoxBlur
# 应用盒式滤波
transform = BoxBlur(kernel_size=5)
- 最快的模糊操作
- 核内均匀平均
### 强度调整
**RescaleInte