[ PROMPT_NODE_26178 ]
clustering
[ SKILL_DOCUMENTATION ]
# 时间序列聚类
Aeon 提供了适配时间序列数据的聚类算法,包含专门的距离度量和平均方法。
## 分区算法
适配时间序列的标准 k-means/k-medoids:
- `TimeSeriesKMeans` - 带有时间距离度量(DTW, Euclidean 等)的 K-means
- `TimeSeriesKMedoids` - 使用实际时间序列作为聚类中心
- `TimeSeriesKShape` - 基于形状的聚类算法
- `TimeSeriesKernelKMeans` - 用于非线性模式的核方法变体
**适用场景**:已知聚类数量,且预期聚类形状为球形时。
## 大数据集方法
针对大型集合的高效聚类:
- `TimeSeriesCLARA` - 带有采样的聚类大型应用
- `TimeSeriesCLARANS` - CLARA 的随机搜索变体
**适用场景**:数据集对于标准 k-medoids 来说太大,需要可扩展性时。
## 弹性距离聚类
专门用于基于对齐的相似度:
- `KASBA` - 带有平移不变弹性平均的 K-means
- `ElasticSOM` - 使用弹性距离的自组织映射
**适用场景**:时间序列具有时间偏移或扭曲时。
## 谱方法
基于图的聚类:
- `KSpectralCentroid` - 带有质心计算的谱聚类
**适用场景**:非凸聚类形状,需要基于图的方法时。
## 深度学习聚类
基于自动编码器的神经网络聚类:
- `AEFCNClusterer` - 全卷积自动编码器
- `AEResNetClusterer` - 残差网络自动编码器
- `AEDCNNClusterer` - 膨胀 CNN 自动编码器
- `AEDRNNClusterer` - 膨胀 RNN 自动编码器
- `AEBiGRUClusterer` - 双向 GRU 自动编码器
- `AEAttentionBiGRUClusterer` - 注意力增强型 BiGRU 自动编码器
**适用场景**:大规模数据集,需要学习到的表示或处理复杂模式时。
## 基于特征的聚类
在聚类前转换到特征空间:
- `Catch22Clusterer` - 基于 22 个规范特征进行聚类
- `SummaryClusterer` - 使用摘要统计
- `TSFreshClusterer` - 自动化的 tsfresh 特征
**适用场景**:原始时间序列信息量不足,需要可解释特征时。
## 组合
构建自定义聚类工作流:
- `ClustererPipeline` - 将转换器与聚类器串联
## 平均方法
计算时间序列的聚类中心:
- `mean_average` - 算术平均
- `ba_average` - 带有 DTW 的重心平均
- `kasba_average` - 平移不变平均
- `shift_invariant_average` - 通用平移不变方法
**适用场景**:需要代表性中心时。