[ PROMPT_NODE_26180 ]
datasets_benchmarking
[ SKILL_DOCUMENTATION ]
# 数据集与基准测试
Aeon 提供了用于加载数据集和对时间序列算法进行基准测试的综合工具。
## 数据集加载
### 任务特定加载器
**分类数据集**:
python
from aeon.datasets import load_classification
# 加载训练/测试集划分
X_train, y_train = load_classification("GunPoint", split="train")
X_test, y_test = load_classification("GunPoint", split="test")
# 加载完整数据集
X, y = load_classification("GunPoint")
**回归数据集**:
python
from aeon.datasets import load_regression
X_train, y_train = load_regression("Covid3Month", split="train")
X_test, y_test = load_regression("Covid3Month", split="test")
# 批量下载
from aeon.datasets import download_all_regression
download_all_regression() # 下载 Monash TSER 归档
**预测数据集**:
python
from aeon.datasets import load_forecasting
# 从 forecastingdata.org 加载
y, X = load_forecasting("airline", return_X_y=True)
**异常检测数据集**:
python
from aeon.datasets import load_anomaly_detection
X, y = load_anomaly_detection("NAB_realKnownCause")
### 文件格式加载器
**从 .ts 文件加载**:
python
from aeon.datasets import load_from_ts_file
X, y = load_from_ts_file("path/to/data.ts")
**从 .tsf 文件加载**:
python
from aeon.datasets import load_from_tsf_file
df, metadata = load_from_tsf_file("path/to/data.tsf")
**从 ARFF 文件加载**:
python
from aeon.datasets import load_from_arff_file
X, y = load_from_arff_file("path/to/data.arff")
**从 TSV 文件加载**:
python
from aeon.datasets import load_from_tsv_file
data = load_from_tsv_file("path/to/data.tsv")
**加载 TimeEval CSV**:
python
from aeon.datasets import load_from_timeeval_csv_file
X, y = load_from_timeeval_csv_file("path/to/timeeval.csv")
### 写入数据集
**写入 .ts 格式**:
python
from aeon.datasets import write_to_ts_file
write_to_ts_file(X, "output.ts", y=y, problem_name="MyDataset")
**写入 ARFF 格式**:
python
from aeon.datasets import write_to_arff_file
write_to_arff_file(X, "output.arff", y=y)
## 内置数据集
Aeon 包含多个用于快速测试的基准数据集:
### 分类
- `ArrowHead` - 形状分类
- `GunPoint` - 手势识别
- `ItalyPowerDemand` - 能源需求
- `BasicMotions` - 动作分类
- 以及来自 UCR/UEA 归档的 100 多个数据集
### 回归
- `Covid3Month` - COVID 预测
- 其他数据集...