[ PROMPT_NODE_27368 ]
cox-models
[ SKILL_DOCUMENTATION ]
# Cox 比例风险模型
## 概述
Cox 比例风险模型是半参数模型,用于将协变量与事件发生时间联系起来。个体 *i* 的风险函数表示为:
**h_i(t) = h_0(t) × exp(β^T x_i)**
其中:
- h_0(t) 是基准风险函数(未指定)
- β 是系数向量
- x_i 是个体 *i* 的协变量向量
关键假设是两个个体之间的风险比随时间保持恒定(比例风险假设)。
## CoxPHSurvivalAnalysis
用于生存分析的基础 Cox 比例风险模型。
### 何时使用
- 带有删失数据的标准生存分析
- 需要可解释的系数(对数风险比)
- 比例风险假设成立
- 数据集特征相对较少
### 关键参数
- `alpha`: 正则化参数(默认:0,无正则化)
- `ties`: 处理并列事件时间的方法('breslow' 或 'efron')
- `n_iter`: 优化的最大迭代次数
### 示例用法
python
from sksurv.linear_model import CoxPHSurvivalAnalysis
from sksurv.datasets import load_gbsg2
# 加载数据
X, y = load_gbsg2()
# 拟合 Cox 模型
estimator = CoxPHSurvivalAnalysis()
estimator.fit(X, y)
# 获取系数(对数风险比)
coefficients = estimator.coef_
# 预测风险评分
risk_scores = estimator.predict(X)
## CoxnetSurvivalAnalysis
带有弹性网络惩罚的 Cox 模型,用于特征选择和正则化。
### 何时使用
- 高维数据(特征较多)
- 需要自动特征选择
- 需要处理多重共线性
- 需要稀疏模型
### 惩罚类型
- **岭回归 (L2)**: alpha_min_ratio=1.0, l1_ratio=0
- 收缩所有系数
- 当所有特征都相关时效果良好
- **Lasso (L1)**: l1_ratio=1.0
- 执行特征选择(将系数设为零)
- 适用于稀疏模型
- **弹性网络**: 0 < l1_ratio < 1
- L1 和 L2 的组合
- 平衡特征选择和分组
### 关键参数
- `l1_ratio`: L1 和 L2 惩罚之间的平衡(0=岭回归, 1=Lasso)
- `alpha_min_ratio`: 正则化路径中最小惩罚与最大惩罚的比率
- `n_alphas`: 正则化路径上的 alpha 数量
- `fit_baseline_model`: 是否拟合无惩罚的基准模型
### 示例用法
python
from sksurv.linear_model import CoxnetSurvivalAnalysis
# 使用弹性网络惩罚拟合
estimator = CoxnetSurvivalAnalysis(l1_ratio=0.5, alpha_min_ratio=0.01)
estimator.fit(X, y)