[ PROMPT_NODE_27440 ]
bayesian_statistics
[ SKILL_DOCUMENTATION ]
# 贝叶斯统计分析
本文档提供了进行和解释贝叶斯统计分析的指南,它为频率派(经典)统计提供了一个替代框架。
## 贝叶斯与频率派哲学
### 基本差异
| 方面 | 频率派 | 贝叶斯 |
|--------|-------------|----------|
| **概率解释** | 事件的长期频率 | 信任度/不确定性 |
| **参数** | 固定但未知 | 具有分布的随机变量 |
| **推断** | 基于抽样分布 | 基于后验分布 |
| **主要输出** | p值,置信区间 | 后验概率,可信区间 |
| **先验信息** | 未正式纳入 | 通过先验明确纳入 |
| **假设检验** | 拒绝/无法拒绝零假设 | 给定数据下假设的概率 |
| **样本量** | 通常需要最小值 | 可处理任何样本量 |
| **解释** | 间接(给定 H₀ 下数据的概率) | 直接(给定数据下假设的概率) |
### 核心问题差异
**频率派**:“如果零假设为真,观察到如此极端或更极端数据的概率是多少?”
**贝叶斯**:“给定观察到的数据,假设为真的概率是多少?”
贝叶斯问题更直观,直接解决了研究者想要知道的内容。
---
## 贝叶斯定理
**公式**:
P(θ|D) = P(D|θ) × P(θ) / P(D)
**文字描述**:
后验 = 似然 × 先验 / 证据
其中:
- **θ (theta)**:感兴趣的参数(例如,均值差、相关性)
- **D**:观测数据
- **P(θ|D)**:后验分布(看到数据后对 θ 的信念)
- **P(D|θ)**:似然(给定 θ 下数据的概率)
- **P(θ)**:先验分布(看到数据前对 θ 的信念)
- **P(D)**:边际似然/证据(归一化常数)
---
## 先验分布
### 先验类型
#### 1. 信息先验
**何时使用**:当你拥有来自以下方面的实质性先验知识时:
- 既往研究
- 专家知识
- 理论
- 试点数据
**示例**:元分析显示效应量 d ≈ 0.40,SD = 0.15
- 先验:正态分布(0.40, 0.15)
**优势**:
- 纳入现有知识
- 更高效(所需样本量更小)
- 可以稳定小样本数据的估计
**劣势**:
- 主观性(但主观性也可能是优势)
- 必须合理且透明
- 如果过于强硬可能会引起争议