[ PROMPT_NODE_24906 ]
backup-recovery
[ SKILL_DOCUMENTATION ]
# 备份与灾难恢复
备份策略、灾难恢复规划、业务连续性及 IT 运维数据保护的综合指南。
## 目录
- [备份策略](#backup-strategy)
- [备份类型](#backup-types)
- [备份工具](#backup-tools)
- [灾难恢复规划](#disaster-recovery-planning)
- [业务连续性](#business-continuity)
- [恢复测试](#recovery-testing)
- [云备份解决方案](#cloud-backup-solutions)
- [数据库备份](#database-backups)
- [备份监控](#backup-monitoring)
## 备份策略
### 3-2-1 备份规则
yaml
黄金标准:3-2-1 规则
3 份数据副本:
- 1 份生产副本
- 2 份备份副本
2 种不同介质类型:
- 本地存储 (NAS, SAN)
- 云存储 (S3, Azure Blob)
- 或者:磁盘 + 磁带
1 份异地副本:
- 地理位置隔离
- 防御站点灾难
- 云存储或远程数据中心
实施示例:
生产:数据库服务器(主)
备份 1:本地 NAS(每小时快照)
备份 2:云存储 S3(每日备份)
结果:3 份副本,2 种介质(磁盘 + 云),1 份异地(云)
### 备份策略框架
yaml
RPO (恢复点目标):
定义:最大可接受的数据丢失量(时间)
问题:“我们能承受丢失多少数据?”
示例:
关键数据库:RPO = 15 分钟(需要事务日志备份)
文件服务器:RPO = 24 小时(每日备份可接受)
开发服务器:RPO = 7 天(每周备份)
RTO (恢复时间目标):
定义:最大可接受的停机时间(时间)
问题:“我们需要多快恢复?”
示例:
电子商务网站:RTO = 1 小时(热备,快速恢复)
内部工具:RTO = 8 小时(从备份恢复)
归档数据:RTO = 72 小时(从磁带/Glacier 恢复)
保留策略:
每日备份:保留 7 天
每周备份:保留 4 周
每月备份:保留 12 个月
年度备份:保留 7 年(合规)
祖父-父亲-儿子 (GFS) 轮换:
儿子:每日备份(7 天)
父亲:每周备份(4 周)
祖父:每月备份(12 个月)
### 备份矩阵
| 系统 | 关键性 | RPO | RTO | 备份频率 | 保留期 | 方法 |
|--------|-------------|-----|-----|------------------|-----------|--------|
| 生产数据库 | 关键 | 15 分钟 | 1 小时 | 持续(事务日志)+ 每日全量 | 30 天 | 复制 + 快照 |
| 应用服务器 | 高 |