1️. Disaster Recovery
Disaster(재해) 비즈니스 연속성 또는 재무 상태에 부정적 영향을 주는 모든 이벤트
Disaster Recovery(DR)의 목적
- 재해에 대비
- 재해 발생 시 복구
DR 시나리오 유형
-
On-Premise → On-Premise
→ 전통적 DR, 매우 고비용
-
On-Premise → AWS Cloud
→ Hybrid Recovery
-
AWS Region A → AWS Region B
→ Multi-Region DR
2️. RPO & RTO
RPO (Recovery Point Objective)
- 허용 가능한 데이터 손실 시점
- 마지막 백업 이후 얼마나 데이터 손실을 감수할 수 있는가
RTO (Recovery Time Objective)
- 허용 가능한 서비스 중단 시간
- 얼마나 빨리 서비스를 복구해야 하는가
Disaster 발생
├─ RPO →Data Loss 허용 범위
└─ RTO → Downtime 허용 범위
3️. Disaster Recovery 전략 종류
RTO가 짧아질수록 비용은 증가
- Backup & Restore
- Pilot Light
- Warm Standby
- Hot Site / Multi-Site
4️. Backup & Restore 전략 (High RPO)
특징
- 가장 단순
- 가장 저렴
- RPO / RTO 가장 큼
구성 요소
- S3 / S3 IA / Glacier
- EBS Snapshot
- RDS Snapshot
- AMI
- Snowball / Storage Gateway
아키텍처 흐름
On-Prem /Primary
├─ EBSSnapshot
├─ RDSSnapshot
├─ AMI
└─ S3 / Glacier (Lifecycle)
↓
Disaster 발생
↓
AWS Cloud
├─ EC2 (AMI 복원)
└─ RDS (Snapshot 복원)
5️. Pilot Light 전략
핵심 시스템만 항상 켜져 있는 상태
특징
- Backup & Restore와 유사
- 핵심 DB는 항상 실행
- EC2는 중단 상태
- RTO는 Backup & Restore보다 짧음
아키텍처
On-Prem
└─ Data Replication
↓
AWS Cloud
├─ RDS (Running)
├─ EC2 (Stopped)
└─ Route53
6️. Warm Standby 전략
전체 시스템이 최소 규모로 항상 실행
특징
- 전체 스택이 동작 중
- 장애 시 스케일 업
- 비용과 RTO의 균형점
아키텍처
On-Prem
└─ DataReplication
↓
AWS Cloud
├─ RDSReadReplica (Running)
├─ EC2 Auto Scaling (Min)
├─ ELB
└─ Route53 Failover
7️. Hot Site / Multi-Site 전략
Active-Active 운영
특징
- 매우 낮은 RTO (초~분)
- 가장 비싼 전략
- 전체 프로덕션 스케일 상시 운영
아키텍처
On-Prem / Region A
├─ ELB
├─ EC2 ASG (Prod)
└─ DB (Master)
AWS / Region B
├─ ELB
├─ EC2 ASG (Prod)
└─ DB (Replica)
Route53 → Active-Active
8️. All AWS Multi-Region DR
AWS 네이티브 구성
RegionA
├─ALB
├─EC2ASG
└─AuroraGlobal(Writer)
RegionB
├─ALB
├─EC2ASG
└─AuroraGlobal(Reader)
Route53 →Failover/Active-Active
9️. Disaster Recovery 핵심
Backup
- EBS Snapshot
- RDS Automated Backup / Snapshot
- S3 + Lifecycle + CRR
- Snowball / Storage Gateway
High Availability
- Route 53 Failover
- RDS Multi-AZ
- ElastiCache Multi-AZ
- EFS / S3
Replication
- RDS Cross-Region Replica
- Aurora Global Database
- On-Prem DB → RDS Replication
Automation
- CloudFormation / Elastic Beanstalk
- CloudWatch Alarm → EC2 Recover
- Lambda 자동화
- Chaos Engineering (Netflix Simian Army)
10. AWS DMS (Database Migration Service)
데이터베이스 마이그레이션 서비스
특징
- 소스 DB 중단 없이 마이그레이션
- 자동 복구(Self-healing)
- CDC 기반 지속 복제
마이그레이션 유형
- Homogeneous
- Oracle → Oracle
- Heterogeneous
- SQL Server → Aurora
기본 구조
Source DB
└─ DMS Replication Instance (EC2)
└─ Target DB
1️1. DMS 소스 & 타겟
Sources
- On-Prem / EC2: Oracle, SQL Server, MySQL, PostgreSQL, MongoDB 등
- Amazon RDS (Aurora 포함)
- Amazon S3
- Azure SQL Database
Targets
- Amazon RDS
- Redshift
- DynamoDB
- S3
- OpenSearch
- Kinesis
- Kafka
- Neptune / DocumentDB
- Redis / Babelfish
1️2. AWS Schema Conversion Tool (SCT)
DB 엔진 변경 시 스키마 변환
사용 목적
- Oracle / SQL Server → MySQL / PostgreSQL / Aurora
- Teradata / Oracle → Redshift
특징
- 동일 엔진 마이그레이션 시 불필요
- 컴퓨트 집약적 → 고성능 인스턴스 권장
Source DB
├─ SCT (Schema 변환)
└─ DMS (Data 복제)
Target DB
1️3. DMS Continuous Replication
전체 흐름
On-Prem Oracle
└─ DMSReplication Instance
├─FullLoad
└─ CDC
↓
Amazon RDS MySQL
- SCT 서버 별도 사용
1️4. DMS Multi-AZ 배포
특징
- Standby Replication Instance 자동 생성
- AZ 간 동기 복제
- I/O Freeze 제거
- 지연 시간 스파이크 최소화
1️5. RDS & Aurora MySQL 마이그레이션
RDS MySQL → Aurora MySQL
- RDS Snapshot → Aurora Restore
- Aurora Read Replica 생성 → Promote
External MySQL → Aurora MySQL
- Percona XtraBackup → S3 → Aurora
- mysqldump → Aurora
- DMS 사용 (운영 중 DB)
1️6. RDS & Aurora PostgreSQL 마이그레이션
RDS PostgreSQL → Aurora PostgreSQL
- Snapshot Restore
- Read Replica Promote
External PostgreSQL
- Backup → S3
aws_s3확장으로 Import- 또는 DMS
1️7. On-Premise → AWS 마이그레이션 전략
주요 서비스
- Amazon Linux 2 VM 이미지 사용
- VM Import / Export
- AWS Application Discovery Service
- AWS Migration Hub
- AWS DMS
- AWS Server Migration Service (SMS)
- AWS Application Migration Service (MGN)
1️8. AWS Backup
중앙 집중형 백업 서비스
지원 리소스
- EC2 / EBS
- S3
- RDS / Aurora / DynamoDB
- EFS / FSx
- Storage Gateway
- DocumentDB / Neptune
특징
- Cross-Region / Cross-Account
- PITR 지원
- 태그 기반 정책
1️9. Backup Plan 구성
설정 요소
- 백업 주기 (시간 / 일 / 주 / 월 / Cron)
- Backup Window
- Cold Storage 전환 시점
- Retention 기간
Backup Plan
└─ Tag 기반 리소스 자동 백업
└─ S3 (내부 저장)
2️0. AWS Backup Vault Lock
WORM (Write Once Read Many)
특징
- 백업 삭제 / 보존기간 변경 불가
- Root 계정도 삭제 ❌
- 랜섬웨어 대응
2️1. AWS Application Discovery Service
목적
- 온프레미스 서버 분석
- 의존성 매핑
- 리소스 사용량 수집
방식
- Agentless
- Agent-based
→ 결과는 AWS Migration Hub에서 시각화
2️2. AWS Application Migration Service (MGN)
CloudEndure 기반 Lift & Shift
특징
- 지속적 블록 단위 복제
- 최소 다운타임
- 물리 / 가상 / 클라우드 서버 지원
흐름
SourceServer
└─Replication Agent
└─ Staging Area
└─ Cutover
└─ Target EC2
2️3. VMware Cloud on AWS
사용 배경
- 기존 VMware 운영 환경 유지
- DR / 확장 목적
아키텍처
On-Prem vCenter
└─ VMware Cloudon AWS
├─ vSphere
├─ DirectConnect
└─ AWS Services (S3, RDS, FSx)
2️4. 대용량 데이터 전송 전략 비교
예: 200TB 데이터
인터넷 (100Mbps)
- 약 185일
Direct Connect (1Gbps)
- 약 18.5일
- 설치까지 1개월+
Snowball
- 2~3대 병렬 사용
- 약 1주
- DMS와 병행 가능
지속 복제
- VPN / DX + DMS
- DataSync
✅ DR & Migration 요약
RPO / RTO 정의 → DR 전략 선택 → 데이터 복제 → 자동화 → 정기 테스트