1️-1. Amazon CloudWatch Metrics
개념
- CloudWatch는 AWS 모든 서비스의 메트릭 제공
- Metric: 모니터링 대상 변수
- 예:
CPUUtilization,NetworkIn
- 예:
- Namespace: 메트릭 그룹
- Dimension: 메트릭의 속성
- 예: InstanceId, Environment
- 메트릭당 최대 30개
- 모든 메트릭은 Timestamp 포함
기능
- CloudWatch Dashboard 생성
- Custom Metrics 생성 가능
- 예: RAM 사용량
1-2. CloudWatch Metric Streams
CloudWatch 메트릭을 거의 실시간으로 외부로 스트리밍
특징
- 낮은 지연 시간
- 스트리밍 대상
- Kinesis Data Firehose
- Datadog, Dynatrace, New Relic, Splunk, Sumo Logic 등
- 특정 메트릭만 필터링 가능
구조
CloudWatch Metrics
└─ Metric Streams
└─ Kinesis Data Firehose
├─ Amazon S3
├─ Amazon Redshift
├─ Amazon OpenSearch
└─ Athena
1-3. CloudWatch Logs
구성 요소
- Log Group
- 애플리케이션 단위
- Log Stream
- 인스턴스 / 컨테이너 / 파일 단위
주요 기능
- 로그 보존 기간 설정
- 1일 ~ 10년 / 영구 보존
- 기본 암호화 적용
- KMS 기반 사용자 지정 키 가능
로그 전달 대상
- Amazon S3
- Kinesis Data Streams
- Kinesis Data Firehose
- AWS Lambda
- Amazon OpenSearch
1-4. CloudWatch Logs – 로그 수집 소스
- SDK
- CloudWatch Logs Agent
- CloudWatch Unified Agent
- Elastic Beanstalk
- ECS (컨테이너)
- AWS Lambda
- VPC Flow Logs
- API Gateway
- CloudTrail (필터 기반)
- Route 53 (DNS Query 로그)
1-5. CloudWatch Logs Insights
CloudWatch Logs에 저장된 로그를 쿼리 분석
특징
- 전용 쿼리 언어 제공
- AWS 서비스 로그 & JSON 로그 필드 자동 인식
- 기능
- 필드 선택
- 조건 필터링
- 집계
- 정렬
- 결과 제한
- 여러 Log Group / 계정 조회 가능
- 실시간 엔진 ❌ (쿼리 엔진)
활용 예
- 특정 IP 검색
- ERROR 로그 횟수 집계
- 대시보드에 쿼리 결과 추가
1-6. CloudWatch Logs – S3 Export
특징
- 로그가 최대 12시간 후 Export 가능
- API:
CreateExportTask - 실시간/준실시간 ❌
👉 실시간 처리는 Logs Subscription 사용
1-7. CloudWatch Logs Subscriptions
로그를 실시간/준실시간으로 외부로 전달
대상
- Kinesis Data Streams
- Kinesis Data Firehose
- AWS Lambda
구조
CloudWatch Logs
└─SubscriptionFilter
├─ Lambda (Real-time)
├─ Kinesis Data Streams
└─ Kinesis Data Firehose
└─ OpenSearch / S3
1-8. CloudWatch Logs Aggregation
Multi-Account · Multi-Region
AccountA (Region1)
└─ CloudWatch Logs
└─ SubscriptionFilter
└─ Kinesis Data Firehose
└─ S3
AccountB (Region2,3)
└─ 동일 구조
- 중앙 S3로 로그 집계 가능
2. Cross-Account Logs Subscription
개념
- 다른 AWS 계정의 Kinesis로 로그 전송
필수 요소
- Destination Access Policy
- Cross-Account IAM Role
PutRecord권한 허용
3. EC2 로그 수집 – 기본 원칙
- EC2는 기본적으로 로그 전송 ❌
- 반드시 Agent 설치 필요
사용 가능 위치
- EC2
- On-Premise 서버
4. CloudWatch Logs Agent vs Unified Agent
CloudWatch Logs Agent
- 구형
- 로그만 수집
CloudWatch Unified Agent
- 로그 + 시스템 메트릭
- RAM, 프로세스 등 수집
- SSM Parameter Store 기반 중앙 설정
5. Unified Agent – 수집 메트릭
- CPU (user, system, idle 등)
- Disk (free, used, IO, IOPS)
- RAM (free, used, cached)
- Network
- Processes
- Swap Space
EC2 기본 메트릭은 고수준(CPU, Disk, Network)만 제공
1️-9. CloudWatch Alarms
개념
- 메트릭 기반 알림 트리거
상태
- OK
- INSUFFICIENT_DATA
- ALARM
설정 요소
- Period (초 단위)
- High Resolution Metrics
- 10초 / 30초 / 60초 단위
1️-10. CloudWatch Alarm 대상
- EC2
- Stop / Terminate / Reboot / Recover
- Auto Scaling Action
- Amazon SNS 알림
6. Composite Alarms
여러 Alarm 상태를 조합
특징
- AND / OR 조건
- 알람 노이즈 감소
AlarmA (CPU)
AlarmB (IOPS)
└─ Composite Alarm
└─ SNS
7. EC2 Instance Recovery
Status Check
- Instance Status (VM)
- System Status (하드웨어)
- EBS 상태
복구 특징
- IP, 메타데이터, Placement Group 유지
8. Alarm – 추가 팁
- Logs Metric Filter 기반 Alarm 가능
- CLI로 강제 테스트
aws cloudwatch set-alarm-state \\
--alarm-name"myalarm" \\
--state-value ALARM \\
--state-reason"testing"9. Amazon EventBridge (구 CloudWatch Events)
기능
- 스케줄 기반 (Cron)
- 이벤트 기반 트리거
대상
- Lambda
- SQS
- SNS
- Step Functions
- ECS / Batch
9-1. EventBridge Rules
이벤트 소스
- EC2 상태 변경
- CodeBuild 실패
- S3 업로드
- Trusted Advisor
- CloudTrail API Call
- Cron Schedule
구조
Event Source
└─ EventBridge Rule
└─ Target (Lambda / SNS / SQS /Step Functions 등)
9-2. EventBridge Event Bus
- Default Event Bus
- Partner Event Bus
- Custom Event Bus
- Cross-Account 접근 가능
- 이벤트 아카이빙 & 재생
9-3. EventBridge Schema Registry
기능
- 이벤트 자동 분석
- 스키마 추론
- 코드 자동 생성
- 버전 관리
9-4. EventBridge Resource-based Policy
Event Bus 접근 제어
- 계정/리전 단위 허용·차단
- 조직 단위 중앙 이벤트 수집
1-11. CloudWatch Container Insights
대상
- ECS
- EKS
- Kubernetes on EC2
- Fargate
기능
- 컨테이너 메트릭 & 로그 수집
- Kubernetes는 Agent 컨테이너 사용
1-12. CloudWatch Lambda Insights
기능
- Lambda 전용 모니터링
- CPU Time
- Memory
- Disk / Network
- Cold Start
- Worker Shutdown
Lambda Layer 형태로 제공
1-13. CloudWatch Contributor Insights
목적
- Top-N Contributor 분석
예시
- 가장 많은 트래픽 IP
- 오류를 가장 많이 발생시키는 URL
기반
- CloudWatch Logs
1-14. CloudWatch Application Insights
특징
- 애플리케이션 자동 대시보드
- SageMaker 기반 분석
- 지원 기술
- EC2
- Java, .NET, IIS
- RDS, EBS, ELB, ASG
- Lambda, SQS, DynamoDB, S3, ECS, EKS, SNS, API Gateway
결과
- EventBridge
- SSM OpsCenter
10. AWS CloudTrail
감사 · 거버넌스 · 컴플라이언스
특징
- 기본 활성화
- 모든 API 호출 기록
- Console / SDK / CLI / AWS Service 포함
- 로그 대상
- CloudWatch Logs
- S3
10-1. CloudTrail 이벤트 유형
Management Events
- 기본 활성화
- 리소스 설정 변경
- Read / Write 분리 가능
Data Events
- 기본 비활성화
- S3 Object API
- Lambda Invoke
Insights Events
- 이상 징후 탐지
10-2. CloudTrail Insights
탐지 대상
- 비정상 리소스 프로비저닝
- 서비스 제한 초과
- IAM 액션 폭증
- 정기 작업 누락
흐름
CloudTrail
└─ Insights 분석
├─ 콘솔 표시
├─ S3 저장
└─ EventBridge 이벤트
10-3. CloudTrail 로그 보존
- 기본 90일
- 장기 보관:
CloudTrail
└─ S3
└─ Athena 분석
11. EventBridge + CloudTrail 활용
- 특정 API 호출 감지
- 예:
DeleteTable - 자동 알림 / 자동화 대응 가능
12-1. AWS Config
리소스 설정 변경 & 컴플라이언스 추적
질문 예
- SSH 0.0.0.0/0 열려 있는가?
- S3 Public Access 있는가?
- ALB 설정이 언제 바뀌었는가?
특징
- 리전 단위 서비스
- 멀티 리전·멀티 계정 집계 가능
- S3 저장 → Athena 분석
12-2. AWS Config Rules
유형
- AWS Managed Rule (75+)
- Custom Rule (Lambda)
평가 방식
- 설정 변경 시
- 주기적 평가
제한
- 차단 ❌ (감지만 가능)
12-3. Config Resource View
- 컴플라이언스 이력
- 설정 변경 타임라인
- 관련 CloudTrail API 호출
12-4. Config Remediation
자동 조치
- SSM Automation Document
- Lambda 호출 가능
- 재시도 설정 가능
12-5. Config Notifications
- EventBridge 연계
- SNS / SQS / Lambda
- 모든 변경 이벤트 또는 필터링 가능
13. CloudWatch vs CloudTrail vs Config
CloudWatch
- 성능 모니터링
- 로그
- 알림
CloudTrail
- API 호출 기록
- 감사
AWS Config
- 설정 변경
- 컴플라이언스
14. ELB 예시 비교
CloudWatch
- 트래픽
- 에러율
- 성능 대시보드
Config
- SG 변경 추적
- SSL 설정 컴플라이언스
CloudTrail
- 누가 ELB 설정 변경했는지 추적