AWS Health Dashboard 활용 3단계
1단계: 계정 맞춤형 이벤트 확인 (Your Account Health)
가장 먼저 확인해야 할 곳은 퍼블릭 상태 페이지가 아니라, 로그인 후 진입하는 [Your account health] 섹션입니다.
Open and recent issues: 현재 진행 중이거나 최근 7일 이내에 발생한 장애/이슈를 보여줍니다.
Scheduled changes: 가장 중요한 탭입니다. EC2 인스턴스 교체, RDS 보안 패치, 하드웨어 점검 등 미래에 예정된 모든 작업이 여기에 표시됩니다.
Other notifications: 인증서 만료 안내나 서비스 지원 종료(Deprecation) 같은 일반적인 공지사항을 확인할 수 있습니다.
2단계: 영향받는 리소스(Affected Resources) 파악
이벤트 제목만 보고 당황할 필요 없습니다. 구체적으로 어떤 자원이 위험한지 바로 확인할 수 있습니다.
이벤트 목록에서 특정 항목(예:
EC2 Instance Scheduled Maintenance)을 클릭합니다.하단의 [Affected resources] 탭을 클릭하세요.
영향을 받는 인스턴스 ID, 볼륨 ID 등이 나열됩니다. 이를 통해 "아, 개발 서버만 점검 대상이구나"와 같이 상황을 정확히 판단할 수 있습니다.
3단계: 상세 타임라인 및 권장 조치 확인
AWS 엔지니어가 작성한 상세 설명과 대응 가이드가 포함되어 있습니다.
Description: "언제부터 언제까지 점검이 진행되며, 어떤 현상이 발생할 수 있는지" 상세히 적혀 있습니다.
Recommended Action: "인스턴스를 미리 재시작하세요" 또는 "스냅샷을 생성해 두세요" 같은 구체적인 가이드를 제공합니다.
잊지 않게 알림 설정하기 (Notifications)
매일 대시보드에 들어와서 확인할 수는 없습니다.
방법 A: AWS User Notifications (간편 설정)
특징: 콘솔 모바일 앱 푸시, 이메일, Chatbot(Slack)으로 가장 빠르게 리포트를 보내줍니다.
설정: AWS User Notifications 콘솔 → [알림 구성 생성] → 서비스 이름을
Health로 선택하고 원하는 전송 채널을 연결하면 끝입니다.
방법 B: Amazon EventBridge (자동화)
특징: 이슈가 감지되면 자동으로 서버를 다른 곳으로 옮기거나 복구 스크립트를 실행하는 등 자동 조치가 가능합니다.
설정:
aws.health소스의 이벤트를 감지하여 Lambda나 SNS로 전달하는 규칙(Rule)을 만듭니다.
서비스 상태 대시보드 비교
항목 | Service Health (Public) | Your Account Health (Personal) |
접속 주소 | ||
내용 | 모든 리전/서비스의 전체 상태 | 내 리소스에 영향을 주는 이벤트만 |
상세도 | 일반적인 장애 현상 공지 | 영향받는 구체적 리소스 ID 포함 |
권장 용도 | AWS 전반의 대규모 장애 확인 | 실제 운영 중인 서비스 대응 및 점검 계획 |
Tip
Scheduled changes는 '데드라인'입니다.
특히 EC2나 RDS의 하드웨어 폐기(Retirement) 관련 일정을 무시하면, 정해진 시간에 AWS가 강제로 인스턴스를 중지하거나 재부팅합니다. 베스트 프랙티스는 점검 시간 최소 24시간 전에 사용자가 직접 재시작(Stop-Start)을 수행하는 것입니다. 그러면 점검 대상이 아닌 새로운 하드웨어로 미리 옮겨지기 때문에, 원치 않는 시간에 서비스가 끊기는 사고를 100% 예방할 수 있습니다.
댓글
댓글 0개
이 문서에는 댓글을 달 수 없습니다.