1. 개요
EC2의 상태 확인 유형의 두가지에 대해서 이해하고 이슈 시 해결방법에 대해서 정리하고자
EC2
2. System Status
인스턴스가 실행되는 물리적 호스트를 모니터링합니다.(AWS 플랫폼 영역)
EC2 > Monitoring > Status Check Failed(System) 확인
2-1. 원인
물리호스트 네트웍 연결 끊김
물리호스트 전원 중단
물리호스트 S/W 이슈
N/W연결과 관련한 물리호스트의 하드웨어 문제
2-2. 해결방안
일반적으로 AWS측 개입이 필요하며 AWS에서 문제를 해결할 때까지 기다립니다.
직접 인스턴스 중지한 후 시작할 수 있으며 이 경우 EC2 인스턴스가 새 물리호스트로 마이그레이션합니다.
3. Instance Status
개별 인스턴스 내부에 대한 소프트웨어 및 N/W 구성 등을 모니터링합니다.(OS 영역)
EC2 > Monitoring > Status Check Failed(instance) 확인
3-1. 원인
잘못된 N/W 구성 또는 스타트업 구성
Memory가 모두 사용됨
Filesystem 손상 또는 호환되지 않는 커널
기타 OS 손상
3-2. 해결방안
일반적으로 사용자가 인스턴스 재부팅을 하거나 인스턴스 구성을 변경하는 등의 방법으로 문제해결이 필요합니다.
→ 문제발생 이전으로 OS영역의 복구 필요하며 "4. OS루트영역 복구 방안" 참조
4. OS루트영역 복구방안
1. 문제발생 이전의 루트볼륨 snapshot을 기반으로 볼륨생성 후 루트볼륨 교체
2. 문제발생한 루트볼륨을 다른 인스턴스에 데이터 볼륨으로 연결 후 설정 파라미터를 변경한다.(Linux → 커널 파라미터 파일 수정, Windows → EC2Rescue를 이용한 수정)