1. 개요 

EC2의 상태 확인 유형의 두가지에 대해서 이해하고 이슈 시 해결방법에 대해서 정리하고자 

EC2 

 

2. System Status

인스턴스가 실행되는 물리적 호스트를 모니터링합니다.(AWS 플랫폼 영역)
EC2 > Monitoring > Status Check Failed(System) 확인
 

2-1. 원인

물리호스트 네트웍 연결 끊김
물리호스트 전원 중단
물리호스트 S/W 이슈
N/W연결과 관련한 물리호스트의 하드웨어 문제
 

2-2. 해결방안

일반적으로 AWS측 개입이 필요하며 AWS에서 문제를 해결할 때까지 기다립니다.
직접 인스턴스 중지한 후 시작할 수 있으며 이 경우 EC2 인스턴스가 새 물리호스트로 마이그레이션합니다.
 
 
 

3. Instance Status

개별 인스턴스 내부에 대한 소프트웨어 및 N/W 구성 등을 모니터링합니다.(OS 영역)
EC2 > Monitoring > Status Check Failed(instance) 확인
 

3-1. 원인

잘못된 N/W 구성 또는 스타트업 구성
Memory가 모두 사용됨
Filesystem 손상 또는 호환되지 않는 커널
기타 OS 손상
 

3-2. 해결방안

일반적으로 사용자가 인스턴스 재부팅을 하거나 인스턴스 구성을 변경하는 등의 방법으로 문제해결이 필요합니다. 
→ 문제발생 이전으로 OS영역의 복구 필요하며 "4. OS루트영역 복구 방안" 참조
 
 
 
 

4. OS루트영역 복구방안

1. 문제발생 이전의 루트볼륨 snapshot을 기반으로 볼륨생성 후 루트볼륨 교체 
2. 문제발생한 루트볼륨을 다른 인스턴스에 데이터 볼륨으로 연결 후 설정 파라미터를 변경한다.(Linux → 커널 파라미터 파일 수정, Windows → EC2Rescue를 이용한 수정)