메모리 ECC 수정 가능 오류 및 이벤트를 트리거하는 경우 안내서
시스템 이벤트 로그(SEL)에 로그인된 ECC 수정 가능한 오류 이벤트를 처리할 때 따라야 할 단계
ECC 수정 가능한 오류는 주어진 기간 내에 주어진 듀얼 인라인 메모리 모듈(DIMM)에 대한 임계값 오버플로를 나타냅니다.
- 치명적인 문제(퍼플 스크린 오브 데스(PSOD) 또는 예기치 않은 재시작)이 없는 경우, 각 DIMM 위치에 대해 24시간마다 10개 미만의 이벤트인 Adaptive Double Device Data Correction(ADDDC) 오류를 포함한 수정 가능한 ECC 오류가 임계값 제한 내에 있는 경우, 이벤트를 트리거하는 각 DIMM 위치마다 ECC 오류의 재발을 모니터링하는 것이 좋습니다.
- 치명적인 문제(퍼플 스크린 오브 데스(PSOD) 또는 예기치 않은 재시작)이 있고 각 DIMM 위치에 대해 24시간마다 10개 이상의 이벤트인 Adaptive Double Device Data Correction(ADDDC) 오류를 포함한 수정 가능한 ECC 오류가 있는 경우 아래 단계에 따라 각 DIMM 위치를 다시 앉는 것이 좋습니다.
- 시스템 전원을 끄고 AC 전원 케이블을 제거합니다.
- 다시 앉을 DIMM 위치를 식별하고 서버 플랫폼의 기술 제품 사양을 참조하여 DIMM 위치를 식별합니다.
- 식별된 DIMM의 재시트 수행
- 삽입 AC 전원 케이블 및 시스템 전원 켜 기
- ECC 오류의 재발에 대해 24시간 동안 관찰하십시오.
- ECC 오류가 다시 앉은 동일한 DIMM 위치로 지속되면 BMC 웹 콘솔에서 생성된 SEL 및 디버그 로그를 생성하여 인텔 고객 지원팀으로 보냅니 다.
노트 |
ECC(오류 수정 코드) 오류는 자체 수정입니다. 메모리의 안정성 가용성 서비스 가능성(RAS) 구성에 따라 IMC(통합 메모리 컨트롤러)가 영향을 받는 DIMM을 오프라인으로 전환할 수 있습니다. |
다른 인텔 서버 플랫폼의 경우 이벤트 정의에 몇 가지 차이점이 있습니다. 서버 플랫폼에 대한 시스템 이벤트 로그 문제 해결 가이드 를 참조하십시오. | |
인텔은 서버 플랫폼에 사용할 수 있는 최신 버전으로 시스템 BIOS를 다운로드 하고 업데이트할 것을 권장합니다. | |
시스템이 Nutanix* 엔터프라이즈 클라우드 플랫폼 인증을 받은 인텔® 데이터 센터 시스템인 경우 Nutanix* 라이프 사이클 관리자 페이지를 방문하십시오. 하드웨어 및 펌웨어 호환성 목록은 Nutanix* 하드웨어 및 펌웨어 호환성 페이지를 참조하십시오. |