인텔® 서버 보드의 수정 가능한/수정 불가능한 ECC 메모리 오류에 대한 기본 진단
참고 | 이 문서에서 설명하는 문제 해결에 대한 지원은 서버 플랫폼에 대한 기술 제품 사양을 참조하십시오. |
어떤 것을 보게 됩니까?
메모리 모듈에 대한 수정 가능 및/또는 수정 불능 오류 정정 코드(ECC) 이벤트. 예를 들어:
Mmry ECC 센서 SMI 핸들러 경고 메모리 CPU: 1, DIMM: D0 DIMM 순위: 1. - 수정 가능한 ECC/기타 수정 가능한 메모리 오류 - 주장됨.
메모리 오류 정정 코드(ECC) 수정 가능 오류 이벤트란 무엇입니까?
ECC 수정 가능 오류는 주어진 시간 내에 주어진 듀얼 인라인 메모리 모듈(DIMM)에 대한 임계값 오버플로우를 나타냅니다.
해결 방법:
메모리 데이터 오류는 수정 가능 또는 수정 불가능으로 기록됩니다. 발생한 오류 유형에 따라 아래 지침을 참조하십시오 .
노트 |
|
- 치명적인 문제(PSOD(Purple Screen of Death) 또는 예기치 않은 재시작)가 없고 ADDDC(Adaptative Double Device Data Correction) 오류를 포함하여 수정 가능한 ECC 오류가 각 DIMM 위치에 대해 24시간마다 10개 미만의 이벤트(임계값 한도 내에 있는 경우)인 경우 이벤트를 트리거하는 각 DIMM 위치에서 ECC 오류가 재발하는지 서버를 모니터링하는 것이 좋습니다.
- 치명적인 문제(PSOD(Purple Screen of Death) 또는 예기치 않은 재시작)가 있고 ADDDC(Adaptative Double Device Data Correction) 오류를 포함하여 수정 가능한 ECC 오류가 각 DIMM 위치에 대해 24시간마다 10개 미만의 이벤트인 경우 아래 단계에 따라 각 DIMM 위치를 재장착 하는 것이 좋습니다.
- 고급 메모리 테스트(AMT) 기능은 인텔® 서버 시스템 S2600BP, S2600WF 및 S2600ST용 BIOS 개정 02.01.0014부터 BIOS 및 펌웨어 스택에 도입되었습니다. 인텔® 서버 시스템 S9200WK에 대한 BIOS 개정 22.01.0097부터 시작합니다. 이러한 제품의 경우 BIOS 설정 유틸리티를 통해 고급 메모리 테스트(AMT) 및 사후 패키지 복구(PPR) 기능을 활성화하여 메모리 상태를 전체적으로 확인할 것을 권장합니다. 자세한 단계는 인텔 62X 칩셋 기반 인텔® 서버 제품에 대한 메모리 교체 지침 및 고급 메모리 테스트 백서 의 5장을 참조하십시오.
노트 | 오류 정정 코드(ECC) 오류는 자동으로 정정됩니다. 메모리의 RAS(Reliability Availability Serviceability) 구성에 따라 IMC(Integrated Memory Controller)가 영향을 받는 DIMM을 오프라인으로 전환할 수 있습니다. |
인텔 서버 플랫폼마다 이벤트 정의에 약간의 차이가 있습니다. 서버 플랫폼의 시스템 이벤트 로그 문제 해결 가이드 를 참조하십시오 | |
인텔은 시스템 BIOS를 다운로드해서 서버 플랫폼에 맞는 최신 버전으로 업데이트할 것을 권장합니다. | |
시스템이 Nutanix* 엔터프라이즈 클라우드용 인텔® 데이터 센터 블록인 경우에는 Nutanix* 수명 주기 관리자 페이지를 방문하십시오. 하드웨어 및 펌웨어 호환성 목록은 Nutanix* 하드웨어 및 펌웨어 호환성 페이지를 참조하십시오. |