인텔® 서버 보드의 내부 오류(IERR)에서 복구하는 방법

문서

문제 해결

000006043

2023-07-17

무엇을 보고 있습니까?

IERR은 프로세서가 보고한 치명적인 오류이지만 일반적으로 프로세서 코어 외부의 장치(예: 메모리, PCIe)로 인해 발생합니다.

  • 프로세서 실행은 일반적으로 프로세서 외부의 이벤트로 인해 지연되었습니다.
  • 이 문제는 종종 추가 정보를 위해 상호 참조될 수 있는 CATERR 이벤트를 동반합니다.

해결 방법:

다음 단계를 순서대로 따르십시오.

  1. 시스템 이벤트 로그(SEL)에서 ECC(오류 수정 코드) 이벤트를 확인하십시오. 결함이 있는 메모리는 IERR을 트리거할 수 있습니다.
  2. 모든 PCIe 이벤트에 대해 SEL을 검토하십시오. 고장난 PCIe 장치는 IERR을 트리거할 수 있습니다.
  3. 운영 체제(OS) 드라이버가 서버와 최근에 추가된 하드웨어 장치에 대한 최신 상태로 유지되었는지 확인하십시오. 오래된 OS 드라이버는 IERR을 트리거할 수 있습니다.
  4. IERR을 트리거할 수 있는 하드웨어 오류를 나타낼 수 있는 모든 머신 체크 아키텍처(MCA) 항목에 대한 OS 로그를 확인하십시오.
  5. 서버 시스템에 대한 최신 BIOS가 있는지 확인하십시오.
  6. 베이스보드 관리 컨트롤러 웹 콘솔 > 구성 > 메모리 구성 > PPR 유형으로 이동하여 PPR 설정을 하드로 설정합니다.
  7. 로그에 문제가 발생할 수 있는 특정 메모리 모듈이 있는지 확인하면 메모리 스틱을 재장착하고 서버를 24시간 동안 모니터링하십시오.

관련 주제
서버가 충돌하여 이 오류가 표시됩니다: 프로세서 CPU Machine Chk
펌웨어 업데이트 및 문제 해결 팁
인텔® 서버 보드용 시스템 이벤트 로그 문제 해결 가이드