인텔® 서버 보드의 내부 오류(IERR)에서 복구하는 방법
무엇을 보고 있습니까?
IERR은 프로세서가 보고한 치명적인 오류이지만 일반적으로 프로세서 코어 외부의 장치(예: 메모리, PCIe)로 인해 발생합니다.
- 프로세서 실행은 일반적으로 프로세서 외부의 이벤트로 인해 지연되었습니다.
- 이 문제는 종종 추가 정보를 위해 상호 참조될 수 있는 CATERR 이벤트를 동반합니다.
해결 방법:
다음 단계를 순서대로 따르십시오.
- 시스템 이벤트 로그(SEL)에서 ECC(오류 수정 코드) 이벤트를 확인하십시오. 결함이 있는 메모리는 IERR을 트리거할 수 있습니다.
- 모든 PCIe 이벤트에 대해 SEL을 검토하십시오. 고장난 PCIe 장치는 IERR을 트리거할 수 있습니다.
- 운영 체제(OS) 드라이버가 서버와 최근에 추가된 하드웨어 장치에 대한 최신 상태로 유지되었는지 확인하십시오. 오래된 OS 드라이버는 IERR을 트리거할 수 있습니다.
- IERR을 트리거할 수 있는 하드웨어 오류를 나타낼 수 있는 모든 머신 체크 아키텍처(MCA) 항목에 대한 OS 로그를 확인하십시오.
- 서버 시스템에 대한 최신 BIOS가 있는지 확인하십시오.
- 베이스보드 관리 컨트롤러 웹 콘솔 > 구성 > 메모리 구성 > PPR 유형으로 이동하여 PPR 설정을 하드로 설정합니다.
- 로그에 문제가 발생할 수 있는 특정 메모리 모듈이 있는지 확인하면 메모리 스틱을 재장착하고 서버를 24시간 동안 모니터링하십시오.
관련 주제 |
서버가 충돌하여 이 오류가 표시됩니다: 프로세서 CPU Machine Chk |
펌웨어 업데이트 및 문제 해결 팁 |
인텔® 서버 보드용 시스템 이벤트 로그 문제 해결 가이드 |