인텔® 제온® 프로세서용 인텔® Data Center Diagnostic Tool
소개
인텔® Data Center Diagnostic Tool 데이터 센터 플랫폼에서 다음을 실행할 수 있는 진단 소프트웨어 도구입니다.
- 인텔® 제온® 프로세서 내의 모든 코어의 기능을 확인하십시오.
- 정기적인 시스템 유지 관리 프로그램의 일부로 사용하십시오.
데이터 센터의 높은 안정성과 가용성은 올바른 도구와 유지 보수에 대한 헌신이 필요합니다. 인텔은 이러한 유지 관리 도구를 초기 배포 및 주기적인 테스트에 모두 사용하여 최상의 시스템 경험을 보장하는 것이 업계 모범 사례라고 생각합니다.
| 참고 |
|
시스템 요구 사항
인텔 Data Center Diagnostic Tool 현재 많은 Linux 배포판에서 설치 및 실행할 수 있는 Linux* 응용 프로그램입니다. 이 도구의 Windows* 버전은 없습니다.
최상의 커버리지를 위해 서버의 루트 시스템에서 응용 프로그램을 실행하십시오. 컨테이너 또는 가상 머신 내부에서 실행할 수 있지만 일부 기능이 비활성화되어 있을 수 있다는 점에 유의하십시오.
지원되는 프로세서:
- 3세대 인텔® 제온® 스케일러블 프로세서(이전 Ice Lake 및 Cooper Lake)
- 2세대 인텔® 제온® 스케일러블 프로세서(이전 Cascade Lake)
- 1세대 인텔® 제온® 스케일러블 프로세서(이전 Skylake)
- 인텔® 제온® 프로세서 E5 v4 제품군(이전 Broadwell)
- 인텔® 제온® 프로세서 E7 v4 제품군(이전 Broadwell)
| 참고 |
|
설치
| 노트 |
| Debian*/Ubuntu* |
Debian*기반 배포판에 인텔® Data Center Diagnostic Tool 소프트웨어 패키지를 설치하려면 인텔 software 패키지 저장소를 추가하고 해당 패키지를 설치합니다. 콘솔에 +붙여넣기를 복사하기 전에 sudo ls 를 실행하고 비밀번호를 입력하여 명령이 sudo 암호 프롬프트에 의해 소비되는 것을 방지할 수 있습니다. 패키지 서명을 확인하기 위한 키 설정 curl https://repositories.intel.com/dcdt/dcdiag.pub | sudo apt-key add - 저장소 설정 sudo apt-add-repository 'deb https://repositories.intel.com/dcdt/debian stable main' 패키지 설치 sudo apt-get update |
| Fedora*/CentOS*/RHEL* |
Fedora 기반 배포판에 인텔 Data Center Diagnostic Tool 소프트웨어 패키지를 설치하려면 인텔 software 패키지 저장소를 추가하고 패키지를 설치합니다. 처음 설치할 때 YUM 또는 DNF는 서명 키를 수락하라는 메시지를 표시합니다. 지문이 다음과 같은지 확인한 다음 수락합니다. 콘솔에 +붙여넣기를 복사하기 전에 sudo ls 를 실행하고 비밀번호를 입력하여 명령이 sudo 암호 프롬프트에 의해 소비되는 것을 방지할 수 있습니다. 저장소 파일 설치 sudo yum install https://repositories.intel.com/dcdt/dcdiag-repo.rpm 패키지 설치 sudo yum install dcdiag |
| OpenSUSE*/SUSE Linux Enterprise*: |
저장소 파일 설치 sudo zypper ar https://repositories.intel.com/dcdt/dcdiag.repo 패키지 설치 sudo zypper install dcdiag respond.xml 이 서명되지 않음을 경고합니다. 계속하려면 예라고 응답하십시오. 패키지 서명을 확인할 수 있는 또 다른 기회가 주어집니다. 지문이 다음과 같은지 확인한 다음 수락합니다. Repository: dcdiag |
인텔 제온 프로세서를 테스트하는 방법
설치되면 백그라운드 실행을 위해 인텔 Data Center Diagnostic Tool 자동으로 활성화됩니다. 다음 명령으로 이 작업이 성공했는지 확인할 수 있습니다.
# systemctl status dcdiag
● dcdiag.service - Intel® Data Center Diagnostic Tool
Loaded: loaded (/usr/lib/systemd/system/dcdiag.service; enabled; vendor preset: disabled)
Active: active (running) since Fri 2021-02-19 11:24:17 MST; 4 days ago
Docs: file:///usr/share/doc/dcdiag/README.rst
Main PID: 8777 (dcdiag)
CGroup: /system.slice/dcdiag.service
└─8777 /usr/bin/dcdiag --service
| 참고 | 인텔 Data Center Diagnostic Tool 백그라운드 실행을 비활성화하려면 다음을 실행합니다. systemctl disable --now dcdiag Systemctl(1) 명령 사용에 대한 자세한 내용은 Linux* 수동 페이지를 참조하십시오. |
백그라운드에서 인텔 Data Center Diagnostic Tool 실행되는 동안 오류가 감지되면 도구가 이를 시스템 로그에 기록합니다. 이 도구는 --query 인수를 사용하여 백그라운드 스캔에서 오류가 발견되었는지도 쿼리할 수 있습니다.
# dcdiag --query
Intel® Data Center Diagnostic Tool Version 506
Test completed successfully. No issues detected.
이 도구는 Linux 명령 프롬프트에서 실행하여 전경에서 수동으로 실행할 수도 있습니다.
# dcdiag
수동 테스트는 약 45분 동안 진행되며 CPU 사용률이 높습니다.
진단이 완료되면 시스템은 다음 메시지 중 하나를 반환합니다.
- 테스트가 성공적으로 완료되었습니다. 문제가 감지되지 않았습니다.
- 테스트가 성공적으로 완료되었습니다. 하나 이상의 기계 검사 오류가 발생했습니다. 시스템 로그를 확인하십시오.
- 이 프로세서는 이 도구 버전에서 지원되지 않습니다.
시스템의 프로세서 모델과 버전을 확인하십시오. 이 메시지는 인텔 Data Center Diagnostic Tool 지원되는 프로세서의 프로덕션 버전을 감지하지 못하는 경우에 나타납니다. 엔지니어링 샘플은 이 도구에서 지원하지 않습니다.
프로세서 식별에 대한 도움말을 찾아보십시오.
- 테스트가 완료되었습니다. 오래된 버전의 마이크로코드로 인해 결과가 결정적이지 않습니다.
마이크로 코드의 최신 버전은 알려진 문제를 해결합니다. 업데이트하십시오. 마이크로 코드 업데이트는 일반적으로 다양한 구성 요소에 대한 보안 수정 및 기타 펌웨어 업데이트와 함께 Linux 배포 공급업체에서 제공합니다. 시스템에 이러한 업데이트가 활성화되어 있지 않은 경우 활성화하는 것이 좋습니다. 마이크로 코드는 모든 부팅에서 Linux 커널에 의해 자동으로 로드되며 다음 명령을 루트로 사용해서 런타임에 다시 로드할 수 있습니다.
echo 1 > /sys/devices/system/cpu/microcode
- 테스트가 완료되었습니다. 온도 제한을 초과하는 시스템으로 인해 결과가 결정적이지 않습니다.
이는 CPU가 필요한 온도 제한 내에서 작동하기에 충분한 냉각을 제공하지 못하는 시스템의 다양한 문제로 인해 발생할 수 있습니다. 필요한 냉각이 올바르게 작동하고 있는지 시스템을 확인하는 것이 좋습니다. 여기에는 결함이 있는 팬, 잘못된 공기 흐름 또는 기타 환경 문제가 포함될 수 있습니다.
- 테스트가 완료되었습니다. 결과는 결정적이지 않으며 하나 이상의 머신 검사 오류가 발생했습니다.
시스템 로그를 확인하십시오.
- 테스트에 실패했습니다. 지원은 시스템 제조업체 또는 프로세서 공급업체에 문의하십시오.
테스트 결과가 실패하면 서버 노드의 프로세서에 여전히 보증이 적용되는지 확인하십시오.
- 박스형 인텔® 제온® 프로세서가 3년 보증을 받고 있는 경우 인텔 고객 지원팀에 문의하여 지원을 요청하십시오.
- 트레이 프로세서가 있는 경우 시스템 또는 프로세서 공급업체 또는 구입처에 문의하여 프로세서가 여전히 보증을 받고 있는지 확인하십시오.
참고 트레이 프로세서는 시스템 제조업체 또는 인텔 공인 디스트리뷰터에게 직접 판매됩니다. 인텔은 인텔® 데이터 센터 블록(인텔® DCB) 서버 시스템에 사전 설치되지 않는 한 트레이 프로세서에 대한 최종 사용자에게 직접 보증을 제공하지 않습니다. 인텔 DCB 시스템을 제외하고 트레이 프로세서의 보증은 프로세서가 사전 설치된 경우 공급업체 또는 프로세서 또는 시스템 구입처에서 보증합니다. 인텔은 인텔 공인 디스트리뷰터, 인텔 승인 공급업체 및 인텔® 제품의 리셀러로부터 구매할 것을 권장합니다. - 인텔에는 보증 외 교체 프로그램이 없습니다.
테스트에 실패했습니다.
테스트가 완료되고 /sys/devices/system/cpu/cpuXX 가 포함된 실제 프로세서에서 오류가 감지되었습니다.
지원은 시스템 제조업체 또는 프로세서 공급업체에 문의하십시오.
테스트에 실패했습니다.
테스트는 어떤 물리적 프로세서가 장애를 일으켰는지 확인할 수 없습니다.
지원은 시스템 제조업체 또는 프로세서 공급업체에 문의하십시오.
버전 기록
| 날짜 | 버전 | 설명 |
| 2021년 7월 7일 | 540 | 초기 버전 |
| 관련 주제 |
| 인텔® 제온® 지원 중앙 웹 사이트 |
| 인텔® 프로세서에 대한 보증 가이드 |
