마스터 데이터 워크플로우

특별 제작된 이 워크스테이션은 대용량 메모리, 다양한 장치에 연결하는 수많은 확장 슬롯, 그리고 여러분과 같은 Python 기반 데이터 과학자와 데이터 분석가 특유의 요구 사항을 충족하는 엄선된 CPUS를 결합합니다.

자주 묻는 질문

데이터 사이언스 워크스테이션을 선택할 때 고려해야 할 두 가지 주요 요소는 가장 많이 사용하는 도구 및 기술과 데이터 세트의 크기입니다.

데이터 사이언스의 프레임워크의 경우, 코어 수가 많다고 항상 성능이 향상되는 것은 아닙니다. NumPy, SciPy, scikit-learn은 18코어보다 확장되지 않습니다. 반면, HEAVY.AI(이전 OmniSci)는 가능한 모든 코어를 사용합니다.

모든 인텔 기반 데이터 사이언스 워크스테이션은 인텔® 코어™, 인텔® 제온® W, 인텔® 제온® 스케일러블 프로세서를 사용하며, 실제 환경 테스트에서 데이터 사이언스 워크로드를 우수하게 처리합니다. 이 모든 제품에서 프로세서 제품군 중 최고의 성능을 얻을 수 있으므로 메모리 용량이 가장 중요한 선택이 됩니다.

데이터 사이언스 프레임워크는 메모리 사용 공간을 2~3배로 확장합니다. 기본 메모리 요구 사항을 파악하려면 일반 데이터 세트를 검토하고, 해당 값에 3을 곱합니다. 512GB 또는 그 이하의 용량으로 작업할 수 있다면, 데스크탑 컴퓨터에서 우수한 성능을 얻을 수 있습니다. 데이터 세트가 보통 500GB 이상이라면 1.5TB 이상의 메모리가 있는 타워 컴퓨터가 필요할 것입니다.

GPU 가속기는 딥 러닝 모델 교육과 대규모 딥 러닝 추론에서 빛을 발합니다. 그러나 대부분의 데이터 사이언스 작업(데이터 준비와 분석, 일반 머신 러닝)에서는 대부분 Python 라이브러리가 기본적으로 CPU에서 실행되기 때문에 해당 GPU는 유휴 상태에 놓이게 됩니다. 디스플레이를 구동하기 위해 그래픽 어댑터는 필요하지만, GPU 기기는 필요하지 않습니다.

클라우드는 전용 VM이나 베어 메탈 서버에서 실행되지 않는 한 최상의 성능을 발휘하지 못합니다. 클라우드 인스턴스는 단일 노드로 나타나지만, 백엔드에서는 매우 분산되어 있습니다. 여러분의 워크로드와 데이터는 여러 위치의 여러 서버로 분산되어 처리됩니다. 이로 인해 처리 및 메모리 대기 시간이 발생해 런타임이 저하됩니다. 또한, 원격 데스크탑에서 대규모 데이터 세트와 그래프로 작업하는 것은 이상적인 환경이 아닙니다.

워크로드와 데이터를 한 대의 컴퓨터에 저장하여 사용하면 훨씬 더 우수한 성능과 더 유연하고 빠른 작업 환경을 제공할 수 있습니다.

가능은 하지만, 데이터가 스토리지와 메모리, CPU를 이리저리 이동하는 것을 지켜보는 데 엄청난 시간을 소모하게 됩니다. 전문적인 환경에서 작업한다면, 인텔® 데이터 사이언스 노트북이나 중급 노트북으로 업그레이드하는 것이 시간을 절약하는 방법입니다. 인텔은 학생, 초보자, AI 제조사가 오픈 소스 AI 도구를 개발하고 실험하는 데 저렴한 제품을 선택할 수 있도록 인텔® 코어™ 기반의 데이터 사이언스 노트북을 테스트해 사양을 맞췄습니다.

인텔에 최적화된 라이브러리와 배포판을 사용해 일반 PC에서 빠르게 Python 기반 데이터 사이언스 도구를 실행할 수 있습니다. 모두 인텔® AI 키트의 구성품입니다.