QIAGEN Bioinformatics*

QIAGEN Bioinformatics* solutions deliver faster time to insight by combining powerful analytics that are able to interpret complex biological processes.

Analyze Whole Human Genomes for as Little as USD 22

The QIAGEN Biomedical Genomics Server* solution is able to minimize the total cost of ownership (TCO) over a four-year period for the largest NGS instrument on today’s market. Calculations of the total ownership costs show that with given specifications, the cost can be as low as USD 22 per whole human genome analyzed.1 2 With very high throughput enabled by a HiSeq X Ten*, the savings can be sizable.

Performance Results

An Illumina HiSeq X Ten* system is able to sequence a total of 18,000 whole genome sequences per year—averaging the rate of analysis to 30 minutes per one whole human genome sequence. By optimizing and fine-tuning the speed of the QIAGEN Biomedical Genomics Server* solution, we demonstrated that the solution is able to analyze the NGS data at the pace they are produced by the instrument running at maximum throughput— with less computing nodes than recommended by others3. The testing scenario revealed that QIAGEN Biomedical Genomics Server requires a compute cluster of only 32 nodes, as contrasted (in contrast) to the 85 nodes recommended by Illumina (variant calling based on BWA+GATK Best Practices pipeline in the HiSeq X system lab setup and Site Prep Guide (Document 15050093 v03, January 2016). The comparison benchmark testing was carried out by installing the QIAGEN Biomedical Genomics Server solution on a compute cluster of 32 nodes.1 2 each equipped with a 28-core E5-2697 v3 @ 2.60GHz, 128 GB RAM on a shared Lustre file system. We used the standard CLC variant calling workflow that comes with the Biomedical Genomics Server solution. Furthermore the benchmarks show that the same specified system is capable of analyzing up to 1440 whole human exomes per 24 hours.

Total Cost of Ownership

Reducing the hardware requirements from 85 nodes to just 32 nodes results in a dramatic impact on the total cost of ownership on the solution over a four-year period, which includes everything from software licenses and hardware, to power, cooling, networking, and floor space. Calculations of the total ownership costs show that the cost can be brought down as low as USD 22 per whole human genome analysis. Given the 18,000 whole human genome throughput enabled by a HiSeq X Ten, the savings can be as high as USD 1.3 million over four years. Additional benchmarks also show that the reference architecture is capable of analyzing up to 1,440 whole exome sequences per 24 hours.

Size and scale your infrastructure according to your workloads with the QIAGEN* reference architecture ›

제품 및 성능 정보

1

QIAGEN Bioinformatics와 인텔에서 수행한 내부 성능 테스트 및 총 소유 비용 분석을 기반으로 합니다. 성능 테스트는 16노드 고성능 컴퓨팅(HPC) 클러스터에서 수행되었습니다. 각 노드는 2개의 인텔® 제온® 프로세서 E5-2697 v3(2.6GHz, 14코어), 128GB 메모리 및 500GB 스토리지 드라이브로 구성되었습니다. 모든 노드는 Lustre* 소프트웨어용 인텔® 엔터프라이즈 에디션(Lustre* 소프트웨어용 인텔® EE), 256TB의 1000RPM 디스크 스토리지, 4개의 800GB 인텔® 솔리드 스테이트 드라이브 데이터 센터 S3700 시리즈를 기반으로 165TB 스토리지 시스템을 공유했습니다. 상호 연결 패브릭은 노드당 2개의 인텔® 트루 스케일 아키텍처 단일 포트 HCA(QLE7340 2개, QDR-80)와 36포트 인텔® 트루 스케일 스위치 펌웨어 12300(40Gbps)으로 구성되었습니다. TCO 분석은 2015년 10월 9일부터 내부 인텔® 도구, 공개적으로 제공되는 제품 가격, 가용성을 사용하여 수행되었습니다. 테스트 클러스터의 TCO는 4년의 기간에 대해 추정되었으며 Illumina HiSeq X System Lab Setup and Site Prep Guide, Document # 15050093 v05, January 2017(Illumina HiSeq X 시스템 실험실 설정 및 현장 준비 가이드, 문서 번호 15050093 v05, 2017년 1월)에 설명된 대로 85 노드 클러스터의 예상 TCO와 비교했습니다. TCO 비교를 정량화하기 위해 Illumina 가이드에 정의된 일반 사양을 충족하는 특정 제품이 선택되었습니다. 두 시스템 모두의 지원 비용은 TCO의 60%로 추정되었습니다. 성능 및 TCO 결과는 향후 시스템 구매의 비용/혜택 또는 타당성을 평가하기 위한 일반 가이드로서만 사용해야 합니다. 실제 성능 결과와 경제적 이점은 다양할 수 있으며 고려하지 않거나 생각하지 못한 솔루션의 사용 및 배포와 관련하여 예상치 못한 추가 비용이 있을 수 있습니다. 성능 테스트에 사용된 소프트웨어 및 워크로드는 인텔® 마이크로프로세서에만 적합하도록 최적화되었을 수 있습니다. SYSmark* 및 MobileMark*와 같은 성능 테스트는 특정 컴퓨터 시스템, 구성 요소, 소프트웨어, 운영 및 기능을 사용하여 측정합니다. 해당 요소에 변경이 생기면 결과가 달라질 수 있습니다. 구매를 고려 중인 제품을 제대로 평가하려면 다른 제품과 결합하여 사용할 경우 해당 제품의 성능을 포함한 기타 정보 및 성능 테스트를 참고해야 합니다. 자세한 내용은 http://www.intel.co.kr/performance를 방문하십시오.

2

성능 테스트에 사용된 WGS 데이터 집합은 NA12878D입니다. NA12878D는 350bp 인서트를 사용하는 Illumina의 TruSeq Nano* 키트로 생성되었으며 87% 초과 베이스 및 Q30 초과 품질을 가진 Illumina HiSeq X*의 단일 레인에서 시퀀싱되었습니다. 평균 커버리지: 35.57%, 읽기 길이: 2x151, 120Gb. 이 데이터 집합은 https://dnanexus-rnd.s3.amazonaws.com/NA12878-xten.html에서 이용할 수 있습니다.

3

벤치마크 결과는 “스펙터”와 “멜트다운”으로 알려진 공격에 대응하기 위한 목적의 최신 소프트웨어 패치 및 펌웨어 업데이트를 적용하기 이전에 얻어진 것입니다. 이러한 업데이트를 적용할 경우 이와 같은 결과가 귀하의 장치 또는 시스템에는 해당하지 않을 수 있습니다.

성능 테스트에 사용된 소프트웨어 및 워크로드는 인텔® 마이크로프로세서에만 적합하도록 최적화되었을 수 있습니다. SYSmark* 및 MobileMark*와 같은 성능 테스트는 특정 컴퓨터 시스템, 구성 요소, 소프트웨어, 운영 및 기능을 사용해서 수행합니다. 해당 요소에 변경이 생기면 결과가 달라질 수 있습니다. 구매를 고려 중인 제품을 제대로 평가하려면 다른 제품과 결합하여 사용할 경우 해당 제품의 성능을 포함한 기타 정보 및 성능 테스트를 참고해야 합니다. 자세한 내용은 http://www.intel.co.kr/benchmarks를 참조하십시오.