인텔, 고성능 컴퓨팅(HPC) 및 머신 러닝 분야를 위해 깊이 있는 통찰력을 제공하는 최신 제품 및 기술 발표

  • 새로운 인텔 제온 파이 프로세서 및 인텔 확장형 시스템 프레임워크(SSF) 업데이트 사항 발표
  • 뛰어난 성능, 확장성, 프로그래밍 수용력 및 투자 보호로 머신 러닝 및 HPC 업계의 요구에 부응

 

2016 6 21, 서울 – 데이터가 점점 더 복잡해지고 양적으로도 폭발적으로 증가하면서 머신 러닝과 인공 지능 분야의 분석 성능에 관한 깊이 있는 통찰력을 제공하고, 새로운 발견과 비즈니스 혁신을 가속화할 수 있는 차세대 하드웨어, 소프트웨어, 아키텍처가 필요한 시점이 되었다. 인텔은 이러한 깊이 있는 통찰력을 구현하기 위한 해법으로 새로운 인텔® 제온 파이™ (Intel® Xeon Phi™) 프로세서를 출시했다.

인텔 제온 파이 프로세서

인텔 제온 파이 프로세서

 

인텔 확장형 시스템 프레임워크(Intel® Scalable System Framework, 이하 인텔 SSF – HPC를 위한 인텔의 레퍼런스 시스템 아키텍처)의 핵심 요소인 인텔 제온 파이 제품군은 주요 기술을 하나로 결합하여 고성능 클러스터를 형성하고 손쉽게 구축할 수 있도록 완벽한 솔루션을 제공한다.

 

인텔 제온 파이 프로세서로 가장 힘든 과제를 보다 빠르게 해결1

새로운 인텔 제온 파이 프로세서는 고도의 병렬 워크로드를 위해 특별히 개발된 인텔의 첫 번째 부팅 가능한 호스트 프로세서(bootable host processor)로, 메모리 및 패브릭(fabric) 기술을 최초로 결합해냈다. 인텔 제온 파이 프로세서는 부팅 가능한 X86 CPU로서, PCIe 버스 상에 의존해야 하는 GPU가속기와 달리 제약 없이 효과적으로 확장할 수 있다. 인텔 제온 파이 프로세서는 이러한 의존성을 제거함으로써, 뛰어난 확장성을 구현하고 가속기 제품군 대비 보다 다양한 범주의 워크로드 및 사양을 관리할 수 있는 성능을 제공한다.

 

또한 본 제품군은 16GB의 고대역폭 메모리를 결합, 메모리 기반 워크로드를 위해 최대 초당 500GB의 일관된 메모리 대역폭을 제공하며2, 듀얼 포트의 인텔® 옴니 패스 아키텍처(Intel® Omni-Path Architecture, 이하 인텔 OPA)와 결합하면 솔루션 비용, 전력소비량, 활용 공간 등을 한층 감소시킬 수 있다. 인텔 제온 파이 프로세서는 개방형 표준 기반으로 개발된 범용 CPU로서 이미 투자한 소프트웨어를 향후에도 계속 활용하는 것을 가능하게 해준다.

인텔 제온 파이 프로세서_옴니 패스 패브릭 결합

인텔 제온 파이 프로세서_옴니 패스 패브릭 결합

 

인텔 제온 파이 프로세서는 뛰어난 효율성과 확장성을 기반으로 머신 러닝에서 고성능 컴퓨팅(HPC)에 이르는 다양한 환경 및 애플리케이션 상의 가장 까다로운 연산 작업들도 보다 빠르게 처리해준다3. 본 제품군은 또한 고성능 모델링 및 시뮬레이션, 가상화 및 데이터 분석을 사용해 새로운 혁신을 추구할 수 있게 해준다. 인텔 제온 파이의 주요 사양 및 장점은 다음과 같다.

 

  • 성능: 최대 72개의 강력하고 효율적인 코어에 초광대역 벡터(Intel® Advanced Vector Extensions or AVX-512) 기능을 갖춰 고도화된 병렬 컴퓨팅의 성능 수준을 한층 높였다.
  • 확장성: 복잡한 신경망(neural network)을 빠르게 훈련시키기 위해 효율성 확장이 핵심인 머신 러닝과 같은 고성능 워크로드를 구동할 수 있도록 데이터센터급의 CPU 확장성과 안정성을 제공한다.
  • 프로그래밍 수용력(Programmability): 인텔 제온 프로세서와의 바이너리(binary) 호환성을 제공해 모든 종류의 x86 기반 워크로드를 처리할 수 있게 해준다. 이에 힘입어 데이터센터 전반의 자원을 최적으로 활용할 수 있는 동시에 일반적인 프로그래밍 모델 사용을 통해 개발자 기반 공유 및 코드 재사용이 가능해져 생산성을 향상시켜준다.
  • 투자보호: 광범위한 에코시스템 파트너사, 프로그래밍 언어, 가용 가능한 툴 등의 지원이 가능한 범용 x86 CPU 아키텍처 및 개방형 표준 기반으로 개발이 이뤄졌다. 이를 통해 뛰어난 유연성, 소프트웨어 이식성(portability, 기존 소프트웨어를 사용하는 것이 얼마나 용이한가를 나타내는 정도) 및 재사용성을 제공한다.

 

폭넓은 업체가 금일 새로운 제온 파이 프로세서 제품군을 탑재한 시스템을 공개했으며, 올해 9월경에 제품을 출시할 예정이다. 지금까지 인텔은 수 만개의 제품을 업체에 출하했으며, 올해 10만 개 이상의 제품을 판매할 것으로 예상하고 있다. 50개가 넘는 OEM, ISV 및 미들웨어 파트너사를 포함해 광범위한 에코시스템이 본 프로세서를 지원하게 되며, 이에 대한 보다 자세한 내용은 www.intel.com/xeonphi/partners 에서 확인 가능하다.

 

인텔 제온 파이 프로세서로 한층 강력해지는 머신 러닝

머신 러닝 구축에는 연산 알고리즘을 구동하고, 방대한 양의 데이터를 처리할 수 있는 아주 강력한 컴퓨팅 성능이 요구된다. 인텔은 이러한 필요에 부응하기 위해 인텔 제온 파이 프로세서 제품군을 출시, 머신 러닝을 위한 기술의 범주를 한층 확장시켰다.

 

인텔 제온 파이 프로세서는 머신 러닝 훈련(training) 모델을 위한 강력한 성능을 제공하며, 부팅이 가능한 호스트 프로세서로서 유연성을 갖춰 다수의 분석 워크로드를 처리할 수 있다. 또한 인텔 제온 파이 프로세서로 구동되는 인텔 SSF 기반의 클러스터 및 함께 결합 가능한 인텔 OPA는 데이터 과학자들이 복잡한 신경망을 작동시키고, 매우 짧은 시간 안에 훈련 모델을 사용하는 것을 가능하게 한다. 인텔 제온 파이 제품군은 32노드 인프라스트럭처 상에서 GPU보다 최대 1.38배 향상된 확장성을 제공하며, 128 노드 인프라스트럭처 상에서 인텔 제온 파이 제품군을 사용하면 최대 50배 빠른 속도로 모델을 훈련 시킬 수 있다3.

인텔 제온 파이 프로세서_풀 섀시(full-chassis)

인텔 제온 파이 프로세서_풀 섀시(full-chassis)

 

인텔 제온 파이 제품군은 또한 머신 러닝을 위한 인프라스트럭처로 가장 많이 채택된4 인텔 제온 프로세서 E5 제품군과의 결합을 통해 한층 향상된 성능을 낼 수 있다. 인텔 제온 프로세서 E5 v4 제품군은 머신 러닝 스코어링(scoring) 모델에 최적화되어 있으며, 다양한 종류의 데이터센터 워크로드를 위한 뛰어난 성능과 가치를 제공해준다. 인텔 제온 파이와 인텔 제온 프로세서 E5 v4 제품군과의 결합에 힘입어 개발자들은 훈련 및 스코어링을 위한 지속적인 프로그래밍 모델을 확보하고, 고성능 컴퓨팅, 데이터 분석 및 머신 러닝 워크로드에 사용 가능한 공통 아키텍처를 활용할 수 있게 된다.

 

새로운 인텔® SSF(Intel® Scalable System Framework) 레퍼런스 아키텍처

소형 클러스터에서부터 세계 최대 슈퍼컴퓨터에 이르는 폭넓은 범주를 위해 설계된 인텔 SSF는 컴퓨팅 및 데이터 집약적인 애플리케이션, 머신러닝 및 시각화(visualization)를 위한 확장성 및 균형 잡힌 성능을 제공한다. 이번에 인텔은 최적화된 HPC 시스템을 위한 권장 하드웨어 및 소프트웨어 구성 기준을 제공하는 인텔 최초의 인텔 SSF 레퍼런스 아키텍처를 발표했다. 인텔 SFF 레퍼런스 아키텍처는 하드웨어 및 소프트웨어 요소, 설치 방법 및 시스템 사양과 같이 구체적인 HPC 시스템 자격 요건을 명시한 두 개의 레퍼런스 디자인을 갖추고 있다. 새로운 레퍼런스 아키텍처 및 디자인은 시스템 개발업체들이 설계 및 검증 단계를 단순화할 수 있게 해주며, 엔드 유저에게는 구매 가이드를 제공한다. 이를 통해 사용자들은 인텔 SSF의 효과를 최대로 활용해 광범위한 종류의 소프트웨어 애플리케이션에 대한 이식성을 유지하게 된다. 새로운 레퍼런스 아키텍처 및 디자인에 대한 더 많은 정보는 www.intel.com/SSF에서 확인 가능하다.

 

인텔® HPC 오케스트레이터(Intel® HPC Orchestrator) 통한 소프트웨어 설치 단순화

인텔® HPC 오케스트레이터는 새로운 지원 제품군으로서, 통합, 테스트 및 검증에 필요한 작업 양을 감소시켜 HPC 시스템 소프트웨어 스택(stack)의 구축 및 진행 중인 유지관리를 단순화 시켜준다. 4분기에 출시할 예정인 인텔 HPC 오케스트레이터 제품들은 오픈HPC 커뮤니티 소프트웨어를 기반으로 하며, 전문적인 서비스와 기술 지원을 제공한다. 첫 번째 제품은 인텔 HPC 오케스트레이터 어드밴스드(Orchestrator–Advanced)로, 쉬운 사용 방식에 최적화, 성능 및 확장성을 제공하는 모듈러 소프트웨어 스택이다. 인텔 HPC 오케스트레이터의 사양 및 장점에 대한 보다 자세한 정보는 www.intel.com/hpcorchestrator에서 확인 가능하다.

 

업계 채택이 확산되고 있는 인텔 OPA(Omni-Path Architecture)

인텔 OPA(Intel Omni-Path Architecture)는 새로운 엔드 투 엔드(end-to-end) 패브릭 솔루션으로 PCIe 호스트 어댑터, 에지 스위치, 디렉터급 스위치, 케이블링 및 오픈 소스 소프트웨어 툴 등으로 구성되며, 엔트리급에서 대규모 HPC 클러스터에 이르기까지 다양한 HPC 애플리케이션의 성능을 비용 효율적으로 향상시켜 주기 위해 개발됐다. 시장의 도입이 빠르게 증가해 현재 80,000여개 이상의 노드를 확보하고 있으며, 델(Dell), 후지쯔(Fujitsu), 히타치(Hitachi), HP, 인스퍼(Inspur), 레노버(Lenovo), NEC, 오라클(Oracle), 콴타(Quanta), SGI, 슈퍼마이크로(Supermicro) 및 콜팩스(Colfax) 등 주요 시스템 제조업체가 인텔 OPA기반 스위치 및 서버 플랫폼을 출하하고 있다.

 

인텔 OPA 주요 구축 사례는 다음과 같다:

  • DoE CTS-1 (로렌스리버모어연구소(LLNL), 산디아 및 로스알라모스(Sandia & Los Alamos))에 인텔 OPA 14,500개 노드 공급
  • 시네카(Cineca)에 6,000개 이상의 인텔 OPA 노드 공급
  • 그 밖에 미 국가핵안보국(National Nuclear Security Administration)의 트리 랩스(Tri Labs), 텍사스 첨단 컴퓨팅 센터(Texas Advanced Computing Center), 헐대학교(University of Hull), 케임브리지대학교(University of Cambridge), 알프레드 베게너 연구소(Alfred Wegener Institute), 콜로라도대학교(University of Colorado) 등에도 공급

기타 금일 발표에 대한 보다 자세한 내용은 http://www.intel.com/newsroom/isc 에서 확인 가능하다.

 

인텔에 대하여

인텔(NASDAQ: INTC)은 가장 놀라운 경험들을 구현하기 위해 기술의 한계를 넓혀나가고 있다. 인텔 및 100,000명 이상의 인텔 직원들의 업무 내용에 대한 보다 자세한 정보는 newsroom.intel.co.kr 혹은 blogs.intel.com에서 확인 가능하다.

인텔 및 인텔 로고는 미국 및 다른 국가에서 인텔의 등록 상표로 등록되어 있다.

*기타 이름 및 상표는 해당 소유권자의 재산이다.

 

1 Intel® Xeon Phi™ processor delivers over 3 Teraflops of dual-precision performance, which is faster than the over 1 Teraflop of dual-precision performance for the Intel® Xeon Phi™ Coprocessor x100 Family

2 Source: Intel measured performance of Intel® Xeon Phi™ processor 7250 on STREAM Triad benchmark in Gigabytes/second as of March 2016.

Up to 50x faster training on 128-node as compared to single-node based on AlexNet* topology workload (batch size = 1024) training time using a large image database running one node Intel Xeon Phi processor 7250 (16 GB MCDRAM, 1.4 GHz, 68 Cores) in Intel® Server System LADMP2312KXXX41, 96GB DDR4-2400 MHz, quad cluster mode, MCDRAM flat memory mode, Red Hat Enterprise Linux* 6.7 (Santiago), 1.0 TB SATA drive WD1003FZEX-00MK2A0 System Disk, running Intel® Optimized DNN Framework.  Contact your Intel representative for more information on how to obtain the binary. Up to 38% better scaling efficiency at 32-nodes claim based on GoogLeNet deep learning image classification training topology using a large image database comparing one node Intel Xeon Phi processor 7250 (16 GB MCDRAM, 1.4 GHz, 68 Cores) using the same configuration as above., , Intel® Optimized DNN Framework with 87% efficiency to unknown hosts running 32 each NVIDIA Tesla* K20 GPUs with a 62% efficiency (Source: http://arxiv.org/pdf/1511.00175v2.pdf)

4 Intel estimate based on internal Intel Xeon E5 processor sales data and customer feedback

Software and workloads used in performance tests may have been optimized for performance only on Intel microprocessors. Performance tests, such as SYSmark and MobileMark, are measured using specific computer systems, components, software, operations and functions. Any change to any of those factors may cause the results to vary. You should consult other information and performance tests to assist you in fully evaluating your contemplated purchases, including the performance of that product when combined with other products. For more information go to http://www.intel.com/performance.

Intel processor numbers are not a measure of performance. Processor numbers differentiate features within each processor family, not across different processor families. See http://www.intel.com/performance for details.

Intel technologies’ features and benefits depend on system configuration and may require enabled hardware, software or service activation. Performance varies depending on system configuration. No computer system can provide absolute security. Cost reduction scenarios described are intended as examples of how a given Intel- based product, in the specified circumstances and configurations, may affect future costs and provide cost savings.  Circumstances will vary. Intel does not guarantee any costs or cost reduction.

All dates and products specified are for planning purposes only and are subject to change without notice.

Relative performance for each benchmark is calculated by taking the actual benchmark result for the first platform tested and assigning it a value of 1.0 as a baseline. Relative performance for the remaining platforms tested was calculated by dividing the actual benchmark result for the baseline platform into each of the specific benchmark results of each of the other platforms and assigning them a relative performance number that correlates with the performance improvements reported.

No license (express or implied, by estoppel or otherwise) to any intellectual property rights is granted by this document.

Intel disclaims all express and implied warranties, including without limitation, the implied warranties of merchantability, fitness for a particular purpose, and non-infringement, as well as any warranty arising from course of performance, course of dealing, or usage in trade.

© 2016 Intel Corporation

인텔에 대하여

반도체 업계의 선두주자인 인텔(NASDAQ: INTC)은 전 세계 혁신의 바탕이 되는 컴퓨팅 및 통신기술로 데이터 중심의 미래를 만들어가고 있다. 엔지니어링 분야에 있어 인텔의 전문성은 전 세계가 직면한 가장 큰 문제들을 해결하는데 기여할 뿐 아니라 클라우드와 네트워크, 엣지까지 스마트 커넥티드 월드를 구성하는 모든 인프라와 수십억개의 디바이스를 작동시키고 연결하는데 앞장서고 있다. 인텔에 대한 보다 자세한 정보는 newsroom.intel.com and intel.com 에서 확인 가능하다.

인텔 및 인텔 로고는 미국 및 다른 국가에서 인텔의 상표로 등록돼 있다.

*기타 이름과 상표는 해당 기업의 자산입니다.