HPE, 엔비디아와 손잡고 차세대 AI 팩토리 및 슈퍼컴퓨팅 혁신 가속화
HPE가 대규모 AI 팩토리와 슈퍼컴퓨터를 위한 'HPE 기반 엔비디아 AI 컴퓨팅 포트폴리오'의 주요 혁신 사항을 발표했다. 이번 발표는 고객이 AI를 더 효율적으로 확장하고 배포하며, 데이터에서 인사이트를 도출하는 시간을 단축하는 데 중점이다.
HPE는 엔비디아와 협력해 구축한 이번 풀스택 AI 설루션이 컴퓨팅, GPU, 네트워킹, 액체 냉각, 소프트웨어 및 서비스를 긴밀하게 통합해 대규모 환경과 국가별 소버린 환경에 최적화했다고 밝혔다. 현재 아르곤 국립 연구소, 독일 슈투트가르트 고성능 컴퓨팅 센터, 허드슨 리버 트레이딩, 한국과학기술정보연구원 등 세계적인 연구 기관과 AI 기업들이 HPE의 인프라를 채택해 혁신을 가속하고 있다.
HPE는 자사의 슈퍼컴퓨팅 플랫폼인 ‘HPE 크레이 슈퍼컴퓨팅 GX5000’에 엔비디아의 최신 설루션을 적용한다. 먼저 액체 냉각 방식의 ‘엔비디아 베라 CPU 컴퓨트 블레이드’를 도입한다. 각 ‘HPE 크레이 슈퍼컴퓨팅 GX240 컴퓨트 블레이드’는 최대 16개의 엔비디아 베라 CPU를 탑재해 까다로운 AI 워크로드를 지원한다. 이는 랙 하나 당 최대 40개의 블레이드와 640개의 CPU, 5만 6320개의 엔비디아 올림푸스 코어를 확장할 수 있다. 또한 엔비디아 퀀텀-X800 인피니밴드를 통해 초고속 네트워킹 환경을 제공한다. 이 스위치는 포트당 800Gb/s의 연결성을 지원하며 높은 전력 효율을 갖춘 것이 특징이다.
대규모 및 소버린 환경을 위한 ‘HPE AI 팩토리’ 포트폴리오도 강화한다. HPE는 1조 개 이상의 매개변수를 가진 거대 모델을 위해 설계된 차세대 시스템 ‘HPE 기반 엔비디아 베라 루빈 NVL72’ 랙 스케일 시스템을 선보인다. 이 시스템은 36개의 CPU와 72개의 루빈 GPU, 6세대 NV링크 네트워킹 등을 탑재해 대규모 환경에서 높은 효율을 낸다. 이와 함께 새로운 AI 서버인 ‘HPE 컴퓨트 XD700’도 출시한다. 엔비디아 HGX 루빈 NVL8을 기반으로 한 이 서버는 랙당 최대 128개의 루빈 GPU를 지원하며, 이전 세대보다 두 배 향상된 GPU 집적도를 통해 전력과 냉각 비용을 절감한다.
이외에도 모든 HPE AI 팩토리 포트폴리오에서 ‘엔비디아 RTX PRO 6000 블랙웰 서버 에디션’ GPU를 사용할 수 있게 된다. 소프트웨어와 서비스 측면에서는 엔비디아 클라우드 파트너 프로그램 인증을 획득해 클라우드 서비스 제공사의 검증 프로세스를 간소화한다. 수세 가상화 및 랜처 프라임 스위트를 통한 멀티 테넌시 옵션도 확장해 가상머신용 GPU 패스스루 등을 지원한다. 레드햇 엔터프라이즈 리눅스 및 오픈시프트와의 통합은 물론, AI 팩토리의 운영과 확장을 돕는 ‘엔비디아 미션 컨트롤’ 소프트웨어도 제공할 예정이다.
HPE의 트리시 담크로거 수석부사장은 “세계 최고 성능의 엑사스케일 슈퍼컴퓨터 3대를 구축한 HPE는 최첨단 AI 워크로드와 고성능컴퓨팅을 결합해 과학적 혁신을 주도하고 있다”면서, “엔비디아와 협력해 의학, 생명과학, 제조 등 다양한 분야에서 한계를 뛰어넘는 데 필요한 성능을 제공하겠다”고 밝혔다.
엔비디아의 크리스 매리어트 부사장은 “기업과 국가가 AI의 잠재력을 실현하려면 대규모 모델 학습과 고성능컴퓨팅 워크로드를 처리할 인프라가 필수”라면서, “양사가 공동 개발한 인프라는 가속 컴퓨팅과 액체 냉각 기술을 결합해 인사이트 도출 시간을 단축한다”고 설명했다.
작성일 : 2026-04-06