통합검색 > 통합검색 : 캐드앤그래픽스 - 엔지니어링IT 미디어

엔비디아, 개인용 AI 슈퍼컴퓨터 ‘DGX 스파크’ 국내 예약 주문 시작

엔비디아가 차세대 개인용 AI 슈퍼컴퓨터 ‘엔비디아 DGX 스파크(NVIDIA DGX Spark)’의 국내 예약 주문을 시작한다고 밝혔다. DGX 스파크는 책상 위에 올려 놓을 수 있는 크기의 AI 슈퍼컴퓨터로 생성형 AI, 거대 언어 모델(LLM), 고속 추론 등 다양한 AI 워크플로를 로컬 환경에서 효율적으로 구현할 수 있도록 설계됐다. AI 개발이 고도화됨에 따라, 조직은 데이터 보안 강화와 지연 최소화, 배포 유연성 등을 고려해 로컬 환경에서 직접 AI 모델을 개발하고 실행할 수 있는 시스템을 요구하고 있다. DGX 스파크는 이러한 수요에 대응해 데스크톱 환경에서도 데이터 크기나 위치, 모델 규모에 제약 없이 민첩하고 효율적인 AI 개발이 가능하도록 지원한다. DGX 스파크는 데스크톱 폼팩터에 최적화된 엔비디아 GB10 그레이스 블랙웰 슈퍼칩(Grace Blackwell Superchip)을 탑재해 FP4 정밀도 기준, 최대 1페타플롭의 AI 성능을 제공한다. 또한, 고성능 엔비디아 커넥트-X(Connect-X) 네트워킹으로 두 대의 엔비디아 DGX 스파크 시스템을 연결해 최대 4,050억 개 파라미터의 AI 모델을 처리할 수 있다. DGX 스파크는 128GB 메모리를 탑재했으며, 엔비디아 AI 소프트웨어 스택이 사전 설치돼 있다. 이를 통해 딥시크, 메타, 구글 등에서 선보인 최대 2000억 개 파라미터의 최신 AI 모델도 로컬 환경에서 직접 프로토타이핑, 미세 조정, 추론할 수 있다. 또한, 사용자는 파이토치(PyTorch), 주피터(Jupyter), 올라마(Ollama) 등 익숙한 개발 도구를 사용할 수 있으며, 이를 DGX 클라우드나 가속화된 데이터센터 환경으로 손쉽게 확장할 수 있다. 이와 함께 엔비디아 NIM 마이크로서비스와 엔비디아 블루프린트(Blueprint)에 대한 액세스를 통해 AI 애플리케이션을 더욱 빠르게 개발하고 배포할 수 있도록 지원한다. 엔비디아는 “DGX 스파크는 올해 엔비디아 연례 개발자 콘퍼런스인 GTC와 컴퓨텍스(COMPUTEX)에서 공개된 이후 큰 관심을 받아왔으며, 이번 국내 예약 주문을 계기로 본격적인 보급이 기대된다”고 전했다. DGX 스파크의 국내 예약 주문은 엔비디아 공식 홈페이지를 통해 진행된다. 국내 주요 파트너사 중 원하는 업체를 선택해 예약할 수 있으며, 대량 구매도 가능하다. 공식 파트너사로는 에즈웰에이아이, 비엔아이엔씨, 디에스앤지, 아이크래프트, 리더스시스템즈, 메이머스트, MDS테크, 유클릭, 씨이랩, 제스프로가 있다.

작성일 : 2025-07-29

AWS, 엔비디아 블랙웰 기반의 AI 컴퓨팅 인프라 공개

작성일 : 2025-07-15

엔비디아, 앤시스·DCAI와 협력해 유체역학용 양자 알고리즘 개발 가속화

엔비디아가 ‘엔비디아 GTC 파리’ 행사에서 앤시스 및 덴마크 AI 혁신 센터(DCAI)와 협력해 유체역학용 양자 알고리즘 개발 가속화에 나섰다고 발표했다. AI 슈퍼컴퓨팅은 새로운 양자 애플리케이션의 개발을 가속화하며 항공우주, 자동차, 제조업 등 핵심 산업에서 획기적인 발전을 이끌고 있다. 이러한 가능성을 보여주는 사례로, 앤시스는 DCAI에서 운영하는 슈퍼컴퓨터 ‘게피온(Gefion)’에서 실행되는 엔비디아 쿠다-Q(NVIDIA CUDA-Q) 양자 컴퓨팅 플랫폼을 활용해 유체역학 응용을 위한 양자 알고리즘을 발전시키고 있다고 발표했다. 덴마크 최초의 AI 슈퍼컴퓨터인 게피온은 엔비디아 DGX SuperPOD과 엔비디아 퀀텀-2 인피니밴드(Quantum-2 InfiniBand) 네트워킹으로 상호 연결돼 있다. 앤시스는 오픈 소스인 엔비디아 쿠다-Q 소프트웨어 플랫폼을 활용해, 이 슈퍼컴퓨터의 성능을 기반으로 유체역학에 적용 가능한 양자 알고리즘의 GPU 가속 시뮬레이션을 수행했다. 쿠다-Q는 GPU 가속 라이브러리를 활용해, 게피온이 ‘양자 격자 볼츠만 방법(Quantum Lattice Boltzmann Method)’이라 불리는 알고리즘 계열의 복잡한 시뮬레이션을 실행할 수 있게 한다. 앤시스는 이 알고리즘이 39큐비트 양자 컴퓨터에서 어떻게 작동할지 시뮬레이션함으로써, 유체역학 응용에 미칠 영향을 빠르고 비용 효율적으로 탐색할 수 있었다. 엔비디아의 양자와 쿠다-X(CUDA-X) 부문 수석 이사인 팀 코스타(Tim Costa)는 “미래의 실용적인 양자 응용 분야를 발견하려면, 연구자들이 현재 그에 걸맞은 대규모 시뮬레이션을 실행할 수 있어야 한다. 엔비디아는 앤시스, DCAI와 같은 협력 파트너들에게 양자 컴퓨팅의 영향력을 확장할 수 있도록 슈퍼컴퓨팅 플랫폼을 제공하고 있다”고 말했다. 앤시스의 프리스 바네르지(Prith Banerjee) 최고기술책임자는 “쿠다-Q의 GPU 가속 시뮬레이션을 통해 우리는 양자 응용이 실제로 영향을 발휘하기 시작하는 영역에서 이를 연구할 수 있었다. 우리는 엔비디아 그리고 DCAI와의 협력을 통해 전산유체역학(CFD)과 같은 공학 분야에서 양자 컴퓨팅의 역할을 확장해 나가고 있다”고 말했다. DCAI의 나디아 칼스텐(Nadia Carlsten) CEO는 “우리는 쿠다-Q를 통해 게피온을 사용하는 연구자들이 양자-클래식 하이브리드 컴퓨팅을 실현할 수 있는 가능성을 직접 목격하고 있다. 엔비디아, 앤시스와의 파트너십 덕분에 양자 기술과 AI 슈퍼컴퓨팅 간의 융합을 이끌어낼 수 있었다”고 말했다.

작성일 : 2025-06-12

엔비디아, 스웨덴에 차세대 AI 인프라 구축 및 AI 기술 센터 설립

엔비디아가 스웨디시 비즈니스 컨소시엄(Swedish business consortium)과 함께 스웨덴 내 차세대 AI 인프라 구축을 위한 공동 계획을 발표했다. 엔비디아는 이번 프로젝트에 자사의 가속 컴퓨팅, 네트워킹, 소프트웨어를 통해 AI 시대를 맞이한 스웨덴 산업 전반의 혁신을 지원할 예정이다. 이번 프로젝트에는 스웨덴의 대표 기업인 아스트라제네카, 에릭슨, 사브, SEB가 참여하며, 발렌베리 인베스트먼트와의 파트너십을 통한 합작 회사가 운영할 예정이다. 이 합작 회사는 참여 기업들에 보안성과 주권성을 보장하는 컴퓨팅 자원을 제공할 계획이다. 첫 번째 구축 단계로는 엔비디아의 최신 세대 그레이스 블랙웰(Grace Blackwell) GB300 시스템을 탑재한 두 대의 엔비디아 DGX SuperPOD이 포함된다. 이 시스템은 도메인별 AI 모델 훈련, 추론 AI(Reasoning AI)를 포함한 대규모 추론 등 고성능 연산이 요구되는 AI 워크로드를 처리하는 데 사용될 예정이다. 엔비디아와 스웨디시 비즈니스 컨소시엄은 산업 전반의 AI 역량을 강화하고, 지식 공유를 촉진함으로써 스웨덴 내 새로운 AI 혁신을 주도하고자 한다. 이를 지원하기 위해 엔비디아는 스웨덴에 최초의 AI 기술 센터(AI Technology Center)를 설립해 업계 파트너들과 함께 세계 최고 수준의 AI 연구를 발전시킬 계획이다. 아울러 AI 인재 양성을 위해 자사 전문가와의 교류와 딥 러닝 인스티튜트(Deep Learning Institute)의 실무 교육을 제공할 예정이다. 아스트라제네카는 이 시스템을 활용해 파운데이션 모델 훈련, 멀티모달 추론, 독자적인 데이터 처리 역량 등을 적용해 차세대 AI 기반 신약 개발을 선도할 계획이다. 에릭슨은 데이터 과학 전문 지식을 활용해 최첨단 AI 모델을 개발, 배포함으로써 성능과 효율성을 개선하고 고객 경험을 향상시킬 예정이다. 사브는 자사의 제품과 플랫폼을 첨단 AI 애플리케이션과 결합해 차세대 방위 역량 개발을 획기적으로 가속화할 예정이다. 또한, SEB는 AI를 생산성 향상, 새로운 고객 서비스 제공, 은행의 미래 경쟁력 확보를 위한 핵심 요소로 보고 있다. 발렌베리 인베스트먼트의 마르쿠스 발렌베리(Marcus Wallenberg) 회장은 “최첨단 AI 인프라에 대한 투자는 스웨덴 산업 전반에 걸쳐 AI의 개발과 도입을 가속화하는 중요한 단계이다. 우리는 이 이니셔티브가 숙련도를 높이고, 새로운 협업을 촉진하며, 광범위한 국가 AI 생태계를 강화함으로써 가치 있는 파급 효과를 가져올 것이라 기대하고 있다”고 말했다. 엔비디아의 젠슨 황(Jensen Huang) 창립자 겸 CEO는 “전기가 산업 시대를 이끌고, 인터넷이 디지털 시대에 불을 붙인 것처럼, AI는 차세대 산업 혁명의 엔진이다. 발렌베리 인베스트먼트와 스웨덴 산업 리더들의 비전 있는 이니셔티브를 통해 스웨덴은 자국 최초의 AI 인프라를 구축하고 있다. 이는 과학, 산업, 사회 전반의 혁신을 위한 기반을 마련하고, 스웨덴이 AI 시대를 선도하는 국가로 자리매김하는 데 있어 중요한 이정표가 될 것”이라고 말했다.

작성일 : 2025-05-29

IBM, AI 데이터 폭증 시대 대응을 위한 지능형 스토리지 전략 발표

IBM이 인공지능(AI) 시대의 급격한 데이터 증가에 대응하기 위한 새로운 스토리지 전략을 발표했다고 5월 27일 기자간담회를 통해 밝혔다. 이번 IBM 전략은 기업의 AI 인프라 고도화와 비용 효율성 극대화, 데이터 이동 및 처리 최적화를 핵심으로 하는 지능형 데이터 플랫폼 구축에 초점을 맞추고 있다. ▲ IBM 스토리지 전략 발표 기자간담회 모습 IBM은 기존의 단순한 데이터 저장 시스템을 넘어서, AI 중심의 비즈니스 환경에 특화된 지능형 데이터 플랫폼을 제시했다. 특히 IBM 퓨전(Fusion)과 CAS(Content Aware Storage) 기술을 통해 데이터 분석 효율성과 통합성을 강화하며, 기업의 디지털 전환과 AI 도입을 가속화하는 것이 핵심 목표다. IBM 스토리지 샘 워너(Sam Werner) 부사장은 "AI 시대에는 데이터를 단순히 저장하는 공간을 넘어, 지능형 데이터 플랫폼이 되어야 한다"고 강조했다. 그는 "IBM 퓨전과 CAS 기술 등을 통해 데이터 분석 효율 및 통합을 강화하며, 기업의 디지털 전환과 AI 도입 가속화를 적극 지원하고 있다"고 설명했다. ▲ IBM 스토리지 샘 워너(Sam Werner) 부사장 IBM의 AI 최적화 스토리지 솔루션은 이미 국내 다양한 분야의 기업들에서 성과를 보이고 있다. AI 스타트업 파일러는 IBM SSS5300과 DGX B200을 도입해 AI 개발 환경을 최적화했으며, 서울시복지재단은 IBM 플래시시스템 기반 인프라로 데이터 처리 구조를 개선하고 장애 대응성을 크게 강화했다. 교육 분야에서는 한국전통문화대학교가 전통문화 콘텐츠 공유 시스템을 구축해 안정적인 디지털 기반을 확보했고, 지오영그룹의 케어캠프는 IBM 플래시시스템 7300 기반 랜섬웨어 대응 인프라를 구축해 사이버 보안을 대폭 강화하는 성과를 거뒀다. 한국IBM 스토리지 비즈니스 총괄 박대성 상무는 "단순한 스토리지 제품 판매를 넘어서, AI 시대를 위한 지능형 데이터 인프라를 통해 국내 기업의 디지털 전환과 AI 도입을 종합적으로 지원하고 있다"고 밝혔다. 이를 통해 기업들은 데이터 분석 효율성을 높이고 운영 비용을 절감하는 동시에 보안을 강화할 수 있을 것으로 기대된다고 덧붙였다. ▲ 한국IBM 스토리지 비즈니스 총괄 박대성 상무 한편, IBM의 이번 전략 발표는 급속히 확산되는 AI 기술과 이에 따른 데이터 폭증 현상에 대응하기 위한 선제적 움직임으로 평가되며, 국내 기업들의 AI 인프라 구축과 디지털 혁신에 새로운 전환점을 제공할 것으로 전망된다.

작성일 : 2025-05-27

인텔, GPU 가속 AI 성능 높인 제온 6 프로세서 신제품 출시

인텔은 최첨단 그래픽 처리 장치(GPU) 기반 AI 시스템을 처리하기 위해 설계한 프로세서 3종을 인텔 제온 6(Intel Xeon 6) 시리즈에 추가해 출시한다고 발표했다. 새롭게 공개한 제품은 P-코어 기반 제품으로 PCT(Priority Core Turbo) 기술과 인텔 SST-TF(Intel Speed Select Technology-Turbo Frequency) 기능을 결합해, AI 워크로드에 필요한 CPU 코어 주파수를 상황에 맞춰 극대화함으로써 GPU 성능을 한층 끌어올린다. PCT 기술은 인텔 SST-TF 기능과 결합돼 AI 시스템 성능을 끌어올린다. PCT는 고우선순위 코어(HP 코어)에 터보 주파수를 동적으로 우선 할당해 더 높은 속도로 동작하도록 하며, 저우선순위 코어(LP 코어)는 기본 주파수로 작동해 CPU 자원을 효율적으로 분산한다. 이 기능은 순차적 또는 직렬 처리가 요구되는 AI 워크로드에 특히 효과적이며, GPU에 데이터를 더 빠르게 공급하고 전체 시스템 효율을 높이는 데 기여한다. 인텔은 제온 6 P-코어 프로세서가 모든 AI 시스템에 업계 최고 수준의 성능을 제공한다고 전했다. 이 프로세서는 CPU당 최대 128개의 P-코어를 탑재해, 복잡한 AI 작업도 균형 있게 처리할 수 있도록 워크로드를 효율적으로 분산한다. 메모리 속도가 최대 30% 향상되었으며, MRDIMM 및 CXL을 통해 높은 수준의 메모리 대역폭을 지원한다. 인텔 제온 6는 이전 세대 대비 최대 20% 더 많은 PCIe 레인을 제공해, I/O 집약적 워크로드에서 한층 더 빠른 데이터 전송을 지원하며, 신뢰성, 가용성, 유지보수 기능을 바탕으로 비즈니스 중단을 최소화하고 최상의 시스템 가동 시간을 제공한다. 그리고 인텔 첨단 벡터 확장(AMX)은 반정밀도 부동소수점(FP16) 연산을 지원해 AI 워크로드에서 효율적인 데이터 전처리와 주요 CPU 작업 수행을 가능하게 한다. 인텔은 기업들이 인공지능(AI) 수요 증가에 대응해 인프라를 고도화함에 따라, 고성능 P-코어를 탑재한 인텔 제온 6 프로세서가 성능과 에너지 효율을 모두 갖춘 최적의 설루션을 제공한다고 전했다. “다양한 데이터센터 및 네트워크 환경을 폭넓게 지원하며, AI에 최적화된 CPU 설루션 분야에서 인텔의 리더십을 한층 강화하고 있다”는 것이 인텔의 설명이다. 한편, 인텔은 이번에 공개된 제품군 가운데 제온 6776P가 엔비디아의 최신 AI 가속 시스템인 DGX B300의 호스트 CPU로 채택되었다고 발표했다. DGX B300에 탑재된 제온 6776P는 대규모 모델 및 데이터셋 운용에 필요한 메모리 용량과 대역폭을 제공하며, AI 가속화 시스템을 관리, 조율 및 지원하는데 중요한 역할을 한다. 인텔의 데이터센터 및 AI 그룹 임시 총괄인 카린 엡시츠 시갈(Karin Eibschitz Segal) 부사장(CVP)은 “새롭게 추가한 제온 라인업은 인텔 제온 6가 지닌 독보적 성능을 입증하며, 차세대 GPU 가속 AI 시스템에 가장 최적화된 CPU”라면서, “인텔은 엔비디아와의 협업을 강화해 업계 최고 수준의 AI 시스템을 제공하고, 산업 전반에서 AI 도입을 가속화할 수 있도록 지원할 것”이라고 전했다.

작성일 : 2025-05-23

엔비디아, 개인용 AI 슈퍼컴퓨터 ‘DGX 스파크, ‘DGX 스테이션’ 공개

엔비디아는 글로벌 시스템 제조업체들이 개인용 AI 슈퍼컴퓨터인 엔비디아 DGX 스파크(NVIDIA DGX Spark)와 DGX 스테이션(DGX Station) 시스템을 구축할 예정이라고 발표했다. 엔비디아는 DGX 스파크와 DGX 스테이션의 가용성이 확대되면서 전 세계 개발자, 데이터 과학자, 연구원이 높은 성능과 효율을 경험할 수 있게 될 것으로 기대하고 있다. 기업, 소프트웨어 제공업체, 정부 기관, 스타트업, 연구 기관 등에서은 데이터 크기, 독점 모델 프라이버시 또는 확장 속도에 영향을 주지 않으면서 데스크톱 폼 팩터에서 AI 서버의 성능과 기능을 제공할 수 있는 강력한 시스템을 필요로 한다. 자율적인 의사 결정과 작업 수행이 가능한 에이전틱 AI(Agentic AI) 시스템의 부상은 이러한 요구를 더욱 증폭시키고 있다. 엔비디아 그레이스 블랙웰(Grace Blackwell) 플랫폼을 기반으로 하는 DGX 스파크와 DGX 스테이션은 개발자들이 데스크톱에서 데이터센터에 이르기까지 모델의 프로토타이핑, 미세 조정, 추론 등을 실행할 수 있도록 지원한다. DGX 스파크에는 엔비디아 GB10 그레이스 블랙웰 슈퍼칩(Superchip)과 5세대 텐서 코어(Tensor Core)가 탑재돼 있다. 이는 최대 1페타플롭(petaflop)의 AI 컴퓨팅 성능과 128GB의 통합 메모리를 제공하며, 엔비디아 DGX 클라우드(DGX Cloud)나 기타 가속화된 클라우드 또는 데이터센터 인프라로 모델을 원활하게 내보낼 수 있다. 간소한 패키지로 강력한 성능과 기능을 제공하는 DGX 스파크는 개발자, 연구원, 데이터 과학자, 학생들이 생성형 AI의 한계를 뛰어넘고 산업 전반의 워크로드를 가속화할 수 있도록 지원한다. 까다로운 AI 워크로드를 위해 설계된 DGX 스테이션은 엔비디아 GB300 그레이스 블랙웰 울트라 데스크톱 슈퍼칩(Ultra Desktop Superchip)을 탑재해 최대 20페타플롭의 AI 성능과 784GB의 통합 시스템 메모리를 제공한다. 또한 이 시스템에는 고속 연결과 멀티스테이션 확장을 위해 최대 800Gb/s의 네트워킹 속도를 지원하는 엔비디아 커넥트X-8 슈퍼NIC(ConnectX-8 SuperNIC)도 탑재했다. DGX 스테이션은 고급 AI 모델을 로컬 데이터로 실행하는 단일 사용자용 데스크톱으로 활용할 수 있으며, 여러 사용자를 위한 온디맨드 중앙 집중식 컴퓨팅 노드로도 사용할 수 있다. 이 시스템은 엔비디아 멀티 인스턴스(Multi-Instance) GPU 기술을 지원해 최대 7개의 인스턴스로 분할할 수 있다. 각 인스턴스는 독립적인 고대역폭 메모리, 캐시, 컴퓨팅 코어를 갖춰 데이터 과학과 AI 개발 팀을 위한 개인 클라우드로 활용할 수 있다. 또한, DGX 스파크와 DGX 스테이션은 산업용 AI 팩토리를 구동하는 소프트웨어 아키텍처를 반영한다. 두 시스템 모두 최신 엔비디아 AI 소프트웨어 스택으로 사전 구성된 엔비디아 DGX 운영 체제를 사용하며, 엔비디아 NIM 마이크로서비스와 엔비디아 블루프린트(Blueprints)에 대한 액세스를 제공한다. 개발자는 파이토치(PyTorch), 주피터(Jupyter), 올라마(Ollama)와 같은 일반적인 도구를 사용해 DGX 스파크에서 프로토타이핑 생성, 미세 조정, 추론을 수행할 수 있다. 그리고 이를 DGX 클라우드나 가속화된 데이터센터 또는 클라우드 인프라에 원활하게 배포할 수 있다. DGX 스파크는 7월부터 에이서, 에이수스, 델 테크노로지스, 기가바이트, HP, 레노버, MSI를 비롯한 글로벌 채널 파트너를 통해 출시될 예정이며, 현재 예약이 진행 중이다. DGX 스테이션은 올해 말 에이수스, 델 테크놀로지스, 기가바이트, HP, MSI에서 출시될 예정이다. 엔비디아의 젠슨 황(Jensen Huang) 창립자 겸 CEO는 “AI는 실리콘에서 소프트웨어에 이르기까지 컴퓨팅 스택의 모든 계층을 혁신했다. AI 혁신을 촉발한 DGX-1 시스템의 직계 후속인 DGX 스파크와 DGX 스테이션은 차세대 AI 연구와 개발을 지원하기 위해 처음부터 새롭게 설계됐다”고 말했다.

작성일 : 2025-05-19

엔비디아, 오라클 클라우드 인프라에 블랙웰 GPU 지원

엔비디아가 오라클에 엔비디아 블랙웰(NVIDIA Blackwell) GPU를 지원해 에이전틱 AI와 추론 모델의 혁신을 가속화하고 있다고 밝혔다. 오라클은 자사 데이터센터에 수랭식 엔비디아 GB200 NVL72 랙을 최초로 도입하고 최적화했다. 현재 수천 개의 엔비디아 블랙웰 GPU가 엔비디아 DGX 클라우드(DGX Cloud)와 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure : OCI)를 통해 고객이 사용할 수 있도록 배치되고 있다. 이는 차세대 추론 모델과 AI 에이전트 개발과 실행을 지원한다. 오라클이 도입한 GB200에는 고속 엔비디아 퀀텀-2 인피니밴드(Quantum-2 InfiniBand)와 엔비디아 스펙트럼-X 이더넷(Spectrum-X Ethernet) 네트워킹이 포함된다. 이를 통해 확장 가능하고 저지연 성능을 구현하며, 엔비디아와 OCI 소프트웨어와 데이터베이스 통합의 풀스택을 지원한다. OCI는 엔비디아 GB200 NVL72 시스템을 최초로 도입한 기업 중 하나이다. OCI는 세계 최대 규모의 블랙웰 클러스터를 구축하려는 계획을 갖고 있다. OCI 슈퍼클러스터(Supercluster)는 10만 개 이상의 엔비디아 블랙웰 GPU로 확장해 전 세계적으로 급증하는 추론 토큰과 가속 컴퓨팅 수요를 충족할 예정이다. 지난 몇 주 사이 오픈AI(OpenAI)를 비롯한 여러 기업에서 새로운 추론 모델을 출시하면서 AI 혁신은 빠른 속도로 계속되고 있다. 엔비디아는 “OCI의 사례는 엔비디아 그레이스(Grace) 블랙웰 시스템이 전 세계적으로 본격 가동되기 시작한 최신 사례이다. 이는 클라우드 데이터센터를 대규모 인텔리전스를 제조하는 AI 팩토리로 탈바꿈시키고 있다”고 설명했다. 이러한 새로운 AI 팩토리는 36개의 엔비디아 그레이스 CPU와 72개의 엔비디아 블랙웰 GPU를 결합한 랙 스케일 시스템인 엔비디아 GB200 NVL72 플랫폼을 활용한다. 이를 통해 고급 AI 추론 모델 기반의 에이전틱 AI를 위한 고성능과 에너지 효율을 제공한다. OCI는 모든 규모의 고객에게 블랙웰을 제공할 수 있는 유연한 배포 옵션을 지원한다. 여기에는 공공, 정부, 소버린 클라우드는 물론 OCI 전용 리전(Dedicated Region)과 OCI 알로이(Alloy)를 통한 고객 소유의 데이터센터까지 포함된다. 한편 새로운 GB200 NVL72 랙은 엔비디아 DGX 클라우드에서 사용할 수 있는 첫 번째 시스템이다. 엔비디아 DGX 클라우드는 OCI와 같은 주요 클라우드에서 AI 워크로드를 개발하고 배포하기 위해 소프트웨어, 서비스, 기술 지원을 제공하는 최적화된 플랫폼이다. 엔비디아는 추론 모델 훈련, 자율주행차 개발, 칩 설계와 제조 가속화, AI 도구 개발 등 다양한 프로젝트에 이 랙을 사용할 예정이다. GB200 NVL72 랙은 현재 DGX 클라우드와 OCI에서 사용할 수 있다.

작성일 : 2025-04-30

[칼럼] AI의 거대한 파도, 엔비디아가 만드는 미래

트렌드에서 얻은 것 No. 22 AI 시대, 우리는 어떤 미래를 만들어갈 것인가?” – 젠슨 황 AI의 거대한 파도, 엔비디아가 만드는 미래 엔비디아는 2024년과 2025년 GTC(GPU Technology Conference)에서 AI 기술을 통해 산업 전반에 걸친 변화를 이끌어가고 있다. 젠슨 황은 기조연설에서 기술 혁신이 사회적, 경제적 구조를 재편하는 ‘변화의 파도’라고 강조하며, 엔비디아가 그 중심에서 미래를 설계하고 있음을 확신시켰다. 엔비디아는 두 해 동안 AI 혁신을 가속화하며 다양한 제품과 플랫폼을 선보였다. 2024년에는 GB200 AI 플랫폼과 블랙웰(Blackwell) DGX B200 GPU를 통해 성능 향상에 초점을 맞췄다면, 2025년에는 블랙웰 울트라(Blackwell Ultra) 기반의 NVL72 등 차세대 하드웨어와 지속 가능성을 강조하며 더 큰 비전을 제시했다. 표 1. 2024년과 2025년 엔비디아의 주요 발표 비교 인공지능 혁명의 변곡점에서 인류는 늘 기술의 발전과 함께 새로운 시대를 맞이해 왔다. 산업혁명이 증기기관과 전기를 통해 생산 방식을 혁신했던 것처럼, 디지털 혁명은 인터넷과 스마트폰을 통해 세상을 연결했다. 그리고 지금, 우리는 또 하나의 거대한 변곡점에 서 있다. 바로 AI 혁명이다. 2025년 3월, 엔비디아의 GTC에서 젠슨 황 CEO는 기조연설을 통해 AI가 변화의 중요한 시점에 도달했음을 선언했다. 그는 AI가 단순한 도구를 넘어 ‘스스로 사고하고 결정하는 존재’로 발전하고 있으며, 이 거대한 변화가 기업, 산업, 그리고 인간의 삶 전반에 걸쳐 영향을 미칠 것이라고 강조했다. 이번 GTC 2025에서 가장 주목받은 키워드는 에이전틱 AI(agentic AI)와 추론 AI(reasoning AI)였다. 기존의 AI가 데이터를 분석하고 패턴을 찾는 데 주력했다면, 이제 AI는 자율적으로 목표를 설정하고 스스로 문제를 해결하는 방향으로 나아가고 있다. 이러한 변화는 단순한 업그레이드가 아니라, AI 산업 전반의 패러다임을 뒤흔드는 파도와 같다. 이러한 흐름 속에서 엔비디아는 블랙웰 GPU라는 차세대 칩을 공개하며, 인공지능 모델의 효율성을 비약적으로 향상시키는 새로운 하드웨어 시대를 열었다. 또한 옴니버스 클라우드 API(Omniverse Cloud API), AI 팩토리(AI Factories) 등의 개념을 통해 AI가 단순한 연구 도구가 아니라, 실제 산업을 자동화하고 혁신하는 핵심 인프라로 자리 잡아가고 있음을 보여주었다. 그렇다면 우리는 이러한 변화의 바람 속에서 어떤 선택을 해야 할까? AI 혁명의 파도를 넘는 기업과 뒤처지는 기업의 차이는 무엇일까? 엔비디아의 발표를 중심으로 AI 산업이 어디로 흘러가고 있는지, 그리고 그 변화 속에서 우리는 무엇을 준비해야 하는지를 하나씩 짚어보자. “AI가 단순한 연구 프로젝트에서 벗어나, 본격적인 산업 혁신의 중심으로 자리 잡는 것” – 젠슨 황 블랙웰, AI의 새로운 엔진 기술 혁신의 역사는 더 빠르고 더 강력하며 더 효율적인 도구를 만들려는 인간의 끝 없는 도전과 함께 발전해 왔다. AI 산업도 예외가 아니다. 과거에는 단순한 이미지 분석과 음성 인식이 AI의 주요 활용 분야였다면, 이제는 스스로 학습하고 결정을 내리며 복잡한 문제를 해결하는 AI가 요구되고 있다. 하지만 이런 고도화된 AI 모델을 운용하려면 엄청난 연산 능력이 필요하며, 이를 뒷받침할 강력한 하드웨어가 필수이다. GTC 2025에서 젠슨 황이 가장 먼저 소개한 것은 블랙웰 GPU였다. 그는 “AI의 미래를 가속하는 가장 강력한 엔진”이라며, 블랙웰이 기존 호퍼(Hopper) 아키텍처를 넘어선 새로운 시대의 핵심 기술이라고 강조했다. 그렇다면 블랙웰 GPU는 무엇이 다를까? 블랙웰 GPU는 기존 호퍼 아키텍처 대비 연산 성능이 2배 이상 향상되었으며, 특히 대규모 AI 모델을 실행할 때의 전력 효율이 4배 증가했다. 이는 곧 더 적은 에너지로 더 강력한 AI 모델을 훈련하고 실행할 수 있다는 의미다. 젠슨 황은 연설에서 “블랙웰은 단순한 속도 개선이 아니라, AI 연구자들이 더 크고 복잡한 모델을 현실적으로 활용할 수 있도록 지원하는 플랫폼”이라고 설명했다. 이제 AI 연구자는 엄청난 비용을 감수하지 않고도 보다 정교한 생성형 AI, 실시간 데이터 처리, 고도화된 시뮬레이션 등을 구현할 수 있게 되었다. 엔비디아는 블랙웰 GPU와 함께 옴니버스 클라우드 API를 발표했다. 이는 단순한 클라우드 컴퓨팅 설루션이 아니라, AI 모델 개발 및 실행을 위한 강력한 협업 플랫폼이다. 옴니버스 클라우드 API는 데이터센터, AI 연구소, 기업의 IT 인프라를 하나의 거대한 AI 네트워크로 연결하여, 개발자들이 실시간으로 협업하고 AI 모델을 학습할 수 있도록 지원한다. 이는 특히 자율주행, 산업 자동화, 로보틱스 같은 분야에서 AI의 혁신 속도를 극적으로 끌어올릴 것으로 기대된다. 젠슨 황은 “AI 개발은 더 이상 한 기업이나 연구소만의 일이 아니다. 옴니버스 클라우드 API를 통해 전 세계의 AI 개발자가 하나로 연결될 것”이라며, AI 연구의 새로운 생태계를 제시했다. 또 한 가지 주목할 점은 AI 팩토리(인공지능 공장) 개념이다. 젠슨 황은 AI를 ‘새로운 산업 혁명의 동력’으로 표현하며, AI 팩토리가 데이터를 가공하고 AI 모델을 대량으로 생산하는 핵심 인프라가 될 것이라고 설명했다. 이 개념을 이해하려면 기존 제조업과 비교해보면 쉽다. 과거에는 자동차나 전자제품을 생산하는 공장이 경제의 중심이었지만, 미래에는 AI를 학습하고, 최적화하고, 배포하는 ‘AI 공장’이 가장 중요한 인프라가 될 것이다. 젠슨 황은 AI 팩토리가 AI 기반 자율주행, 로봇, 데이터 분석, 금융 모델링 등 다양한 산업에서 필수 역할을 하게 될 것이라고 강조했다. 블랙웰 GPU, 옴니버스 클라우드 API, AI 팩토리는 단순한 기술 발전이 아니다. 이들은 AI가 단순한 연구 프로젝트에서 벗어나 본격적인 산업 혁신의 중심으로 자리 잡는 것을 의미한다. 과거에도 GPU의 성능 향상이 AI 산업에 변화를 가져온 적이 있다. 2012년 알렉스넷(AlexNet)이 GPU 가속을 이용해 딥러닝의 가능성을 처음 보여줬고, 2017년 트랜스포머(transformer) 모델이 등장하며 자연어 처리 AI가 급격히 발전했다. 그리고 2025년에는 블랙웰이 AI의 자율성과 창의성을 한 단계 끌어올리는 전환점이 될 것이다. 젠슨 황이 기조연설에서 블랙웰을 소개하며 한 말이 특히 인상적이었다. “AI는 이제 단순한 도구가 아니라 스스로 사고하고 결정하는 존재로 나아가고 있다.” 이 말은 곧, 우리가 맞이할 AI의 미래가 이전과는 전혀 다른 차원이라는 것을 시사한다. 그리고 그 변화를 가속하는 엔진이 바로 블랙웰이다. “이제 AI는 단순한 계산기가 아니라, 실제로 ‘생각하고 판단하는 존재’가 되어야 한다.” – 젠슨 황 엔비디아가 던진 화두, 에이전틱 AI와 추론 AI AI 기술의 발전은 단순히 연산 능력을 향상시키는 것에 그치지 않는다. 더 중요한 것은 AI의 ‘사고 방식’이 바뀌고 있다는 점이다. 지금까지의 AI는 데이터를 학습하고 패턴을 인식하는 역할을 해왔다. 하지만 이제 AI는 스스로 목표를 설정하고, 상황에 맞게 판단하며, 능동적으로 문제를 해결하는 방향으로 진화하고 있다. GTC 2025에서 젠슨 황이 강조한 에이전틱 AI와 추론 AI는 바로 이러한 변화의 핵심 개념이다. 그는 이 두 가지 개념이 AI를 단순한 도구에서 ‘자율적 지능’으로 변화시키는 결정적 요소라고 설명했다. 그렇다면 에이전틱 AI와 추론 AI는 무엇이며, 어떤 변화를 가져올까? 에이전틱 AI의 핵심은 AI가 인간의 지시 없이도 능동적으로 목표를 설정하고, 실행할 수 있도록 만드는 것이다. 기존의 AI는 주어진 데이터와 명령에 따라 최적의 결과를 도출하는 ‘수동적’ 존재였다. 하지만 에이전틱 AI는 스스로 목표를 설정하고, 문제를 해결하는 ‘능동적’ 존재로 변하고 있다. 젠슨 황은 에이전틱 AI를 활용하면 인간이 직접 개입하지 않아도 AI가 알아서 문제를 해결하는 시대가 열린다고 강조했다. 추론 AI는 한 단계 더 나아가, AI가 단순한 패턴 인식을 넘어 논리적 사고를 수행할 수 있도록 만드는 기술이다. 기존 AI 모델은 데이터를 학습하고 특정 패턴을 기반으로 예측을 수행했지만, 그 과정에서 왜 이런 결론이 나왔는지 설명하지 못하는 경우가 많았다. 그러나 추론 AI는 AI가 논리적인 판단을 수행하고, 의사결정의 과정을 설명할 수 있도록 하는 것을 목표로 한다. 젠슨 황은 “이제 AI는 단순한 계산기가 아니라, 실제로 ‘생각하고 판단하는 존재’가 되어야 한다”며, 추론 AI가 향후 AI 발전의 핵심이 될 것이라고 강조했다. 젠슨 황이 강조한 에이전틱 AI와 추론 AI는 개별적인 개념이 아니라, 서로 결합될 때 가장 강력한 시너지를 발휘한다. 에이전틱 AI는 AI가 스스로 목표를 설정하고, 문제를 해결할 수 있도록 한다. 추론 AI는 AI가 단순한 계산이 아니라, 논리적 사고를 통해 최적의 결정을 내릴 수 있도록 한다. 이 두 가지가 결합되면, AI는 단순한 보조 도구를 넘어서 ‘진정한 지능(Artificial General Intelligence : AGI)’에 가까워질 것이다. 이러한 AI의 발전은 산업 전반에 걸쳐 거대한 변화의 파도를 일으킬 것이며, 기업들은 단순한 AI 도입을 넘어서 AI를 기업 전략의 중심으로 삼아야 하는 시점에 이르렀다. “AI 팩토리를 구축하여 AI 자체를 ‘생산하는 능력’을 가져야 한다.” – 젠슨 황 AI 팩토리, AI 혁명을 생산하는 공장 이제 AI는 단순한 소프트웨어가 아니라 하나의 ‘산업’으로 성장하고 있다. GTC 2025에서 젠슨 황이 강조한 개념 중 하나가 바로 AI 팩토리(인공지능 공장)이다. 그는 AI 팩토리를 가리켜 ‘미래 산업의 심장’이라고 표현했다. 그렇다면 AI 팩토리란 무엇이며, 왜 중요할까? 이 개념이 가져올 변화는 무엇일까? 기존의 데이터센터는 단순한 컴퓨팅 인프라였다. 하지만 AI 팩토리는 데이터를 학습하고, AI 모델을 훈련하며, 새로운 AI 설루션을 ‘생산’하는 역할을 한다. 즉, AI가 AI를 만들어내는 공장이다. 젠슨 황은 AI 팩토리를 자동차 산업에 비유하며 설명했다. “과거에는 사람이 손으로 자동차를 조립했지만, 지금은 로봇이 자동차를 생산한다. AI도 마찬가지다. 미래에는 사람이 AI를 개발하는 것이 아니라, AI 팩토리에서 AI가 스스로 AI를 만들어내게 될 것이다.” 즉, AI 팩토리는 단순한 데이터 센터가 아니라 AI 혁명을 대량 생산하는 공장이 된다. 젠슨 황은 GTC 2025에서 "AI 팩토리를 구동하는 핵심 연산 장치는 블랙웰 GPU가 될 것"이라고 강조했다. AI 팩토리에서 생산되는 것은 반도체나 기계가 아니라 AI 자체다. 이 공장에서 에이전틱 AI, 추론 AI, 자율주행 AI, 생성형 AI 등이 대량으로 생산된다. 즉, AI 팩토리는 단순한 데이터 센터를 넘어 새로운 AI 산업의 허브가 된다. AI 팩토리가 등장하면 기업과 산업이 근본적으로 변화한다. 특히, 데이터를 기반으로 하는 모든 산업이 AI 팩토리를 도입할 가능56 · 성이 높다. 결국 AI 팩토리는 단순한 연구소가 아니라, 실제 AI 모델을 ‘대량 생산’하여 산업에 공급하는 핵심 인프라가 된다. 젠슨 황은 AI 팩토리의 등장이 단순한 기술 발전이 아니라 경제 패러다임의 변화라고 강조했다. 이제 기업은 단순히 AI를 도입하는 것을 넘어, AI 팩토리를 구축하여 AI 자체를 ‘생산하는 능력’을 가져야 한다. “AI를 도입하지 않는 기업은 도태될 것이다.” – 젠슨 황 AI의 도입, AI가 기업을 재설계한다 AI 혁명은 더 이상 선택이 아니다. GTC 2025에서 젠슨 황이 강조한 메시지는 명확했다. "AI를 도입하지 않는 기업은 도태될 것이다." 이제 AI는 기업 운영의 한 요소가 아니라 기업의 핵심 전략, 구조, 성장 엔진 자체로 변화하고 있다. 기업은 어떻게 AI를 도입하고 있으며, AI 도입이 비즈니스에 미치는 영향은 무엇일까? 과거 AI 도입은 단순한 자동화 도구 활용이었다. 그러나 이제 AI 도입(AI adoption)은 기업의 핵심 역량을 AI 중심으로 전환하는 과정이다. AI 도입은 이제 단순한 기술의 도입이 아니라, 기업의 전략과 문화 자체를 AI 중심으로 변화시키는 과정이다. AI 도입이 빠르게 진행될 수록, 기업들은 직접 AI를 개발하는 것이 아니라 필요한 AI 서비스를 구독하는 방식으로 활용하는 시대가 열리고 있다. AI 도입이 가속화되면서 기업들은 완전히 새로운 방식으로 운영되고 있다. 특히, 의사결정 구조, 업무 방식, 조직 문화가 AI 중심으로 변화하고 있다. 이제 AI는 단순한 도구가 아니다. AI 도입이 진행될 수록, 기업의 핵심 전략과 비즈니스 모델 자체가 AI 중심으로 변화하고 있다. 결국, AI 도입을 성공적으로 수행하는 기업만이 미래 시장에서 생존하고 성장할 수 있을 것이다. 표 2. 기존 기업 vs. AI 중심 기업의 차이점 AI는 혼자 발전할 수 없다. 모두가 함께 연결되어야 한다.” – 젠슨 황 네트워킹, AI 시대의 연결과 협업 AI가 기업의 핵심 전략이 되고 산업 전체가 AI 기반으로 재편되는 과정에서, 네트워킹(networking)의 중요성이 더욱 강조되고 있다. 과거 기업은 독립적으로 성장하는 전략을 취했지만, 이제 AI 시대에서는 기업 간 협력, 데이터 공유, AI 연구 협업이 필수이다. GTC 2025에서 젠슨 황은 이렇게 말했다. “AI는 혼자 발전할 수 없다. 모두가 함께 연결되어야 한다.” 그렇다면 AI 시대의 네트워킹은 어떻게 이루어지고 있으며, 어떤 기업이 AI 협업을 통해 새로운 가치를 창출하고 있을까? AI 네트워킹의 의미는 ‘AI는 연결을 필요로 한다’로 해석된다. AI 혁명이 가속화될 수록 기업들은 서로 연결될 필요가 있다. 즉, AI 네트워킹이란 기업들이 AI를 더 빠르고, 더 효율적으로, 더 윤리적으로 활용하기 위해 서로 협력하는 과정을 의미한다. AI 네트워킹을 실현하는 방식은 다양하지만, 현재 가장 중요한 세 가지 협력 모델을 살펴보자. AI 팜(AI farms)을 통해 개별 기업이 AI 인프라를 구축하는 부담을 줄이고, 더 빠르게 AI를 도입할 수 있다. AI 얼라이언스(AI alliance)를 통해 기업들은 경쟁이 아닌 협력을 기반으로 AI 혁신을 가속화하고 있다. 즉, AI 데이터 공유는 이제 개인정보 보호를 유지하면서도 기업들이 협력할 수 있는 새로운 방식으로 발전하고 있다. AI 네트워킹이 활성화됨에 따라, 기업들은 완전히 새로운 방식으로 연결되고 협력하고 있다. AI 시대에는 한 산업 내에서 경쟁하는 것이 아니라, 다양한 산업과 연결되는 것이 핵심 전략이 된다. 결과적으로, AI 네트워킹을 활용하는 기업들은 새로운 기회를 창출하고, 더 빠르게 AI 중심으로 전환하고 있다. “AI 혁명은 이제 되돌릴 수 없는 변곡점에 도달했다. 우리는 AI와 함께 새로운 미래를 설계해야 한다.” – 젠슨 황 AI 시대의 미래, 우리는 어디로 가는가 AI 혁명은 이제 단순한 기술 발전을 넘어 산업, 사회, 인간의 삶 자체를 근본적으로 변화시키고 있다. GTC 2025에서 젠슨 황은 말했다. “AI 혁명은 이제 되돌릴 수 없는 변곡점에 도달했다. 우리는 AI와 함께 새로운 미래를 설계해야 한다. ”그렇다면 AI의 미래는 어디로 향하고 있으며, 우리는 AI와 함께 어떤 세상을 만들어가야 할까? 에이전틱 AI와 추론 AI의 발전이다. 즉, AI가 단순한 ‘도구’가 아니라, 인간과 협력하는 ‘실제적인 파트너’가 되는 시대가 다가오고 있다. 기존의 AI는 패턴을 학습하는 방식이었다. 그러나 추론 AI는 스스로 논리적으로 사고하고 추론하는 능력을 갖춘다. 즉, AI가 더 이상 단순한 자동화 도구가 아니라, 지능적인 사고를 할 수 있는 존재로 변화하고 있다. AI가 점점 더 지능적으로 발전하면서, 우리는 ‘AI와의 관계를 어떻게 설정할 것인가’라는 근본적인 질문을 마주하게 되었다. 이제 AI는 단순한 도구를 넘어, 인간과 협력하여 새로운 가치를 창출하는 존재로 변화하고 있다. AI가 고도화될 수록 우리는 AI의 윤리적 문제와 사회적 책임에 대한 고민을 깊게 해야 한다. 결과적으로, 각국이 AI 규제와 발전 전략을 다르게 설정하면서 AI 패권 경쟁이 더욱 치열해지고 있다. AI는 단순한 기술이 아니라, 인류가 새로운 방식으로 사고하고 일하고 살아가는 방식을 바꾸는 거대한 전환점이 되고 있다. “AI는 이제 단순한 도구가 아니라, 스스로 사고하고 결정하는 존재로 나아가고 있다.” – 젠슨 황 변화의 바람을 넘어, AI와 함께 새로운 항해를 시작하다 AI 혁명은 거대한 바람이 아니라, 이제는 우리가 타고 항해해야 할 파도다. 과거에는 변화가 두려운 것이었다. 그러나, AI와 함께라면 우리는 변화 속에서도 새로운 기회를 창출할 수 있다. 엔비디아 GTC 2025에서 젠슨 황이 던진 질문을 기억하자. “AI 시대, 우리는 어떤 미래를 만들어갈 것인가?” 이제 우리는 AI와 함께 새로운 항해를 시작할 준비를 해야 한다. 그림 1. 엔비디아 기업 성장 맵(GTC 2024, 2025, Map by 류용효) (클릭하면 큰 이미지로 볼 수 있습니다.) ■ 류용효 디원의 상무이며 페이스북 그룹 ‘컨셉맵연구소’의 리더로 활동하고 있다. 현업의 관점으로 컨설팅, 디자인 싱킹으로 기업 프로세스를 정리하는데 도움을 주며, 1장의 빅 사이즈로 콘셉트 맵을 만드는데 관심이 많다. (블로그) ■ 기사 내용은 PDF로도 제공됩니다.

작성일 : 2025-04-02

엔비디아, AI 팩토리 구축 위한 새 옴니버스 블루프린트 출시

엔비디아가 미국 새너제이에서 열린 GTC에서 AI 팩토리의 설계와 최적화를 지원하는 새로운 엔비디아 옴니버스 블루프린트(NVIDIA Omniverse Blueprint)를 공개했다고 밝혔다. 이제 AI가 하나의 주류로 자리 잡으며, AI 훈련과 추론 전용 인프라이자 인텔리전스 생산의 핵심인 AI 팩토리에 대한 수요가 그 어느 때보다 급증하고 있다. 이러한 AI 팩토리(AI 훈련과 추론을 전담하는 특수 목적 인프라)의 대부분은 기가와트급 규모로 건설될 예정이다. 이러한 규모의 AI 팩토리를 구축하는 것은 엄청난 엔지니어링과 물류 작업이 필요한 일이다. 1기가와트 규모의 AI 팩토리 건설에는 공급업체, 건축가, 시공업체, 엔지니어 등 수만 명의 인력이 필요하며, 약 50억 개의 부품과 21만 마일 이상의 광케이블을 제작, 배송, 조립해야 한다. 엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 현지 시간으로 3월 18일 진행된 GTC 기조연설에서 엔비디아의 데이터센터 엔지니어링 팀이 옴니버스 블루프린트에서 1기가와트급 AI 팩토리를 계획, 최적화, 시뮬레이션할 수 있는 애플리케이션을 어떻게 개발했는지 그 과정을 소개했다. 엔지니어링 팀은 케이던스 리얼리티 디지털 트윈 플랫폼(Cadence Reality Digital Twin Platform)과 ETAP와 같은 선도적인 시뮬레이션 툴에 연결해 인프라 건설이 시작되기 훨씬 전, 전력과 냉각 그리고 네트워킹을 테스트하고 최적화할 수 있다. 시뮬레이션 우선 접근 방식을 채택하는 엔지니어링 AI 팩토리 AI 팩토리 설계와 운영을 위한 엔비디아 옴니버스 블루프린트는 오픈USD(Universal Scene Description, OpenUSD) 라이브러리를 사용한다. 이를 통해 개발자는 건물 자체, 엔비디아 가속 컴퓨팅 시스템, 슈나이더 일렉트릭(Schneider Electric)이나 버티브(Vertiv)와 같은 공급업체의 전력 또는 냉각 장치 등 서로 다른 소스에서 3D 데이터를 수집할 수 있다. 이 블루프린트는 수십억 개의 AI 팩토리 구성 요소에 대한 설계와 시뮬레이션을 통합함으로써 엔지니어가 다음과 같은 복잡한 문제를 해결할 수 있도록 돕는다. l 구성 요소 통합과 공간 최적화 - 엔비디아 DGX SuperPOD, GB300 NVL72 시스템 그리고 50억 개의 구성 요소의 설계와 시뮬레이션을 통합한다. l 냉각 시스템 성능과 효율성 - 엔비디아 쿠다(CUDA)와 옴니버스 라이브러리로 가속화된 케이던스 리얼리티 디지털 트윈 플랫폼을 사용해 버티브와 슈나이더 일렉트릭의 하이브리드 공랭식 또는 수랭식 솔루션을 시뮬레이션하고 평가한다. l 전력 분배와 신뢰성 - ETAP로 확장 가능한 이중화 전력 시스템을 설계해 전력 블록의 효율성과 신뢰성을 시뮬레이션한다. l 네트워킹 토폴로지(Networking topology)와 논리 - 엔비디아 스펙트럼-X(Spectrum-X) 네트워킹과 엔비디아 에어(Air) 플랫폼으로 고대역폭 인프라를 미세 조정한다. 옴니버스로 엔지니어링 사일로 해소 AI 팩토리 건설에서 가장 큰 과제 중 하나는 전력, 냉각, 네트워킹 등 각 분야의 팀이 개별적으로 운영되면서 비효율성과 잠재적인 오류를 초래한다는 점이다. 옴니버스 블루프린트를 활용하면 엔지니어들은 다음과 같은 방식으로 협업할 수 있다. l 맥락을 공유하며 협업 - 여러 엔지니어링 분야가 실시간 시뮬레이션을 공유하며 병렬로 설계하고 조정할 수 있어, 한 영역의 변경이 다른 영역에 미치는 영향을 즉시 파악할 수 있다. l 에너지 사용 최적화 - 실시간 시뮬레이션 업데이트를 통해 AI 워크로드에 가장 효율적인 설계를 도출할 수 있다. l 오류 발생 지점 제거 – 배포 전에 이중화 구성을 검증함으로써 비용이 많이 드는 다운타임 위험을 최소화할 수 있다. l 실제 환경 모델링 - 다양한 AI 워크로드가 냉각 성능, 전력 안정성, 네트워크 혼잡도에 미치는 영향을 예측하고 테스트할 수 있다. 이 블루프린트는 실시간 시뮬레이션을 각 엔지니어링 분야와 통합함으로써 운영 비용 모델링과 전력 활용 최적화를 위한 다양한 구성 방안을 탐색할 수 있도록 한다. 실시간 시뮬레이션으로 빨라지는 의사 결정 젠슨 황 CEO의 시연에서 엔지니어들은 실시간으로 AI 팩토리 구성 요소를 조정하고 그 영향을 즉시 확인할 수 있었다. 예를 들어, 냉각 레이아웃을 조금만 조정해도 효율성이 크게 개선됐는데, 이는 기존 문서 기반 설계에서는 놓치기 쉬운 요소이다. 또한, 기존에는 몇 시간씩 소요되던 시뮬레이션 결과를 단 몇 초 만에 확인해 전략을 테스트하고 개선할 수 있었다. 최적의 설계가 확정된 후에는 공급업체와 건설 팀과의 원활한 소통을 도와 실제 건축물이 모델 그대로 정확한 시공이 이루어질 수 있도록 보장했다. 미래를 대비하는 AI 팩토리 AI 워크로드는 지속적으로 변화한다. AI 애플리케이션의 차세대 물결은 전력, 냉각, 네트워킹에 대한 수요를 더욱 증가시킬 것이다. AI 팩토리 설계와 운영을 위한 옴니버스 블루프린트는 이러한 변화에 대비할 수 있도록 다음과 같은 기능을 제공한다. l 워크로드 인식 시뮬레이션 - AI 워크로드의 변화가 데이터센터 규모에서 전력과 냉각에 어떤 영향을 미칠지 예측한다. l 장애 시나리오 테스트 - 전력망 장애, 냉각 누수, 전력 급등을 모델링해 시스템 회복력을 보장한다. l 확장 가능한 업그레이드 - AI 팩토리 확장을 계획하고, 몇 년 후의 인프라 요구 사항을 예측한다. 또한 개조와 업그레이드를 계획할 때 비용과 다운타임을 쉽게 테스트하고 시뮬레이션해 미래에 대비한 AI 팩토리를 구축할 수 있다. AI 팩토리 운영자에게 있어 앞서 나간다는 것은 단순히 효율성을 높이는 것만이 아니라, 하루에 수백만 달러의 비용이 발생할 수 있는 인프라 장애를 방지하는 것이기도 하다. 1기가와트 AI 팩토리의 경우, 매일 발생하는 다운타임으로 1억 달러 이상의 비용이 발생할 수 있는데, 이 블루프린트는 인프라 문제를 미리 해결함으로써 위험과 배포 시간을 모두 줄여준다. AI 팩토리 운영을 위한 에이전틱 AI로 가는 길 엔비디아는 AI 기반 운영으로 확장하기 위한 다음 단계의 블루프린트를 마련하기 위해 버테크(Vertech)와 파이드라(Phaidra)와 같은 주요 기업들과 협력하고 있다. 버테크는 엔비디아 데이터센터 엔지니어링 팀과 협력해 고급 AI 팩토리 제어 시스템을 개발하고 있다. 이 시스템은 IT와 운영 기술 데이터를 통합해 운영 안정성과 가시성을 향상시킨다. 파이드라는 엔비디아와 협력해 강화 학습 기반 AI 에이전트를 옴니버스에 통합하고 있다. 이러한 에이전트는 실시간 시나리오 시뮬레이션을 통해 열 안정성과 에너지 효율을 최적화한다. 그리고 하드웨어와 환경 변화에 맞춰 지속적으로 적응하는 디지털 트윈을 생성한다. AI 데이터센터의 폭발적 성장 AI는 전 세계 데이터센터 환경을 빠르게 재편하고 있다. AI 기반 데이터센터 업그레이드에 1조 달러가 투자될 것으로 예상되는 가운데, 디지털 트윈 기술은 더 이상 선택이 아닌 필수다. AI 팩토리 설계와 운영을 위한 엔비디아 옴니버스 블루프린트는 엔비디아와 파트너 에코시스템이 이러한 변화를 주도할 수 있도록 지원한다. 이를 통해 AI 팩토리 운영자는 끊임없이 진화하는 AI 워크로드에 앞서 나가고, 다운타임을 최소화하며, 효율성을 극대화할 수 있다. 관련 링크 디지털 트윈을 활용해 기가와트급 AI 팩토리 구축하기

작성일 : 2025-03-23