• 회원가입
  • |
  • 로그인
  • |
  • 장바구니
  • News
    뉴스 신제품 신간 Culture & Life
  • 강좌/특집
    특집 강좌 자료창고 갤러리
  • 리뷰
    리뷰
  • 매거진
    목차 및 부록보기 잡지 세션별 성격 뉴스레터 정기구독안내 정기구독하기 단행본 및 기타 구입
  • 행사/이벤트
    행사 전체보기 캐드앤그래픽스 행사
  • CNG TV
    방송리스트 방송 다시보기 공지사항
  • 커뮤니티
    업체홍보 공지사항 설문조사 자유게시판 Q&A게시판 구인구직/학원소식
  • 디렉토리
    디렉토리 전체보기 소프트웨어 공급업체 하드웨어 공급업체 기계관련 서비스 건축관련 업체 및 서비스 교육기관/학원 관련DB 추천 사이트
  • 회사소개
    회사소개 회사연혁 출판사업부 광고안내 제휴 및 협력제안 회사조직 및 연락처 오시는길
  • 고객지원센터
    고객지원 Q&A 이메일 문의 기사제보 및 기고 개인정보 취급방침 기타 결제 업체등록결제
  • 쇼핑몰
통합검색 "트랜스포머"에 대한 통합 검색 내용이 98개 있습니다
원하시는 검색 결과가 잘 나타나지 않을 때는 홈페이지의 해당 게시판 하단의 검색을 이용하시거나 구글 사이트 맞춤 검색 을 이용해 보시기 바랍니다.
CNG TV 방송 내용은 검색 속도 관계로 캐드앤그래픽스 전체 검색에서는 지원되지 않으므로 해당 게시판에서 직접 검색하시기 바랍니다
엔비디아, ‘젯슨 토르’ 출시로 로보틱스·피지컬 AI 혁신 가속
엔비디아가 에지 환경에서 실시간 AI 추론을 수행할 수 있는 엔비디아 젯슨 토르(NVIDIA Jetson Thor) 모듈을 출시했다. 젯슨 토르는 연구와 산업 현장의 로봇 시스템에서 두뇌 역할을 수행하며, 휴머노이드와 산업용 로봇 등 다양한 로봇이 보다 스마트하게 동작하도록 지원한다. 로봇은 방대한 센서 데이터와 저지연 AI 처리를 요구한다. 실시간 로봇 애플리케이션을 실행하려면 여러 센서에서 동시 발생하는 데이터 스트림을 처리할 수 있는 충분한 AI 컴퓨팅 능력과 메모리가 필요하다. 현재 정식 출시된 젯슨 토르는 이전 모델인 엔비디아 젯슨 오린(Orin) 대비 AI 컴퓨팅이 7.5배, CPU 성능이 3.1배, 메모리 용량이 2배 향상돼 이러한 처리를 디바이스에서 가능하게 한다. 이러한 성능 도약은 로봇 연구자들이 고속 센서 데이터를 처리하고 에지에서 시각적 추론을 수행할 수 있도록 한다. 이는 기존에는 동적인 실제 환경에서 실행하기에는 속도가 너무 느려 실행하기 어려웠던 워크플로이다. 이로써 휴머노이드 로보틱스와 같은 멀티모달 AI 애플리케이션의 새로운 가능성을 열어주고 있다.   ▲ 엔비디아 젯슨 AGX 토르 개발자 키트   휴머노이드 로보틱스 기업인 어질리티 로보틱스(Agility Robotics)는 자사의 5세대 로봇인 디지트(Digit)에 엔비디아 젯슨을 통합했다. 이어서 6세대 디지트에는 온보드 컴퓨팅 플랫폼으로 젯슨 토르를 채택할 계획이다. 이를 통해 디지트는 실시간 인식과 의사결정 능력을 강화하고 점차 복잡해지는 AI 기술과 행동을 지원할 수 있게 된다. 디지트는 현재 상용화됐으며, 창고와 제조 환경에서 적재, 상차, 팔레타이징(palletizing) 등 물류 작업을 수행하고 있다. 30년 넘게 업계 최고 수준의 로봇을 개발해온 보스턴 다이내믹스(Boston Dynamics)는 자사 휴머노이드 로봇 아틀라스(Atlas)에 젯슨 토르를 탑재하고 있다. 이를 통해 아틀라스는 이전에는 서버급에서만 가능했던 컴퓨팅, AI 워크로드 가속, 고대역폭 데이터 처리, 대용량 메모리를 디바이스 내에서도 활용할 수 있게 됐다. 휴머노이드 로봇 외에도, 젯슨 토르는 더 크고 복잡한 AI 모델을 위한 실시간 추론을 통해 다양한 로봇 애플리케이션을 가속화할 예정이다. 여기에는 수술 보조, 스마트 트랙터, 배송 로봇, 산업용 매니퓰레이터(manipulator), 시각 AI 에이전트 등이 포함된다. 젯슨 토르는 생성형 추론 모델을 위해 설계됐다. 이는 차세대 피지컬 AI 에이전트가 클라우드 의존도를 최소화하면서 에지에서 실시간으로 실행될 수 있도록 한다. 차세대 피지컬 AI 에이전트는 대형 트랜스포머 모델, 비전 언어 모델(vision language model : VLM), 비전 언어 행동(vision language action : VLA) 모델을 기반으로 구동된다. 젯슨 토르는 젯슨 소프트웨어 스택으로 최적화돼 실제 애플리케이션에서 요구되는 저지연과 고성능을 구현한다. 따라서 젯슨 토르는 모든 주요 생성형 AI 프레임워크와 AI 추론 모델을 지원하며, 탁월한 실시간 성능을 제공한다. 여기에는 코스모스 리즌(Cosmos Reason), 딥시크(DeepSeek), 라마(Llama), 제미나이(Gemini), 큐원(Qwen) 모델과 함께, 로보틱스 특화 모델인 아이작(Isaac) GR00T N1.5 등이 포함된다. 이를 통해 개발자는 손쉽게 로컬 환경에서 실험과 추론을 실행할 수 있다. 젯슨 토르는 생애 주기 전반에 걸쳐 엔비디아 쿠다(CUDA) 생태계의 지원을 받는다. 또한 젯슨 토르 모듈은 전체 엔비디아 AI 소프트웨어 스택을 실행해 사실상 모든 피지컬 AI 워크플로를 가속화한다. 여기에는 로보틱스를 위한 엔비디아 아이작, 영상 분석 AI 에이전트를 위한 엔비디아 메트로폴리스(Metropolis), 센서 처리를 위한 엔비디아 홀로스캔(Holoscan) 등의 플랫폼이 활용된다. 이러한 소프트웨어 도구를 통해 개발자는 다양한 애플리케이션을 손쉽게 구축하고 배포할 수 있다. 실시간 카메라 스트림을 분석해 작업자 안전을 모니터링하는 시각 AI 에이전트, 비정형 환경에서 조작 작업을 수행할 수 있는 휴머노이드 로봇, 다중 카메라 스트림 데이터를 기반으로 외과의에게 안내를 제공하는 스마트 수술실 등이 그 예시이다. 젯슨 토르 제품군에는 개발자 키트와 양산용 모듈이 포함된다. 개발자 키트에는 젯슨 T5000 모듈과 다양한 연결성을 제공하는 레퍼런스 캐리어 보드, 팬이 장착된 액티브 방열판, 전원 공급 장치가 함께 제공된다. 엔비디아는 젯슨 생태계가 다양한 애플리케이션 요구사항과 고속 산업 자동화 프로토콜, 센서 인터페이스를 지원해 기업 개발자의 시장 출시 시간을 단축한다고 전했다. 하드웨어 파트너들은 다양한 폼팩터로 유연한 I/O와 맞춤형 구성을 갖춰 생산에 준비된 젯슨 토르 시스템을 개발하고 있다. 센서 및 액추에이터 업체들은 엔비디아 홀로스캔 센서 브릿지(Sensor Bridge)를 활용하고 있다. 이 플랫폼은 센서 융합과 데이터 스트리밍을 간소화하며, 카메라, 레이더, 라이다 등에서 발생한 센서 데이터를 초저지연으로 젯슨 토르 GPU 메모리에 직접 연결할 수 있게 해준다. 수천 개의 소프트웨어 기업들은 젯슨 토르에서 구동되는 다중 AI 에이전트 워크플로를 통해 기존 비전 AI와 로보틱스 애플리케이션 성능을 향상시킬 수 있다. 그리고 200만 명 이상의 개발자들이 엔비디아 기술을 활용해 로보틱스 워크플로를 가속화하고 있다.
작성일 : 2025-08-29
AI 기반 몰입형 사운드 디자인
AI 크리에이터 시대 : 영상 제작의 새로운 패러다임 (5)   생성형 AI를 활용한 음악 작곡 분야는 2022년부터 2025년에 걸쳐 급속한 발전을 보이고 있다. 특히 몰입형 사운드 기술과의 결합을 통해 새로운 패러다임을 제시하고 있다. 이번 호에는 연재의 마지막 회로 AI 음악 작곡의 핵심 기술과 서비스 소개, AI 음악 마스터링 등을 소개하면서 실감 미디어 분야의 공간적, 감각적 음향 경험을 만드는 생성형 AI를 활용한 몰입형 사운드를 조명한다.   ■ 연재순서 제1회 AI 영상 제작 생태계의 현재와 미래 제2회 AI 기반 크리에이티브 워크플로 혁신 제3회 소셜 미디어 최적화 AI 영상 제작 전략 제4회 AI 특수효과 및 후반작업 마스터하기 제5회 AI 기반 몰입형 사운드 디자인   ■ 최석영 AI프로덕션 감성놀이터의 대표이며, 국제고양이AI필름페스티벌 총감독이다. AI 칼럼니스트로도 활동하고 있다.   그림 1. 생성형 AI를 활용한 대표적인 작곡 서비스 스노(Suno, https://suno.com)   AI 음악 작곡의 핵심 기술 발전 현재 AI 음악 작곡의 주요 기술로는 트랜스포머 기반의 언어 모델을 음악에 적용한 뮤직LM(MusicLM), 뮤즈넷(MuseNET), 그리고 최근 등장한 스노(Suno)와 같은 플랫폼이 있다. 이들은 기존의 MIDI 기반 작곡을 넘어서 보컬의 목소리 톤, 음성, 성별 등을 조절할 수 있고, 간단하게 프롬프트 또는 음악 스타일을 텍스트로 적용하면 원하는 스타일의 음악을 작곡할 수 있다. 기존의 영화 제작과 쇼츠 작업에서는 작곡가와 함께 음악을 작업했으나, 지금은 AI와 협업하여 작업하고 있는 것이 현실화되었다. 공간을 연구하는 실감 미디어 분야와 XR(확장현실)에서는 몰입형 음향이 요구되며, 실제 게임과 미디어 아트 전시에서 많이 활용된다.   그림 2. 생성형 AI를 활용한 유튜브 힐링 음악 제작(https://youtu.be/lvLpGuhGgR4)   스노는 2022년에 설립했으며, 4명의 공동 창립자 마이클 슐만(Michael Shulman), 게오르그 쿠스코(Georg Kucsko), 마틴 카마초(Martin Camacho), 키넌 프레이버그(Keenan Freyberg)에 의해 시작되었다. 창립자들은 AI 오디오 분야가 미개척지이며 성장 가능성이 있다고 생각하여 뛰어들었다. 이후 마이크로소프트와의 파트너십을 통해 널리 알려지고 사용되었다. 영상과 쇼츠에 필요한 음악을 직접 만들 수 있다는 장점과 함께 2025년 7월 프로 버전에 편집 기능이 추가되어, 마치 영상 편집 프로그램처럼 특정한 부분을 편집 수정할 수 있게 됐다. 생성형 AI의 비디오 서비스만큼 AI 음악 사업도 업데이트가 자주 일어나며, 새로운 스타트업과 특화된 서비스가 나타나고 있다.   그림 3. 스노에 음악 편집 기능이 추가되었다.   간단하게 작곡을 AI로 만들고 싶다면 스노에서 10곡이 무료로 지원되며, 무료 버전에서는 상업적으로 이용할 수는 없다. 하지만 유료 버전에서는 상업적 작업에 활용이 가능하며 음악 플랫폼에 곡을 등록할 수도 있다.   그림 4. 무료로 음악을 만들 수 있는 사이트 유디오(Udio , www.udio.com)   스노처럼 작곡 서비스를 제공하는 사이트는 아이바(AIVA), 유디오(Udio), 사운드로(Soundraw) 등이 있으며, 만들어진 곡을 AI 마스터링하는 서비스도 있다. 글로벌하게 가장 많이 사용되는 서비스를 기준으로 단계별 과정을 설명한다.   그림 5. 많이 활용하는 마스터링 사이트 랜더(LANDR)의 업로드 과정(https://app.landr.com)   음악 제작에서 마지막 작업인 마스터링도 최종 결과물을 마스터링 서비스에 업로드하면 곡을 분석하고 원하는 부분을 체크하여 마스터링하며, 특정 부분만 수정하여 결과물을 만들 수 있는 제작 과정으로 구성된다. 심플하며 커스터마이징도 가능한 UI 및 UX를 적용하고 있다.     ■ 자세한 기사 내용은 PDF로 제공됩니다.
작성일 : 2025-08-04
[칼럼] AI의 거대한 파도, 엔비디아가 만드는 미래
트렌드에서 얻은 것 No. 22    AI 시대, 우리는 어떤 미래를 만들어갈 것인가?” – 젠슨 황   AI의 거대한 파도, 엔비디아가 만드는 미래 엔비디아는 2024년과 2025년 GTC(GPU Technology Conference)에서 AI 기술을 통해 산업 전반에 걸친 변화를 이끌어가고 있다. 젠슨 황은 기조연설에서 기술 혁신이 사회적, 경제적 구조를 재편하는 ‘변화의 파도’라고 강조하며, 엔비디아가 그 중심에서 미래를 설계하고 있음을 확신시켰다.  엔비디아는 두 해 동안 AI 혁신을 가속화하며 다양한 제품과 플랫폼을 선보였다. 2024년에는 GB200 AI 플랫폼과 블랙웰(Blackwell) DGX B200 GPU를 통해 성능 향상에 초점을 맞췄다면, 2025년에는 블랙웰 울트라(Blackwell Ultra) 기반의 NVL72 등 차세대 하드웨어와 지속 가능성을 강조하며 더 큰 비전을 제시했다.   표 1. 2024년과 2025년 엔비디아의 주요 발표 비교   인공지능 혁명의 변곡점에서 인류는 늘 기술의 발전과 함께 새로운 시대를 맞이해 왔다. 산업혁명이 증기기관과 전기를 통해 생산 방식을 혁신했던 것처럼, 디지털 혁명은 인터넷과 스마트폰을 통해 세상을 연결했다. 그리고 지금, 우리는 또 하나의 거대한 변곡점에 서 있다. 바로 AI 혁명이다. 2025년 3월, 엔비디아의 GTC에서 젠슨 황 CEO는 기조연설을 통해 AI가 변화의 중요한 시점에 도달했음을 선언했다. 그는 AI가 단순한 도구를 넘어 ‘스스로 사고하고 결정하는 존재’로 발전하고 있으며, 이 거대한 변화가 기업, 산업, 그리고 인간의 삶 전반에 걸쳐 영향을 미칠 것이라고 강조했다. 이번 GTC 2025에서 가장 주목받은 키워드는 에이전틱 AI(agentic AI)와 추론 AI(reasoning AI)였다. 기존의 AI가 데이터를 분석하고 패턴을 찾는 데 주력했다면, 이제 AI는 자율적으로 목표를 설정하고 스스로 문제를 해결하는 방향으로 나아가고 있다. 이러한 변화는 단순한 업그레이드가 아니라, AI 산업 전반의 패러다임을 뒤흔드는 파도와 같다. 이러한 흐름 속에서 엔비디아는 블랙웰 GPU라는 차세대 칩을 공개하며, 인공지능 모델의 효율성을 비약적으로 향상시키는 새로운 하드웨어 시대를 열었다. 또한 옴니버스 클라우드 API(Omniverse Cloud API), AI 팩토리(AI Factories) 등의 개념을 통해 AI가 단순한 연구 도구가 아니라, 실제 산업을 자동화하고 혁신하는 핵심 인프라로 자리 잡아가고 있음을 보여주었다. 그렇다면 우리는 이러한 변화의 바람 속에서 어떤 선택을 해야 할까? AI 혁명의 파도를 넘는 기업과 뒤처지는 기업의 차이는 무엇일까? 엔비디아의 발표를 중심으로 AI 산업이 어디로 흘러가고 있는지, 그리고 그 변화 속에서 우리는 무엇을 준비해야 하는지를 하나씩 짚어보자. “AI가 단순한 연구 프로젝트에서 벗어나, 본격적인 산업 혁신의 중심으로 자리 잡는 것” – 젠슨 황   블랙웰, AI의 새로운 엔진 기술 혁신의 역사는 더 빠르고 더 강력하며 더 효율적인 도구를 만들려는 인간의 끝 없는 도전과 함께 발전해 왔다. AI 산업도 예외가 아니다. 과거에는 단순한 이미지 분석과 음성 인식이 AI의 주요 활용 분야였다면, 이제는 스스로 학습하고 결정을 내리며 복잡한 문제를 해결하는 AI가 요구되고 있다. 하지만 이런 고도화된 AI 모델을 운용하려면 엄청난 연산 능력이 필요하며, 이를 뒷받침할 강력한 하드웨어가 필수이다. GTC 2025에서 젠슨 황이 가장 먼저 소개한 것은 블랙웰 GPU였다. 그는 “AI의 미래를 가속하는 가장 강력한 엔진”이라며, 블랙웰이 기존 호퍼(Hopper) 아키텍처를 넘어선 새로운 시대의 핵심 기술이라고 강조했다. 그렇다면 블랙웰 GPU는 무엇이 다를까? 블랙웰 GPU는 기존 호퍼 아키텍처 대비 연산 성능이 2배 이상 향상되었으며, 특히 대규모 AI 모델을 실행할 때의 전력 효율이 4배 증가했다. 이는 곧 더 적은 에너지로 더 강력한 AI 모델을 훈련하고 실행할 수 있다는 의미다. 젠슨 황은 연설에서 “블랙웰은 단순한 속도 개선이 아니라, AI 연구자들이 더 크고 복잡한 모델을 현실적으로 활용할 수 있도록 지원하는 플랫폼”이라고 설명했다. 이제 AI 연구자는 엄청난 비용을 감수하지 않고도 보다 정교한 생성형 AI, 실시간 데이터 처리, 고도화된 시뮬레이션 등을 구현할 수 있게 되었다. 엔비디아는 블랙웰 GPU와 함께 옴니버스 클라우드 API를 발표했다. 이는 단순한 클라우드 컴퓨팅 설루션이 아니라, AI 모델 개발 및 실행을 위한 강력한 협업 플랫폼이다. 옴니버스 클라우드 API는 데이터센터, AI 연구소, 기업의 IT 인프라를 하나의 거대한 AI 네트워크로 연결하여, 개발자들이 실시간으로 협업하고 AI 모델을 학습할 수 있도록 지원한다. 이는 특히 자율주행, 산업 자동화, 로보틱스 같은 분야에서 AI의 혁신 속도를 극적으로 끌어올릴 것으로 기대된다. 젠슨 황은 “AI 개발은 더 이상 한 기업이나 연구소만의 일이 아니다. 옴니버스 클라우드 API를 통해 전 세계의 AI 개발자가 하나로 연결될 것”이라며, AI 연구의 새로운 생태계를 제시했다. 또 한 가지 주목할 점은 AI 팩토리(인공지능 공장) 개념이다. 젠슨 황은 AI를 ‘새로운 산업 혁명의 동력’으로 표현하며, AI 팩토리가 데이터를 가공하고 AI 모델을 대량으로 생산하는 핵심 인프라가 될 것이라고 설명했다. 이 개념을 이해하려면 기존 제조업과 비교해보면 쉽다. 과거에는 자동차나 전자제품을 생산하는 공장이 경제의 중심이었지만, 미래에는 AI를 학습하고, 최적화하고, 배포하는 ‘AI 공장’이 가장 중요한 인프라가 될 것이다. 젠슨 황은 AI 팩토리가 AI 기반 자율주행, 로봇, 데이터 분석, 금융 모델링 등 다양한 산업에서 필수 역할을 하게 될 것이라고 강조했다. 블랙웰 GPU, 옴니버스 클라우드 API, AI 팩토리는 단순한 기술 발전이 아니다. 이들은 AI가 단순한 연구 프로젝트에서 벗어나 본격적인 산업 혁신의 중심으로 자리 잡는 것을 의미한다. 과거에도 GPU의 성능 향상이 AI 산업에 변화를 가져온 적이 있다. 2012년 알렉스넷(AlexNet)이 GPU 가속을 이용해 딥러닝의 가능성을 처음 보여줬고, 2017년 트랜스포머(transformer) 모델이 등장하며 자연어 처리 AI가 급격히 발전했다. 그리고 2025년에는 블랙웰이 AI의 자율성과 창의성을 한 단계 끌어올리는 전환점이 될 것이다. 젠슨 황이 기조연설에서 블랙웰을 소개하며 한 말이 특히 인상적이었다. “AI는 이제 단순한 도구가 아니라 스스로 사고하고 결정하는 존재로 나아가고 있다.” 이 말은 곧, 우리가 맞이할 AI의 미래가 이전과는 전혀 다른 차원이라는 것을 시사한다. 그리고 그 변화를 가속하는 엔진이 바로 블랙웰이다. “이제 AI는 단순한 계산기가 아니라, 실제로 ‘생각하고 판단하는 존재’가 되어야 한다.” – 젠슨 황   엔비디아가 던진 화두, 에이전틱 AI와 추론 AI AI 기술의 발전은 단순히 연산 능력을 향상시키는 것에 그치지 않는다. 더 중요한 것은 AI의 ‘사고 방식’이 바뀌고 있다는 점이다. 지금까지의 AI는 데이터를 학습하고 패턴을 인식하는 역할을 해왔다. 하지만 이제 AI는 스스로 목표를 설정하고, 상황에 맞게 판단하며, 능동적으로 문제를 해결하는 방향으로 진화하고 있다. GTC 2025에서 젠슨 황이 강조한 에이전틱 AI와 추론 AI는 바로 이러한 변화의 핵심 개념이다. 그는 이 두 가지 개념이 AI를 단순한 도구에서 ‘자율적 지능’으로 변화시키는 결정적 요소라고 설명했다. 그렇다면 에이전틱 AI와 추론 AI는 무엇이며, 어떤 변화를 가져올까? 에이전틱 AI의 핵심은 AI가 인간의 지시 없이도 능동적으로 목표를 설정하고, 실행할 수 있도록 만드는 것이다. 기존의 AI는 주어진 데이터와 명령에 따라 최적의 결과를 도출하는 ‘수동적’ 존재였다. 하지만 에이전틱 AI는 스스로 목표를 설정하고, 문제를 해결하는 ‘능동적’ 존재로 변하고 있다. 젠슨 황은 에이전틱 AI를 활용하면 인간이 직접 개입하지 않아도 AI가 알아서 문제를 해결하는 시대가 열린다고 강조했다. 추론 AI는 한 단계 더 나아가, AI가 단순한 패턴 인식을 넘어 논리적 사고를 수행할 수 있도록 만드는 기술이다. 기존 AI 모델은 데이터를 학습하고 특정 패턴을 기반으로 예측을 수행했지만, 그 과정에서 왜 이런 결론이 나왔는지 설명하지 못하는 경우가 많았다. 그러나 추론 AI는 AI가 논리적인 판단을 수행하고, 의사결정의 과정을 설명할 수 있도록 하는 것을 목표로 한다. 젠슨 황은 “이제 AI는 단순한 계산기가 아니라, 실제로 ‘생각하고 판단하는 존재’가 되어야 한다”며, 추론 AI가 향후 AI 발전의 핵심이 될 것이라고 강조했다. 젠슨 황이 강조한 에이전틱 AI와 추론 AI는 개별적인 개념이 아니라, 서로 결합될 때 가장 강력한 시너지를 발휘한다. 에이전틱 AI는 AI가 스스로 목표를 설정하고, 문제를 해결할 수 있도록 한다. 추론 AI는 AI가 단순한 계산이 아니라, 논리적 사고를 통해 최적의 결정을 내릴 수 있도록 한다. 이 두 가지가 결합되면, AI는 단순한 보조 도구를 넘어서 ‘진정한 지능(Artificial General Intelligence : AGI)’에 가까워질 것이다. 이러한 AI의 발전은 산업 전반에 걸쳐 거대한 변화의 파도를 일으킬 것이며, 기업들은 단순한 AI 도입을 넘어서 AI를 기업 전략의 중심으로 삼아야 하는 시점에 이르렀다. “AI 팩토리를 구축하여 AI 자체를 ‘생산하는 능력’을 가져야 한다.” – 젠슨 황   AI 팩토리, AI 혁명을 생산하는 공장 이제 AI는 단순한 소프트웨어가 아니라 하나의 ‘산업’으로 성장하고 있다. GTC 2025에서 젠슨 황이 강조한 개념 중 하나가 바로 AI 팩토리(인공지능 공장)이다. 그는 AI 팩토리를 가리켜 ‘미래 산업의 심장’이라고 표현했다. 그렇다면 AI 팩토리란 무엇이며, 왜 중요할까? 이 개념이 가져올 변화는 무엇일까? 기존의 데이터센터는 단순한 컴퓨팅 인프라였다. 하지만 AI 팩토리는 데이터를 학습하고, AI 모델을 훈련하며, 새로운 AI 설루션을 ‘생산’하는 역할을 한다. 즉, AI가 AI를 만들어내는 공장이다. 젠슨 황은 AI 팩토리를 자동차 산업에 비유하며 설명했다. “과거에는 사람이 손으로 자동차를 조립했지만, 지금은 로봇이 자동차를 생산한다. AI도 마찬가지다. 미래에는 사람이 AI를 개발하는 것이 아니라, AI 팩토리에서 AI가 스스로 AI를 만들어내게 될 것이다.” 즉, AI 팩토리는 단순한 데이터 센터가 아니라 AI 혁명을 대량 생산하는 공장이 된다. 젠슨 황은 GTC 2025에서 "AI 팩토리를 구동하는 핵심 연산 장치는 블랙웰 GPU가 될 것"이라고 강조했다. AI 팩토리에서 생산되는 것은 반도체나 기계가 아니라 AI 자체다. 이 공장에서 에이전틱 AI, 추론 AI, 자율주행 AI, 생성형 AI 등이 대량으로 생산된다. 즉, AI 팩토리는 단순한 데이터 센터를 넘어 새로운 AI 산업의 허브가 된다. AI 팩토리가 등장하면 기업과 산업이 근본적으로 변화한다. 특히, 데이터를 기반으로 하는 모든 산업이 AI 팩토리를 도입할 가능56 · 성이 높다. 결국 AI 팩토리는 단순한 연구소가 아니라, 실제 AI 모델을 ‘대량 생산’하여 산업에 공급하는 핵심 인프라가 된다. 젠슨 황은 AI 팩토리의 등장이 단순한 기술 발전이 아니라 경제 패러다임의 변화라고 강조했다. 이제 기업은 단순히 AI를 도입하는 것을 넘어, AI 팩토리를 구축하여 AI 자체를 ‘생산하는 능력’을 가져야 한다. “AI를 도입하지 않는 기업은 도태될 것이다.” – 젠슨 황   AI의 도입, AI가 기업을 재설계한다 AI 혁명은 더 이상 선택이 아니다. GTC 2025에서 젠슨 황이 강조한 메시지는 명확했다. "AI를 도입하지 않는 기업은 도태될 것이다." 이제 AI는 기업 운영의 한 요소가 아니라 기업의 핵심 전략, 구조, 성장 엔진 자체로 변화하고 있다. 기업은 어떻게 AI를 도입하고 있으며, AI 도입이 비즈니스에 미치는 영향은 무엇일까? 과거 AI 도입은 단순한 자동화 도구 활용이었다. 그러나 이제 AI 도입(AI adoption)은 기업의 핵심 역량을 AI 중심으로 전환하는 과정이다. AI 도입은 이제 단순한 기술의 도입이 아니라, 기업의 전략과 문화 자체를 AI 중심으로 변화시키는 과정이다. AI 도입이 빠르게 진행될 수록, 기업들은 직접 AI를 개발하는 것이 아니라 필요한 AI 서비스를 구독하는 방식으로 활용하는 시대가 열리고 있다. AI 도입이 가속화되면서 기업들은 완전히 새로운 방식으로 운영되고 있다. 특히, 의사결정 구조, 업무 방식, 조직 문화가 AI 중심으로 변화하고 있다. 이제 AI는 단순한 도구가 아니다. AI 도입이 진행될 수록, 기업의 핵심 전략과 비즈니스 모델 자체가 AI 중심으로 변화하고 있다. 결국, AI 도입을 성공적으로 수행하는 기업만이 미래 시장에서 생존하고 성장할 수 있을 것이다.    표 2. 기존 기업 vs. AI 중심 기업의 차이점   AI는 혼자 발전할 수 없다. 모두가 함께 연결되어야 한다.” – 젠슨 황   네트워킹, AI 시대의 연결과 협업 AI가 기업의 핵심 전략이 되고 산업 전체가 AI 기반으로 재편되는 과정에서, 네트워킹(networking)의 중요성이 더욱 강조되고 있다. 과거 기업은 독립적으로 성장하는 전략을 취했지만, 이제 AI 시대에서는 기업 간 협력, 데이터 공유, AI 연구 협업이 필수이다. GTC 2025에서 젠슨 황은 이렇게 말했다. “AI는 혼자 발전할 수 없다. 모두가 함께 연결되어야 한다.” 그렇다면 AI 시대의 네트워킹은 어떻게 이루어지고 있으며, 어떤 기업이 AI 협업을 통해 새로운 가치를 창출하고 있을까? AI 네트워킹의 의미는 ‘AI는 연결을 필요로 한다’로 해석된다. AI 혁명이 가속화될 수록 기업들은 서로 연결될 필요가 있다.  즉, AI 네트워킹이란 기업들이 AI를 더 빠르고, 더 효율적으로, 더 윤리적으로 활용하기 위해 서로 협력하는 과정을 의미한다. AI 네트워킹을 실현하는 방식은 다양하지만, 현재 가장 중요한 세 가지 협력 모델을 살펴보자. AI 팜(AI farms)을 통해 개별 기업이 AI 인프라를 구축하는 부담을 줄이고, 더 빠르게 AI를 도입할 수 있다. AI 얼라이언스(AI alliance)를 통해 기업들은 경쟁이 아닌 협력을 기반으로 AI 혁신을 가속화하고 있다. 즉, AI 데이터 공유는 이제 개인정보 보호를 유지하면서도 기업들이 협력할 수 있는 새로운 방식으로 발전하고 있다. AI 네트워킹이 활성화됨에 따라, 기업들은 완전히 새로운 방식으로 연결되고 협력하고 있다. AI 시대에는 한 산업 내에서 경쟁하는 것이 아니라, 다양한 산업과 연결되는 것이 핵심 전략이 된다. 결과적으로, AI 네트워킹을 활용하는 기업들은 새로운 기회를 창출하고, 더 빠르게 AI 중심으로 전환하고 있다. “AI 혁명은 이제 되돌릴 수 없는 변곡점에 도달했다. 우리는 AI와 함께 새로운 미래를 설계해야 한다.” – 젠슨 황   AI 시대의 미래, 우리는 어디로 가는가 AI 혁명은 이제 단순한 기술 발전을 넘어 산업, 사회, 인간의 삶 자체를 근본적으로 변화시키고 있다. GTC 2025에서 젠슨 황은 말했다. “AI 혁명은 이제 되돌릴 수 없는 변곡점에 도달했다. 우리는 AI와 함께 새로운 미래를 설계해야 한다. ”그렇다면 AI의 미래는 어디로 향하고 있으며, 우리는 AI와 함께 어떤 세상을 만들어가야 할까? 에이전틱 AI와 추론 AI의 발전이다. 즉, AI가 단순한 ‘도구’가 아니라, 인간과 협력하는 ‘실제적인 파트너’가 되는 시대가 다가오고 있다. 기존의 AI는 패턴을 학습하는 방식이었다. 그러나 추론 AI는 스스로 논리적으로 사고하고 추론하는 능력을 갖춘다. 즉, AI가 더 이상 단순한 자동화 도구가 아니라, 지능적인 사고를 할 수 있는 존재로 변화하고 있다. AI가 점점 더 지능적으로 발전하면서, 우리는 ‘AI와의 관계를 어떻게 설정할 것인가’라는 근본적인 질문을 마주하게 되었다. 이제 AI는 단순한 도구를 넘어, 인간과 협력하여 새로운 가치를 창출하는 존재로 변화하고 있다. AI가 고도화될 수록 우리는 AI의 윤리적 문제와 사회적 책임에 대한 고민을 깊게 해야 한다. 결과적으로, 각국이 AI 규제와 발전 전략을 다르게 설정하면서 AI 패권 경쟁이 더욱 치열해지고 있다. AI는 단순한 기술이 아니라, 인류가 새로운 방식으로 사고하고 일하고 살아가는 방식을 바꾸는 거대한 전환점이 되고 있다. “AI는 이제 단순한 도구가 아니라, 스스로 사고하고 결정하는 존재로 나아가고 있다.” – 젠슨 황   변화의 바람을 넘어, AI와 함께 새로운 항해를 시작하다 AI 혁명은 거대한 바람이 아니라, 이제는 우리가 타고 항해해야 할 파도다. 과거에는 변화가 두려운 것이었다. 그러나, AI와 함께라면 우리는 변화 속에서도 새로운 기회를 창출할 수 있다. 엔비디아 GTC 2025에서 젠슨 황이 던진 질문을 기억하자. “AI 시대, 우리는 어떤 미래를 만들어갈 것인가?” 이제 우리는 AI와 함께 새로운 항해를 시작할 준비를 해야 한다.   그림 1. 엔비디아 기업 성장 맵(GTC 2024, 2025, Map by 류용효) (클릭하면 큰 이미지로 볼 수 있습니다.)   ■ 류용효 디원의 상무이며 페이스북 그룹 ‘컨셉맵연구소’의 리더로 활동하고 있다. 현업의 관점으로 컨설팅, 디자인 싱킹으로 기업 프로세스를 정리하는데 도움을 주며, 1장의 빅 사이즈로 콘셉트 맵을 만드는데 관심이 많다. (블로그)     ■ 기사 내용은 PDF로도 제공됩니다.
작성일 : 2025-04-02
엔비디아, AI와 그래픽 융합 가속화하는 데이터센터 GPU ‘RTX PRO 6000 블랙웰 서버 에디션’ 발표
엔비디아가 GTC 2025에서 ‘엔비디아 RTX PRO 6000 블랙웰 서버 에디션(NVIDIA RTX PRO 6000 Blackwell Server Edition)’을 발표했다. RTX PRO 6000 블랙웰 서버 에디션은 비주얼 컴퓨팅과 엔터프라이즈 AI를 위해 구축된 첫 번째 블랙웰 기반 데이터센터 GPU이다. 이는 모든 산업에서 높은 성능을 요구하는 AI, 그래픽 애플리케이션을 신속하게 처리할 수 있도록 설계됐다. 이전 세대인 에이다 러브레이스(Ada Lovelace) 아키텍처 기반 L40S GPU에 비해 RTX PRO 6000 블랙웰 서버 에디션 GPU는 다양한 엔터프라이즈 워크로드에서 성능이 크게 향상된다. 예를 들어, 에이전틱 AI(Agentic AI) 애플리케이션을 위한 대규모 언어 모델(LLM) 추론 처리량은 최대 5배 증가되고, 유전체 염기서열 분석은 약 7배로 가속화되며, 텍스트-비디오 생성은 3.3배, 렌더링 속도는 2배 이상 빨라진다. RTX PRO 6000 블랙웰 서버 에디션은 워크스테이션과 서버 GPU로 이뤄진 엔비디아 RTX PRO 블랙웰 시리즈에 속한다. 이번 엔비디아 GTC에서 발표된 RTX PRO 라인업은 여러 산업의 AI와 창의적인 워크로드를 지원하는 데스크톱, 랩톱, 데이터센터 GPU로 구성된다. 여러 분야의 기업들은 RTX PRO 6000 블랙웰 서버 에디션을 통해 데이터 분석, 엔지니어링 시뮬레이션, 생성형 AI, 비주얼 컴퓨팅과 같은 워크로드에서 높은 성능을 구현할 수 있다. 여기에는 건축, 자동차, 클라우드 서비스, 금융 서비스, 게임 개발, 의료, 제조, 미디어, 엔터테인먼트, 소매업 등의 산업이 포함된다. 콘텐츠 제작, 반도체 제조, 유전체 분석 기업들은 이미 컴퓨팅 집약적인 AI 지원 워크플로를 가속화하기 위해 RTX PRO 6000 블랙웰 서버 에디션의 기능을 활용하고 있다.     RTX PRO 6000 블랙웰 서버 에디션은 데이터센터 환경에서 연중무휴 24시간 운영할 수 있게 설계된 수동 냉각 장치 형태로, 강력한 RTX AI와 그래픽 기능을 제공한다. 96GB의 초고속 GDDR7 메모리와 멀티 인스턴스 GPU(MIG)를 갖춘 RTX PRO 6000은 최대 4개의 완전히 격리된 인스턴스로 분할될 수 있다. 각 인스턴스는 24GB의 메모리를 사용할 수 있어, AI 워크로드와 그래픽 워크로드를 동시에 실행할 수 있다. RTX PRO 6000은 엔비디아 컨피덴셜 컴퓨팅(Confidential Computing)을 통해 안전한 AI를 구현하는 범용 GPU이다. 이는 강력한 하드웨어 기반 보안으로 AI 모델과 민감한 데이터를 무단 접근으로부터 보호한다. 이에 따라 물리적으로 격리된 신뢰할 수 있는 실행 환경을 제공해 데이터를 사용하는 동안 전체 워크로드를 보호한다. 또한, RTX PRO 6000은 엔터프라이즈급 배포에서 효과적으로 사용될 수 있도록 고밀도 가속 컴퓨팅 플랫폼으로 구성돼 분산 추론 워크로드를 수행할 수 있다. 더불어 엔비디아 vGPU 소프트웨어를 통해 가상 워크스테이션을 제공하며, AI 개발과 고도의 그래픽 애플리케이션을 구동하는 데 사용될 수 있다. RTX PRO 6000 GPU는 광범위한 AI 모델에 걸쳐 강력한 추론 성능을 제공하며, 복잡한 가상 환경의 사실적인 실시간 레이 트레이싱을 가속화한다. 여기에는 5세대 텐서 코어(Tensor Core), 4세대 RT 코어, DLSS 4, 통합된 미디어 파이프라인, FP4 정밀도를 지원하는 2세대 트랜스포머 엔진(Transformer Engine) 등 최신 블랙웰 하드웨어와 소프트웨어 혁신이 포함된다. 기업들은 RTX PRO 6000 블랙웰 서버 에디션 GPU에서 엔비디아 옴니버스(Omniverse)와 엔비디아 AI 엔터프라이즈(AI Enterprise) 플랫폼을 대규모로 실행할 수 있다. 이를 통해 이미지와 비디오 생성, LLM 추론, 추천 시스템, 컴퓨터 비전, 디지털 트윈, 로보틱스 시뮬레이션 등의 에이전틱 AI, 물리 AI 애플리케이션 개발과 배포를 더욱 원활하게 진행할 수 있다. 엔비디아는 RTX PRO 6000 블랙웰 서버 에디션을 탑재한 플랫폼이 5월부터 전 세계 파트너를 통해 출시될 예정이라고 소개했다. 클라우드 서비스 제공업체와 GPU 클라우드 제공업체 중에서는 아마존 웹 서비스(AWS), 구글 클라우드, 마이크로소프트 애저, IBM 클라우드, 코어위브, 크루소, 람다, 네비우스, 벌처가 최초로 RTX PRO 6000 블랙웰 서버 에디션을 탑재한 인스턴스를 제공할 계획이다. 시스코, 델 테크놀로지스, 휴렛팩커드 엔터프라이즈(HPE), 레노버, 슈퍼마이크로는 RTX PRO 6000 블랙웰 서버 에디션을 탑재한 서버를 제공할 예정이다. 이 외에도 어드밴텍, 애티나, 에이브레스, 애즈락랙, 에이수스, 컴팔, 폭스콘, 기가바이트, 인벤텍, MSI, 페가트론, 퀀타 클라우드 테크놀로지(QCT), 미텍 컴퓨팅, 네이션게이트, 위스트론, 위윈 등의 기업도 이 서버를 제공할 계획이다.
작성일 : 2025-03-21
하이퍼웍스 2025 / HPC웍스 2025 : AI로 제품 개발 및 HPC 스케줄링 효율 향상
개발 및 공급 : 알테어 주요 특징 : 하이퍼웍스 2025 – AI와 머신러닝으로 더욱 정밀하고 빠른 시뮬레이션 구현, 통합 해석 기술로 설계 효율성과 정확도 극대화, 클라우드 및 자동화 도구로 협업과 생산성 향상 등. HPC웍스 2025 – AI 기반 스마트 작업 스케줄링 도입으로 작업 운영 최적화, 유연한 클라우드 확장성과 자동화 엔진으로 운영 효율성 강화, GPU 및 쿠버네티스 지원 확대로 AI 및 머신러닝 워크로드 성능 향상 등   ▲ 이미지 출처 : 알테어 웹사이트 캡처   AI·자동화로 설계 효율 높인 하이퍼웍스 2025 설계 및 시뮬레이션 플랫폼인 알테어 하이퍼웍스 2025(Altair HyperWorks 2025)는 인공지능(AI)과 머신러닝 기반의 해석 및 최적화 기술을 강화해, 시제품 제작 과정을 최소화하고 설계 프로세스를 혁신했다. 새 버전은 트랜스포머 아키텍처 기반의 AI 물리 예측 모델을 적용해 적은 데이터로도 정밀한 시뮬레이션이 가능하며, 머신러닝 기반 솔버는 해석 속도와 신뢰성을 동시에 향상시켰다. AI 기반 차수 축소 모델링(ROM)은 비선형 시스템을 빠르게 해석해 설계 초기 단계에서 중요한 통찰력을 제공한다. 시뮬레이션 해석 성능 역시 개선됐다. 알테어 옵티스트럭트(Altair OptiStruct)는 기존에 사용하던 기계 충격 해석, 열 충격 해석, 진동 해석 등을 하나의 설루션에서 수행할 수 있다. 이를 통해 해석 시간이 단축되고 모델 관리가 용이하며 설계 효율성과 신뢰성을 높일 수 있다. 또한 알테어 피직스AI(Altair physicsAI)는 기존 수치 해석 솔버를 AI 기반 솔버로 대체해 정확도를 유지하면서도 해석 속도를 높였다. 알테어는 자사의 클라우드 플랫폼인 알테어 원(Altair One)을 통해 HPC(고성능 컴퓨팅) 및 시뮬레이션 데이터에 즉시 접근할 수 있는 협업 환경도 마련했다. 또한 알테어 하이퍼메시(Altair HyperMesh)의 파이썬 API 지원으로 반복 작업을 자동화하고 대규모 모델의 해석 준비 시간을 단축할 수 있다. 베타 버전으로 출시된 AI 설계 도우미 알테어 코파일럿(Altair Copilot)은 실시간 Q&A와 워크플로를 지원한다. 소재 설루션은 복합소재, 폴리머, 적층 제조 등 첨단 소재의 데이터를 수집 및 표준화하고, AI 기술로 불완전한 데이터를 보완해 시뮬레이션 정확도를 높였다. 알테어의 짐 스카파 CEO는 “알테어 하이퍼웍스 2025는 40년간 축적한 알테어의 시뮬레이션, 설계, 최적화 역량이 집대성된 결과물”이라면서, “AI와 머신러닝, 자동화, 개방형 아키텍처를 통합해 단순한 시뮬레이션 플랫폼을 넘어선 통합 엔지니어링 설루션을 제공할 것”이라고 말했다.   ▲ 이미지 출처 : 알테어 웹사이트 캡처   AI 기반 작업 스케줄링 및 클라우드 확장성 강화한 HPC웍스 2025 고성능 컴퓨팅(HPC) 및 클라우드 플랫폼인 ‘알테어 HPC웍스(Altair HPCWorks) 2025’는  AI 기반 작업 스케줄링, GPU 및 쿠버네티스 지원 확대, 클라우드 확장성 강화를 비롯해 기업의 대규모 AI 학습과 데이터 분석 작업을 안정적으로 지원한다. 최신 버전은 AI 기반 스마트 작업 스케줄링을 통해 작업 제출을 간소화하고 대기 시간을 줄였으며, GPU 및 쿠버네티스와의 호환성을 강화해 AI 및 머신러닝 워크로드의 성능을 최적화했다. 클라우드 리소스 활용 효율성을 높인 것도 특징이다. 사용자는 클라우드 작업과 하이브리드 컴퓨팅 환경을 손쉽게 최적화할 수 있으며, 피크 타임의 워크로드도 유연하게 처리할 수 있다. 서드파티 스케줄러와의 연동도 가능해 확장성과 호환성도 높였다. 또한, 통합된 클라우드 자동화 엔진을 사용하면 필요할 때 클러스터를 빠르게 늘리고 사용량이 줄어들면 자동으로 줄일 수 있어, 운영 비용과 시간을 절감할 수 있다. 멀티 클라우드나 여러 클러스터를 동시에 사용하는 환경에서도 HPC 및 클라우드 관리를 한 곳에서 할 수 있어 운영이 편리하다. HPC웍스 2025는 알테어의 데이터 분석 및 AI 플랫폼인 알테어 래피드마이너와 연계해 더욱 효율적인 작업 스케줄링을 구현했다. 이 외에도 모든 알테어 워크로드 관리자에 HPC 및 클라우드 모니터링과 리포팅 기능을 통합해 IT 관리자들의 데이터 기반 의사 결정과 컴퓨팅 자원 최적화를 돕는다. 한편 HPC웍스는 알테어 유닛(Altair Units) 라이선스 시스템을 기반으로 운영되며, 클라우드 기반의 알테어 원(Altair One)과 연계해 추가 비용 없이 알테어의 다양한 기술을 활용할 수 있다. 알테어의 샘 마할링엄 최고기술책임자(CTO)는 “데이터와 AI 중심 환경에서 차세대 HPC 및 클라우드 기술은 필수”라면서, “HPC웍스를 통해 기업은 인프라를 최적화하고 경쟁력을 높일 수 있을 것”이라고 말했다.    ▲ 이미지 출처 : 알테어 웹사이트 캡처     ■ 기사 내용은 PDF로도 제공됩니다.
작성일 : 2025-03-06
알테어, AI·자동화로 설계 효율 높인 ‘하이퍼웍스 2025’ 출시
알테어가 설계 및 시뮬레이션 플랫폼인 알테어 하이퍼웍스 2025(Altair HyperWorks 2025)를 출시했다. 이번 버전은 인공지능(AI)과 머신러닝 기반의 해석 및 최적화 기술을 강화해, 시제품 제작 과정을 최소화하고 설계 프로세스를 혁신했다.   새 버전은 트랜스포머 아키텍처 기반의 AI 물리 예측 모델을 적용해 적은 데이터로도 정밀한 시뮬레이션이 가능하며, 머신러닝 기반 솔버는 해석 속도와 신뢰성을 동시에 높였다. AI 기반 차수 축소 모델링(ROM)으로 비선형 시스템을 빠르게 해석해 설계 초기 단계에서 중요한 통찰력을 제공한다.   시뮬레이션 해석 성능 또한 개선됐다. 알테어 옵티스트럭트(Altair OptiStruct)는 기존에 사용하던 기계 충격 해석, 열 충격 해석, 진동 해석 등을 하나의 설루션에서 수행할 수 있다. 이를 통해 해석 시간이 단축되고 모델 관리가 용이하며 설계 효율성과 신뢰성을 높일 수 있다. 또한 알테어 피직스AI(Altair physicsAI)는 기존 수치 해석 솔버를 AI 기반 솔버로 대체해 정확도를 유지하면서도 해석 속도를 높였다.     알테어는 자사의 클라우드 플랫폼 알테어 원(Altair One)을 통해 HPC(고성능 컴퓨팅) 및 시뮬레이션 데이터에 즉시 접근할 수 있는 협업 환경도 마련했다. 또한 알테어 하이퍼메시(Altair HyperMesh)의 파이썬 API 지원으로 반복 작업을 자동화하고, 대규모 모델의 해석 준비 시간을 줄일 수 있다.   베타 버전으로 출시된 AI 설계 도우미인 알테어 코파일럿(Altair Copilot)은 실시간 Q&A와 워크플로를 지원한다. 소재 설루션은 복합소재, 폴리머, 적층 제조 등 첨단 소재의 데이터를 수집 및 표준화하고, AI 기술로 불완전한 데이터를 보완해 시뮬레이션 정확도를 높였다.   알테어의 짐 스카파 CEO는 “알테어 하이퍼웍스 2025는 40년간 축적한 알테어의 시뮬레이션, 설계, 최적화 역량이 집대성된 결과물”이라면서, “AI와 머신러닝, 자동화, 개방형 아키텍처를 통합해 단순한 시뮬레이션 플랫폼을 넘어선 통합 엔지니어링 설루션을 제공할 것”이라고 전했다.
작성일 : 2025-02-20
엔비디아, NIM에서 딥시크-R1 지원 시작
엔비디아는 개발자가 활용할 수 있도록 딥시크-R1(DeepSeek-R1) 모델을 엔비디아 NIM 마이크로서비스 프리뷰로 제공한다고 밝혔다. 개발자들은 딥시크-R1 모델을 활용해 애플리케이션 프로그래밍 인터페이스(API)를 테스트하고 실험할 수 있으며, 이는 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어 플랫폼의 일부인 NIM 마이크로서비스로 제공될 예정이다. 딥시크-R1은 최첨단 추론 기능을 갖춘 오픈 모델이다. 딥시크-R1과 같은 추론 모델은 직접적인 답변을 제공하는 대신 쿼리에 대해 여러 번의 추론 패스(inference passes)를 수행해 연쇄 사고, 합의, 검색 방법을 거쳐 최상의 답변을 생성한다. R1은 논리적 추론, 사고, 수학, 코딩, 언어 이해 등이 필요한 작업에 대해 높은 정확도와 추론 효율을 제공한다. 이러한 일련의 추론 패스를 수행해 최적의 답변에 도달하기 위해 추론을 사용하는 것을 테스트 타임 스케일링(test-time scaling)이라고 한다. 모델이 문제를 반복적으로 ‘사고’할 수 있게 되면 더 많은 출력 토큰과 더 긴 생성 주기가 생성되므로 모델 품질이 계속 확장된다. 딥시크-R1과 같은 추론 모델에서 실시간 추론과 고품질 응답을 모두 구현하려면 상당한 테스트 타임 컴퓨팅이 중요하므로 더 큰 규모의 추론 배포가 필요하다.     딥시크-R1 NIM 마이크로서비스는 단일 엔비디아 HGX H200 시스템에서 초당 최대 3872개의 토큰을 전송할 수 있다. 딥시크-R1 NIM 마이크로서비스는 업계 표준 API를 지원해 배포를 간소화한다. 기업은 가속 컴퓨팅 인프라에서 NIM 마이크로서비스를 실행해 보안과 데이터 프라이버시를 극대화할 수 있다. 또한, 기업은 엔비디아 네모(NeMo) 소프트웨어와 함께 엔비디아 AI 파운드리(AI Foundry)를 사용해 AI 에이전트를 위한 맞춤형 딥시크-R1 NIM 마이크로서비스를 생성할 수 있다. 딥시크-R1은 거대 전문가 조합 방식(Mixture-Of-Experts, MoE) 모델이다. 다른 인기 있는 오픈 소스 대규모 언어 모델(LLM)보다 10배 많은 6710억 개의 파라미터를 통합해 12만 8000개의 토큰이라는 인풋 컨텍스트 길이(input context length)를 지원한다. 또한 이 모델은 레이어당 많은 전문가를 활용한다. R1의 각 레이어에는 256명의 전문가가 있으며, 각 토큰은 평가를 위해 8명의 별도 전문가에게 병렬로 라우팅된다. R1에서 실시간 답변을 제공하려면 추론을 위해 모든 전문가에게 신속한 토큰을 라우팅하기 위해 높은 대역폭과 짧은 지연 시간의 통신으로 연결된 높은 컴퓨팅 성능을 갖춘 많은 GPU가 필요하다. 엔비디아 NIM 마이크로서비스에서 제공되는 소프트웨어 최적화와 결합해 NV링크(NVLink)와 NV링크 스위치(Switch)를 사용해 연결된 8개의 H200 GPU가 장착된 단일 서버는 초당 최대 3872개의 토큰으로 6710억 개의 파라미터로 구성된 전체 딥시크-R1 모델을 실행할 수 있다. 이러한 처리량은 모든 레이어에서 엔비디아 호퍼(Hopper) 아키텍처의 FP8 트랜스포머 엔진과 MoE 전문가 통신을 위한 900GB/s의 NV링크 대역폭을 사용함으로써 가능하다. 실시간 추론에는 GPU에서 모든 초당 부동 소수점 연산(FLOPS)의 성능을 끌어내는 것이 중요하다. 엔비디아는 “차세대 엔비디아 블랙웰(Blackwell) 아키텍처는 최대 20페타플롭의 피크 FP4 컴퓨팅 성능을 제공할 수 있는 5세대 텐서 코어(Tensor Core)와 추론에 특별히 최적화된 72-GPU NV링크 도메인을 통해 딥시크-R1과 같은 추론 모델의 테스트 시간 확장을 크게 향상시킬 것”이라고 전했다.
작성일 : 2025-02-05
엔비디아, 블랙웰 지포스 RTX 50 시리즈 출시
엔비디아가 게이머, 크리에이터, 개발자를 위한 최첨단 소비자용 GPU인 지포스 RTX 50 시리즈 데스크톱과 노트북 GPU(GeForce RTX 50 Series Desktop and Laptop GPU)를 공개했다. 엔비디아 블랙웰(NVIDIA Blackwell) 아키텍처, 5세대 텐서 코어(Tensor Core), 4세대 RT 코어(RT Core)를 기반으로 하는 지포스 RTX 50 시리즈는 뉴럴 셰이더, 디지털 휴먼 기술, 지오메트리, 조명을 포함한 AI 기반 렌더링의 혁신을 제공한다. 엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 “PC 게이머, 개발자, 크리에이터를 위한 AI 엔진인 블랙웰이 등장했다. AI 기반의 뉴럴 렌더링과 광선 추적을 융합한 블랙웰은 25년 전 프로그래머블 셰이딩을 도입한 이래 가장 중요한 컴퓨터 그래픽 혁신”이라고 말했다. 현재까지 출시된 지포스 RTX GPU 중 가장 빠른 지포스 RTX 5090 GPU는 920억 개의 트랜지스터를 탑재하고 있으며, 초당 3,352조 이상의 AI 연산(TOPS) 처리 능력을 제공한다. 블랙웰 아키텍처 혁신과 DLSS 4 덕분에 지포스 RTX 5090 GPU는 지포스 RTX 4090 GPU보다 최대 2배 더 우수한 성능을 발휘한다. 지포스 블랙웰은 데스크톱 모델의 모든 기능을 갖춘 노트북에 탑재된다. 이는 탁월한 그래픽 기능과 놀라운 효율성을 포함해 휴대용 컴퓨팅에 상당한 업그레이드를 제공한다. 엔비디아 맥스-Q(Max-Q) 기술의 블랙웰 세대는 배터리 수명을 최대 40%까지 연장하며, 전력이나 성능을 희생하지 않고 세련된 디자인을 유지하는 얇고 가벼운 노트북을 포함한다. 최대 8배의 성능을 향상시키는 엔비디아 DLSS 4 DLSS 4는 렌더링된 프레임당 최대 3개의 프레임을 생성하기 위해 AI를 사용해 프레임 속도를 높이는 멀티 프레임 생성(Multi Frame Generation)을 선보인다. 이 기술은 DLSS 기술 제품군과 함께 작동해 엔비디아 리플렉스(Reflex) 기술로 응답성을 유지하면서 기존 렌더링보다 최대 8배의 성능 향상을 제공한다. 또한 DLSS 4는 그래픽 업계 최초로 트랜스포머 모델 아키텍처를 실시간으로 적용한다. 트랜스포머 기반의 DLSS 레이 리컨스트럭션(Ray Reconstruction)과 슈퍼 레졸루션(Super Resolution) 모델은 2배 더 많은 파라미터와 4배 더 많은 연산을 사용한다. 이를 통해 게임 장면에서 더 큰 안정성, 감소된 고스팅, 더 높은 디테일, 향상된 안티 앨리어싱(anti-aliasing)을 제공한다. DLSS 4는 75개 이상의 게임과 애플리케이션에서 지포스 RTX 50 시리즈 GPU를 통해 지원될 예정이다. 엔비디아 리플렉스 2는 디스플레이로 보내기 직전에 최신 마우스 입력을 기반으로 렌더링된 프레임을 업데이트해 게임의 지연 시간을 줄이는 혁신적인 기술인 프레임 워프(Frame Warp)를 도입한다. 리플렉스 2는 지연 시간을 최대 75%까지 줄일 수 있다. 이를 통해 게이머는 멀티플레이어 게임에서 경쟁 우위를 점할 수 있고 싱글 플레이어 타이틀의 반응성도 향상된다. 블랙웰, 셰이더에 AI 도입 25년 전, 엔비디아는 지포스 3와 프로그래밍 가능한 셰이더를 출시했다. 이 셰이더는 픽셀 셰이딩, 컴퓨트 셰이딩, 실시간 레이 트레이싱에 이르기까지 20년 동안 그래픽 혁신의 발판을 마련했다. 엔비디아는 지포스 RTX 50 시리즈 GPU와 함께 RTX 뉴럴 셰이더(Neural Shader)를 출시한다. 이 셰이더는 작은 AI 네트워크를 프로그래밍 가능한 셰이더에 도입해 실시간 게임에서 영화 수준의 소재, 조명 등을 구현한다. 게임 캐릭터 렌더링은 실시간 그래픽에서 가장 어려운 작업 중 하나다. 사람들이 디지털 휴먼에서 아주 작은 오류나 부작용을 쉽게 발견해내기 때문이다. RTX 뉴럴 페이스(Neural Face)는 단순한 래스터화된 얼굴과 3D 포즈 데이터를 입력으로 받아서, 생성형 AI를 사용해 실시간으로 일시적으로 안정적이고 고품질의 디지털 페이스를 렌더링한다. RTX 뉴럴 페이스는 레이 트레이싱된 머리카락과 피부용으로 새롭게 개발된 RTX 기술로 보완된다. 장면에서 레이 트레이싱 삼각형을 최대 100배까지 늘려주는 새로운 RTX 메가 지오메트리(Mega Geometry)와 함께, 이러한 발전은 게임 캐릭터와 환경의 사실성을 크게 향상시킬 것이다. 뉴럴 렌더링의 힘, DLSS 4, 그리고 새로운 DLSS 트랜스포머 모델은 엔비디아의 획기적인 신기술 데모인 조라(Zorah)를 통해 지포스 RTX 50 시리즈 GPU에서 선보인다. 자율 게임 캐릭터 지포스 RTX 50 시리즈 GPU는 업계 최고의 AI 톱스(TOPS)를 통해 게임 렌더링과 병행해 자율 게임 캐릭터를 구동한다. 엔비디아는 게임 캐릭터가 인간 플레이어처럼 인지하고, 계획하고, 행동할 수 있도록 하는 새로운 엔비디아 에이스(ACE) 기술 제품군을 소개한다. 에이스 기반 자율 캐릭터는 크래프톤(KRAFTON)의 PUBG: 배틀그라운드(PUBG: BATTLEGROUNDS)와 곧 출시될 생활 시뮬레이션 게임인 인조이(InZOI), 그리고 위메이드 넥스트(Wemade Next)의 미르5(MIR5)에 통합되고 있다. PUBG에서는 엔비디아 에이스로 구동되는 동료들이 생존을 위해 휴먼 플레이어와 역동적으로 협력하면서 전략적 행동을 계획하고 실행한다. 인조이에는 삶의 목표와 게임 내 이벤트에 따라 행동을 자율적으로 조정하는 스마트 조이(Smart Zoi) 캐릭터가 등장한다. 미르5에서는 거대 언어 모델(large language model, LLM) 기반 레이드 보스가 플레이어의 행동에 따라 전술을 조정해 더욱 역동적이고 도전적인 만남을 만들어 낸다. RTX AI PC용 AI 파운데이션 모델 엔비디아는 블랙 포레스트 랩스(Black Forest Labs), 메타(Meta), 미스트랄(Mistral), 스태빌리티 AI(Stability AI)와 같은 최고의 모델 개발자들이 만든 NIM 마이크로서비스와 RTX AI PC용 AI 블루프린트(Blueprint) 파이프라인을 출시할 예정이다. 이는 RTX 애호가와 개발자들이 엔비디아 NIM 마이크로서비스를 사용해 AI 에이전트와 어시스턴트를 구축하는 방법을 소개하기 위함이다. 사용 사례는 LLM, 비전 언어 모델, 이미지 생성, 음성, 검색 증강 생성(retrieval-augmented generation, RAG)을 위한 임베딩 모델, PDF 추출, 컴퓨터 비전 등 다양한 분야에 걸쳐 있다. NIM 마이크로서비스에는 PC에서 AI를 실행하는 데 필요한 모든 구성 요소가 포함돼 있으며, 모든 엔비디아 GPU에 배포할 수 있도록 최적화돼 있다. 엔비디아는 애호가들과 개발자들이 NIM을 사용해 AI 에이전트와 어시스턴트를 구축할 수 있는 방법을 보여주기 위해 프로젝트 R2X(Project R2X)를 미리 공개했다. 프로젝트 R2X는 사용자의 손끝에 정보를 제공하고, 데스크톱 앱과 화상 회의 통화를 지원하고, 문서를 읽고 요약하는 등의 기능을 수행할 수 있는 비전 지원 PC 아바타다. 크리에이터를 위한 AI 기반 도구 지포스 RTX 50 시리즈 GPU는 크리에이티브 워크플로우를 강화한다. RTX 50 시리즈 GPU는 FP4 정밀도를 지원하는 최초의 소비자용 GPU이다. 이는 플럭스(FLUX)와 같은 모델의 AI 이미지 생성 성능을 2배 향상시키고, 이전 세대 하드웨어에 비해 더 작은 메모리 공간에서 생성형 AI 모델을 로컬로 실행할 수 있도록 한다. 엔비디아 브로드캐스트(Broadcast) 앱은 라이브 스트리머를 위한 두 가지 AI 기반 베타 기능을 제공한다: 마이크 오디오를 업그레이드하는 스튜디오 보이스(Studio Voice)와 세련된 스트리밍을 위해 얼굴을 다시 비추는 버추얼 키 라이트(Virtual Key Light)이다. 스트림랩스(Streamlabs)는 엔비디아 에이스와 인월드 AI(Inworld AI)를 기반으로 하는 인텔리전트 스트리밍 어시스턴트(Intelligent Streaming Assistant)를 소개한다. 이 기능은 라이브 스트리밍을 향상시키기 위해 공동 진행자, 프로듀서, 기술 보조자의 역할을 한다. 이용 정보 데스크톱 사용자의 경우, 3,352개의 AI 톱스의 지포스 RTX 5090 GPU와 1,801개의 AI 톱스의 지포스 RTX 5080 GPU가 오는 1월 30일에 각각 $1,999와 $999에 출시될 예정이다. 1,406개의 AI 톱스의 지포스 RTX 5070 Ti GPU와 988개의 AI 톱스의 지포스 RTX 5070 GPU는 2월부터 각각 $749와 $549에 판매될 예정이다. 지포스 RTX 5090, RTX 5080, RTX 5070 GPU의 엔비디아 파운더스 에디션(Founders Edition)는 nvidia.com과 전 세계 일부 소매점에서 직접 구매할 수 있다. 에이수스(ASUS), 컬러풀(Colorful), 게인워드(Gainward), 갤럭시(GALAX), 기가바이트(GIGABYTE), 이노3D(INNO3D), KFA2, MSI, 팔릿(Palit), PNY, 조탁(ZOTAC) 등 최고의 애드인 카드 제공업체와 팔콘 노스웨스트(Falcon Northwest), 인피니아크(Infiniarc), 메인기어(MAINGEAR), 미프콤(Mifcom), 오리진 PC(ORIGIN PC), PC 스페셜리스트(PC Specialist), 스캔 컴퓨터스(Scan Computers) 등 데스크탑 제조업체에서 기본 클럭 모델과 공장 오버클럭 모델을 구입할 수 있다.
작성일 : 2025-01-27
엔비디아, 생성형 AI의 활용 범위 넓히는 슈퍼컴퓨터 ‘젯슨 오린 나노 슈퍼’ 출시
엔비디아가 소형 생성형 AI 슈퍼컴퓨터 신제품인 ‘젯슨 오린 나노 슈퍼 개발자 키트(Jetson Orin Nano Super Developer Kit)’를 공개했다. 엔비디아는 소프트웨어 업그레이드를 통해 이전 모델에 비해 성능을 높이고 가격은 낮췄다고 밝혔다. 손바닥만한 크기의 새로운 엔비디아 젯슨 오린 나노 슈퍼 개발자 키트는 상업용 AI 개발자부터 취미로 AI를 다루는 사람, 학생에 이르기까지 다양한 사람들에게 생성형 AI 기능과 성능을 제공한다. 가격은 기존의 499달러에서 249달러로 인하됐다. 이 제품은 이전 모델에 비해 생성형 AI 추론 성능이 1.7배 향상됐고, 성능은 67 INT8 TOPS로 70% 증가했으며, 메모리 대역폭은 102GB/s로 50% 증가했다. 젯슨 오린 나노 슈퍼는 검색 증강 생성(RAG) 기반의 대규모 언어 모델(LLM) 챗봇 생성, 시각적 AI 에이전트(AI agent) 구축, AI 기반 로봇 배포 등에 적합한 설루션을 제공한다. 젯슨 오린 나노 슈퍼는 생성형 AI, 로보틱스, 컴퓨터 비전 기술 개발에 관심이 있는 사람들에게 적합하다. AI 세계가 작업별 모델에서 파운데이션 모델로 이동함에 따라 아이디어를 현실로 전환할 수 있는 접근 가능한 플랫폼도 제공한다. 젯슨 오린 나노 슈퍼의 향상된 성능은 모든 인기 있는 생성형 AI 모델과 트랜스포머 기반 컴퓨터 비전을 위한 이점을 제공한다.     개발자 키트는 젯슨 오린 나노 8GB 시스템 온 모듈(SoM)과 레퍼런스 캐리어 보드로 구성돼 에지 AI 애플리케이션 프로토타입에 적합한 플랫폼을 제공한다. 이 SoM은 텐서 코어가 포함된 엔비디아 암페어(Ampere) 아키텍처 GPU와 6코어 Arm CPU를 갖추고 있어, 여러 개의 동시 AI 애플리케이션 파이프라인과 고성능 추론을 용이하게 한다. 또한, 최대 4개의 카메라를 지원할 수 있으며 이전 버전보다 더 높은 해상도와 프레임 속도를 제공한다. 젯슨은 로보틱스를 위한 엔비디아 아이작(Isaac), 비전 AI를 위한 엔비디아 메트로폴리스(Metropolis), 센서 처리를 위한 엔비디아 홀로스캔(Holoscan)을 비롯한 엔비디아 AI 소프트웨어를 실행한다. 합성 데이터 생성을 위한 엔비디아 옴니버스 리플리케이터(Omniverse Replicator)와 NGC 카탈로그에서 사전 훈련된 AI 모델을 미세 조정하기 위한 엔비디아 타오 툴킷(TAO Toolkit)을 사용하면 개발 시간을 단축할 수 있다. 한편, 엔비디아는 새로운 젯슨 오린 나노 슈퍼에 제공되는 소프트웨어 업데이트가 이미 젯슨 오린 나노 개발자 키트를 보유하고 있는 사용자의 생성형 AI 성능도 향상시킨다고 밝혔다. 1.7배의 생성형 AI 성능을 향상시키는 소프트웨어 업데이트는 젯슨 오린 NX와 오린 나노 시리즈 시스템 모듈에서도 사용할 수 있다. 기존 젯슨 오린 나노 개발자 키트 소유자는 지금 바로 젯팩 SDK(JetPack SDK)를 업그레이드해 향상된 성능을 활용할 수 있다. 엔비디아는 “젯슨 생태계 파트너는 추가적인 AI와 시스템 소프트웨어, 개발자 도구, 맞춤형 소프트웨어 개발을 제공한다. 또한, 카메라와 기타 센서, 캐리어 보드, 제품 설루션을 위한 설계 서비스도 지원 가능하다”고 덧붙였다.
작성일 : 2024-12-19