통합검색 > 통합검색 : 캐드앤그래픽스 - 엔지니어링IT 미디어 | CAD&Graphics

회원가입
|
로그인
|
장바구니

News

뉴스 신제품 신간 Culture & Life
강좌/특집

특집 강좌 자료창고 갤러리
리뷰

리뷰
매거진

목차 및 부록보기 잡지 세션별 성격 뉴스레터 정기구독안내 정기구독하기 단행본 및 기타 구입
행사/이벤트

행사 전체보기 캐드앤그래픽스 행사
CNG TV

방송리스트 방송 다시보기 공지사항
커뮤니티

업체홍보 공지사항 설문조사 자유게시판 Q&A게시판 구인구직/학원소식
디렉토리

디렉토리 전체보기 소프트웨어 공급업체 하드웨어 공급업체 기계관련 서비스 건축관련 업체 및 서비스 교육기관/학원 관련DB 추천 사이트
회사소개

회사소개 회사연혁 출판사업부 광고안내 제휴 및 협력제안 회사조직 및 연락처 오시는길
고객지원센터

고객지원 Q&A 이메일 문의 기사제보 및 기고 개인정보 취급방침 기타 결제 업체등록결제
쇼핑몰

로그인
회원가입
배송조회
장바구니

News

뉴스

신제품

신간

Culture & Life
강좌/특집

특집

강좌

자료창고

갤러리
리뷰
매거진

목차 및 부록보기

잡지 세션별 성격

뉴스레터

정기구독안내

정기구독하기

단행본 및 기타 구입
행사/이벤트

행사 전체보기

캐드앤그래픽스 행사
CNG TV

방송리스트

방송 다시보기

공지사항
커뮤니티

업체홍보

공지사항

설문조사

자유게시판

Q&A게시판

구인구직/학원소식
디렉토리

디렉토리 전체보기

소프트웨어 공급업체

하드웨어 공급업체

기계관련 서비스

건축관련 업체 및 서비스

교육기관/학원

관련DB

추천 사이트
쇼핑몰
고객지원센터

고객지원 Q&A

이메일 문의

기사제보 및 기고

개인정보 취급방침

기타 결제

업체등록결제

통합검색 "블랙웰"에 대한 통합 검색 내용이 57개 있습니다

원하시는 검색 결과가 잘 나타나지 않을 때는 홈페이지의 해당 게시판 하단의 검색을 이용하시거나 구글 사이트 맞춤 검색 을 이용해 보시기 바랍니다.

CNG TV 방송 내용은 검색 속도 관계로 캐드앤그래픽스 전체 검색에서는 지원되지 않으므로 해당 게시판에서 직접 검색하시기 바랍니다

HP, 에픽게임즈 ‘언리얼 페스트 2025 서울’ 골드 스폰서로 참여

HP가 8월 25일부터 26일까지 이틀간 열린 에픽게임즈의 ‘언리얼 페스트 2025 서울’ 행사에 골드 스폰서로 참여했다며, 전시 부스를 운영하고 파트너사와 공동 토크 세션을 진행했다고 밝혔다. HP는 골드 스폰서로 참여해 에픽게임즈와의 파트너십을 공고히 하고 미디어 및 엔터테인먼트 분야에서의 리더십을 한층 강화했다고 전했다. ‘언리얼 페스트’는 언리얼 엔진과 에픽 에코시스템의 최신 기술과 활용 사례를 공유하는 에픽게임즈의 대표적인 연례 행사로 올해는 게임, 미디어, 엔터테인먼트, 제조 및 시뮬레이션 등 다양한 산업별 트랙을 통해 총 38개의 세션으로 진행됐다. HP는 8월 26일 ‘기술 혁신으로 여는 창의적 스토리텔링의 미래’를 주제로 미국 애니메이션 엔터테인먼트 스튜디오 IEL(Immersive Enterprise Laboratories)과 공동 세션을 진행했다. 이 세션에는 IEL의 블레이크 박스터(Blake Baxter) CEO와 다니엘 우르바흐(Daniel Urbach) CCO가 참여해, HP와 엔비디아 기술 기반 AI 파이프라인을 활용한 제작 사례를 공유했다. 이들은 HP Z6 워크스테이션과 엔비디아 RTX 프로 6000 블랙웰을 이용해 빠른 반복 작업, 높은 시각적 완성도, 창작의 자유를 구현한 과정을 소개했다. 한편 HP는 Z by HP 워크스테이션 포트폴리오를 지속적으로 확장하며 미디어 및 엔터테인먼트 분야를 포함한 다양한 산업군에 최적화된 솔루션을 제공하고 있다. 이번 전시 부스에서도 ▲ HP Z6 G5 A 데스크톱 워크스테이션 ▲ HP Z2 타워 G1i ▲ HP ZBook X G1i ▲ Z 디스플레이 등 주요 제품군을 선보였다. 또한, 어도비(Adobe)와 공동 개발한 디지털 스캐닝 기기 ‘HP Z 캡티스(HP Z Captis)’도 함께 전시했다. 김대환 HP 코리아 대표는“언리얼 페스트는 글로벌 크리에이티브 산업의 최신 혁신을 보여주는 대표적인 행사”라며 “HP는 이번 후원을 통해 파트너사와 함께 창작자들에게 차세대 기술 기반 워크플로우를 제시하고, AI 중심의 워크스테이션 혁신을 통해 산업 전반의 창의적 혁신을 가속화하는 데 기여하고자 한다”고 전했다. HP는 최근 워크스테이션 사업 부문에서 AI 중심 혁신 전략을 강화하고 있다. 특히, 크리에이티브 산업의 고도화된 AI 워크플로우 수요에 맞춰, 대규모 데이터 처리 및 AI 기반 콘텐츠 제작에 최적화된 성능을 갖춘 제품 개발에 집중하고 있다. 이를 바탕으로 크리에이티브 산업 전반에 특화된 워크스테이션 포트폴리오를 지속적으로 확대하고 차세대 AI 워크스테이션 제품 혁신을 가속화하며 고객에게 차별화된 가치를 제공할 방침이다. 한편, HP는 스타트업을 대상으로 한 ‘HP 스타트업 챌린지’와 국내 대학생을 위한 ‘AI 연구개발 지원 사업’ 등을 운영하며 고성능 워크스테이션을 제공하고 있다. 이를 통해 유망 스타트업의 성장을 돕고, 학계 연구 인재들이 AI 및 데이터 사이언스 분야에서 역량을 발휘할 수 있도록 지원하는 등 미래 기술 생태계 조성에 힘쓰고 있다고 전했다.

작성일 : 2025-08-27

레노버, “새로운 서비스·설루션·플랫폼으로 하이브리드 AI 확대”

레노버가 AI 시대를 맞아 기업의 IT 전환 가속화를 위해 ‘레노버 하이브리드 AI 어드밴티지(Lenovo Hybrid AI Advantage)’를 확장했다고 밝혔다. 이번 확장을 통해 레노버는 고성능 서버 기반의 가속 컴퓨팅, 네트워킹, 파트너 통합 기능을 갖춘 AI 인프라를 바탕으로 기업이 AI 팩토리를 구축·확장·운영할 수 있도록 지원하는 프레임워크를 제공한다. 새롭게 검증된 설루션과 서비스, 플랫폼은 기업이 모든 환경에 맞춰 적합한 AI를 보다 빠르게 배포할 수 있도록 지원하고 생산성, 민첩성, 신뢰성을 기반으로 한 비즈니스 가치 실현을 가능하게 한다. 레노버 하이브리드 AI 어드밴티지는 AI 인프라, 데이터, 모델, 서비스, 검증된 활용 사례를 통합해 기업이 조직 전반의 인력, 운영, 데이터에 AI를 적용할 수 있도록 지원한다. 레노버는 자사의 서비스를 기반으로 생성형 AI 도구 도입 프레임워크를 적용할 경우 생산성과 효율이 최대 31% 향상(주당 절감 시간 기준)될 수 있다고 설명했다. 레노버의 AI 도입 및 변화 관리 서비스(AI Adoption and Change Management Services)는 기업이 AI 수용 태세를 점검하고, 인력 역량을 강화하며, 참여도를 높이고, 페르소나 기반의 변화 관리와 모범 사례를 통해 기업 시스템에서 ROI를 극대화하도록 지원한다. 주요 서비스 항목으로는 ▲레노버 AI 인적 준비도 평가 ▲페르소나 기반 교육 및 참여 유도 ▲ 코파일럿 도입 지원 ▲AI 거버넌스 및 조직 문화 수용성 강화 등이다. 레노버 하이브리드 AI 어드밴티지는 기업이 AI 실험 단계를 넘어 조직 전반에 걸쳐 측정 가능한 성과를 달성할 수 있도록 지원한다. AI에 대한 기대와 실제 효과 사이의 격차를 줄이기 위해서는 주요 비즈니스 과제를 해결하고 기업 워크플로에 맞게 확장 가능한 신뢰도 높은 AI 애플리케이션이 필요하다. 레노버는 ISV와의 협력을 통해 검증된 레노버 AI 이노베이터 디자인 기반의 설루션을 제공해 기업이 손쉽게 설루션을 맞춤화하고 성능을 최적화할 수 있도록 지원한다고 밝혔다. 이 설루션들은 하이브리드 AI 플랫폼 환경에 최적화되어 실제 비즈니스 워크플로와 활용 사례를 구현할 수 있도록 설계됐다. 대표 설루션으로는 ▲센티픽(Centific) AI 데이터 파운드리 및 엔비디아 기반의 호스피탈리티 설루션 ▲아바돈(Avathon) 비주얼 AI 및 엔비디아 기반의 산업 현장 안전 및 보호장비 착용 준수 여부 모니터링 설루션 ▲웨이트타임(WaitTime) 및 인텔 기반의 리테일 및 스마트 공간 분석 설루션 ▲트리포크(Trifork) 및 엔비디아 기반의 품질 검사 설루션 등이 있다. 이번 확장은 시스코, IBM, 엔비디아와의 협업을 기반으로 글로벌 기업의 AI 도입을 가속화하는 새로운 통합 설루션을 제공한다. 새로운 플랫폼은 업계 선도 파트너의 가속 컴퓨팅, 네트워킹, 스위칭, 소프트웨어를 통합한 고성능·저전력 AI 인프라를 기반으로 기업이 하이브리드 AI 팩토리를 손쉽게 구축·확장·운영할 수 있도록 지원한다. 레노버는 다양한 산업의 모델 개발, 그래픽 처리, 시뮬레이션 워크로드를 위한 연산 성능을 제공하는 새로운 씽크시스템 SR680a V4 시스템을 선보였다. 이 시스템은 인텔 제온(Xeon) 6 CPU와 엔비디아 블랙웰(BlackWell) GPU를 탑재했으며, 고속 엔비디아 NV링크로 GPU 간 고속 연결을 지원해 탁월한 컴퓨팅 파워와 AI 가속 기능을 제공한다. 또한 8개의 엔비디아 슈퍼NIC과 블루필드-3 DPU를 탑재해 기존 대비 최대 11배 빠른 대규모 언어 모델 추론 성능, 7배 높은 연산 처리 성능, 4배 확장된 메모리를 지원한다. 또한 IBM 왓슨x 기반 하이브리드 AI 플랫폼은 레노버 씽크시스템 SR675 서버, 레드햇 오픈시프트(Red Hat OpenShift), 엔비디아 기술을 기반으로 구축된 고성능 인프라를 통해 생성형 AI 모델의 개발, 배포, 거버넌스를 가속화한다. 시스코 기반의 하이브리드 AI 플랫폼은 최대 8개의 엔비디아 RTX PRO 6000 블랙웰 GPU를 탑재한 레노버 SR675 V3 서버를 기반으로 구축되며, 엔비디아 스펙트럼-X(Spectrum-X)가 적용된 시스코 넥서스(Nexus) 스위치를 통해 1.6배 향상된 AI 네트워크 성능과 효율적인 네트워크 관리를 제공한다. 레노버 인프라스트럭처 설루션 그룹(ISG) 애슐리 고라크푸르왈라(Ashley Gorakhpurwalla) 사장은 “레노버는 통합 설루션 전반에서 획기적인 혁신을 이끌며 업계 변화를 주도하는 한편, 모든 기업이 엔터프라이즈급 AI를 실현할 수 있도록 하이브리드 AI 분야를 선도하고 있다”면서, “레노버는 이번 설루션과 신뢰할 수 있는 파트너십을 기반으로 AI를 현실화하고 있다. 검증된 다양한 사용 사례와 서비스를 통해 측정 가능한 생산성 향상과 만족도 제고, 데이터 기반의 빠른 비즈니스 가치 실현을 가능케 할 것”이라고 밝혔다.

작성일 : 2025-08-26

HPE, 엔비디아와 협력해 에이전틱·피지컬 AI 혁신 가속화

HPE는 기업이 AI를 도입하고 개발 및 운영하는 과정을 폭넓게 지원하는 ‘HPE 기반 엔비디아 AI 컴퓨팅(NVIDIA AI Computing by HPE)’ 포트폴리오의 주요 혁신 사항을 공개했다. HPE는 엔비디아 AI 엔터프라이즈(NVIDIA AI Enterprise)와의 통합을 한층 강화하고, 최신 엔비디아 AI 모델 및 엔비디아 블루프린트(NVIDIA Blueprints)를 HPE 프라이빗 클라우드 AI(HPE Private Cloud AI)에 탑재함으로써 개발자들이 AI 애플리케이션을 보다 간편하게 구축하고 운영할 수 있도록 지원하게 되었다고 전했다. 또한 HPE는 엔비디아 블랙웰(NVIDIA Blackwell) 기반 가속 컴퓨팅을 탑재한 HPE 프로라이언트 컴퓨트(HPE ProLiant Compute) 서버를 출하할 예정이며, 이를 통해 생성형 AI, 에이전틱 AI 및 피지컬 AI 워크로드를 향상된 성능으로 지원할 수 있을 것으로 보고 있다. 엔비디아 블랙웰 아키텍처를 탑재한 HPE 프로라이언트 컴퓨트 서버는 두 종류의 엔비디아 RTX PRO 서버 구성을 포함한다. HPE 프로라이언트 DL385 Gen11 서버는 신규 2U RTX PRO 서버 폼팩터의 공랭식 서버로, 엔비디아 RTX PRO 6000 블랙웰 서버 에디션 GPU를 최대 2개까지 지원한다. 이 제품은 기업의 증가하는 AI 수요를 충족해야 하는 데이터센터 환경에 최적화된 설계를 지향한다. HPE 프로라이언트 컴퓨트 DL380a Gen12 서버는 4U 폼팩터 기반으로, 엔비디아 RTX PRO 6000 GPU를 최대 8개까지 지원하며 2025년 9월 출시될 예정이다. 특히 HPE 프로라이언트 컴퓨트 Gen12 서버는 HPE iLO(Integrated Lights Out) 7의 실리콘 RoT(Root of Trust) 및 시큐어 인클레이브(Secure Enclave) 기반으로 한 다층 보안 기능을 갖추고 있으며, 위조 및 변조 방지 보호와 양자 내성 펌웨어 서명(quantum-resistant firmware signing) 기능을 통해 한층 강화된 보안 환경을 제공한다. ▲ HPE 프로라이언트 DL380a Gen12 서버 또한, HPE 컴퓨트 옵스 매니지먼트(HPE Compute Ops Management)으로 지원되는 중앙 집중형 클라우드 네이티브 방식의 라이프사이클 자동화 기능은 서버 관리에 소요되는 IT 업무 시간을 최대 75%까지 줄이고, 서버당 연간 평균 4.8시간의 다운타임 감소 효과를 제공한다. 대상 워크로드에는 생성형 및 에이전틱 AI을 비롯해 로보틱스 및 산업용 사례 등 피지컬 AI, 품질 관리(QC) 모니터링 및 자율주행과 같은 비주얼 컴퓨팅, 시뮬레이션, 3D 모델링, 디지털 트윈, 그리고 각종 엔터프라이즈 애플리케이션이 포함된다. 한편, HPE는 올해 말 출시 예정인 차세대 ‘HPE 프라이빗 클라우드 AI’를 발표했다. 이 설루션은 엔비디아 RTX PRO 6000 GPU를 탑재한 HPE 프로라이언트 컴퓨트 Gen12 서버를 지원하며, GPU 세대 간의 원활한 확장성, 폐쇠망(air-gapped) 관리 및 엔터프라이즈 멀티 테넌시(multi-tenancy) 기능 등을 제공할 예정이다. HPE와 엔비디아가 공동 개발한 엔터프라이즈 턴키 AI 팩토리 설루션인 HPE 프라이빗 클라우드 AI는 에이전틱 AI를 위한 최신 버전의 엔비디아 네모트론(NVIDIA Llama Nemotron) 모델, 피지컬 AI 및 로보틱스를 위한 코스모스 리즌(Cosmos Reason) VLM(vision language model), 엔비디아 블루프린트 VSS 2.4 (NVIDIA Blueprint for Video Search and Summarization)를 지원하여 대규모 영상 데이터에서 인사이트를 추출하는 영상 분석 AI 에이전트를 구축할 수 있다. 또한, HPE 프라이빗 클라우드 AI는 최신 AI 모델을 위한 엔비디아 NIM 마이크로서비스, 엔비디아 블루프린트를 빠르게 배포할 수 있도록 맞춤형 설계되어, 고객들은 HPE AI 에센셜(HPE AI Essentials)를 통해 이를 간편하게 활용할 수 있다. 이와 함께 HPE 프라이빗 클라우드 AI는 엔비디아 AI 가속화 컴퓨팅, 네트워킹, 소프트웨어와의 깊은 통합을 바탕으로, 기업들이 데이터 통제를 유지하면서도 AI의 가치를 보다 신속하게 활용할 수 있도록 지원한다. 이를 통해 고객은 급증하는 AI 추론 수요를 효과적으로 관리하고 AI 생산 속도를 가속화할 수 있다. HPE 셰리 윌리엄스(Cheri Williams) 프라이빗 클라우드 및 플렉스 설루션 부문 수석 부사장 겸 총괄은 “HPE는 AI 시대를 맞아 기업들이 성공을 이룰 수 있도록 필요한 툴과 기술을 제공하는 데 전념하고 있다”면서, “엔비디아와의 협업을 통해 기술 혁신의 경계를 지속적으로 넓혀가며, 생성형 AI, 에이전틱 AI, 피지컬AI의 가치 실현을 포함해 엔터프라이즈 환경의 복잡하고 다양한 요구를 충족하는 설루션을 제공하고 있다. HPE 프로라이언트 서버와 HPE 프라이빗 클라우드 AI의 확장된 역량을 결합함으로써, 기업들이 AI 혁신의 다음 단계를 더욱 신속하고 신뢰 있게 수용할 수 있도록 지원하고 있다”고 밝혔다. 엔비디아의 저스틴 보이타노(Justin Boitano) 엔터프라이즈 AI 부사장은 “기업은 최신 AI 요구사항에 맞추기 위해 유연하고 효율적인 인프라가 필요하다”면서, “엔비디아 RTX PRO 6000 블랙웰 GPU를 탑재한 HPE 2U 프로라이언트 서버는 단일 통합형 기업용 플랫폼에서 거의 모든 워크로드를 가속화할 수 있도록 해줄 것”이라고 밝혔다.

작성일 : 2025-08-18

엔비디아, 개인용 AI 슈퍼컴퓨터 ‘DGX 스파크’ 국내 예약 주문 시작

엔비디아가 차세대 개인용 AI 슈퍼컴퓨터 ‘엔비디아 DGX 스파크(NVIDIA DGX Spark)’의 국내 예약 주문을 시작한다고 밝혔다. DGX 스파크는 책상 위에 올려 놓을 수 있는 크기의 AI 슈퍼컴퓨터로 생성형 AI, 거대 언어 모델(LLM), 고속 추론 등 다양한 AI 워크플로를 로컬 환경에서 효율적으로 구현할 수 있도록 설계됐다. AI 개발이 고도화됨에 따라, 조직은 데이터 보안 강화와 지연 최소화, 배포 유연성 등을 고려해 로컬 환경에서 직접 AI 모델을 개발하고 실행할 수 있는 시스템을 요구하고 있다. DGX 스파크는 이러한 수요에 대응해 데스크톱 환경에서도 데이터 크기나 위치, 모델 규모에 제약 없이 민첩하고 효율적인 AI 개발이 가능하도록 지원한다. DGX 스파크는 데스크톱 폼팩터에 최적화된 엔비디아 GB10 그레이스 블랙웰 슈퍼칩(Grace Blackwell Superchip)을 탑재해 FP4 정밀도 기준, 최대 1페타플롭의 AI 성능을 제공한다. 또한, 고성능 엔비디아 커넥트-X(Connect-X) 네트워킹으로 두 대의 엔비디아 DGX 스파크 시스템을 연결해 최대 4,050억 개 파라미터의 AI 모델을 처리할 수 있다. DGX 스파크는 128GB 메모리를 탑재했으며, 엔비디아 AI 소프트웨어 스택이 사전 설치돼 있다. 이를 통해 딥시크, 메타, 구글 등에서 선보인 최대 2000억 개 파라미터의 최신 AI 모델도 로컬 환경에서 직접 프로토타이핑, 미세 조정, 추론할 수 있다. 또한, 사용자는 파이토치(PyTorch), 주피터(Jupyter), 올라마(Ollama) 등 익숙한 개발 도구를 사용할 수 있으며, 이를 DGX 클라우드나 가속화된 데이터센터 환경으로 손쉽게 확장할 수 있다. 이와 함께 엔비디아 NIM 마이크로서비스와 엔비디아 블루프린트(Blueprint)에 대한 액세스를 통해 AI 애플리케이션을 더욱 빠르게 개발하고 배포할 수 있도록 지원한다. 엔비디아는 “DGX 스파크는 올해 엔비디아 연례 개발자 콘퍼런스인 GTC와 컴퓨텍스(COMPUTEX)에서 공개된 이후 큰 관심을 받아왔으며, 이번 국내 예약 주문을 계기로 본격적인 보급이 기대된다”고 전했다. DGX 스파크의 국내 예약 주문은 엔비디아 공식 홈페이지를 통해 진행된다. 국내 주요 파트너사 중 원하는 업체를 선택해 예약할 수 있으며, 대량 구매도 가능하다. 공식 파트너사로는 에즈웰에이아이, 비엔아이엔씨, 디에스앤지, 아이크래프트, 리더스시스템즈, 메이머스트, MDS테크, 유클릭, 씨이랩, 제스프로가 있다.

작성일 : 2025-07-29

대원씨티에스, 지포스 RTX 5050 탑재한 에이수스 그래픽카드 2종 출시

대원씨티에스가 엔비디아의 최신 블랙웰(Blackwell) 아키텍처 기반 지포스(GeForce) RTX 5050 GPU를 탑재한 에이수스 프라임 지포스 RTX 5050 OC(ASUS Prime GeForce RTX 5050 OC)와 에이수스 듀얼 지포스 RTX 5050 OC(ASUS Dual GeForce RTX 5050 OC) 그래픽카드 2종을 한국 시장에 정식 출시했다. 트리플 팬 디자인의 에이수스 프라임 RTX 5050 OC와 소형 폼팩터에 특화된 듀얼 팬 디자인의 에이수스 듀얼 RTX 5050 OC는 2560 CUDA 코어, 8GB GDDR6 20Gbps 등 동일한 코어 사양을 공유하면서도 쿨링 구조, 슬롯 두께, 시스템 활용 목적에서 콘셉트가 갈린다. 프라임은 트리플 Axial-tech 팬과 대형 히트싱크, MaxContact 기반의 구리 베이스를 통해 고사양 환경을 겨냥한 설계를 채택했으며, 듀얼은 20cm 내외의 짧은 길이와 2슬롯 구성으로 Mini-ITX 및 mATX 플랫폼에 최적화된 컴팩트 폼팩터가 특징이다. 에이수스 프라임 RTX 5050 OC는 2.5슬롯 두께(268.3×120×50mm)의 히트싱크에 Axial-tech 팬 3개와 통풍형 메탈 백플레이트를 조합해 부스트 클록 2707MHz(OC 모드)에서도 안정적인 구동을 실현했다. GPU 접촉면을 평탄화한 MaxContact 설계를 통해 기존 대비 GPU 온도를 최대 2℃ 낮췄으며, 듀얼 BIOS 스위치로 Performance(최대 냉각)와 Quiet(저소음) 모드 전환이 가능하다. 0dB 팬 스톱 기능도 갖춰 저부하 상황에서는 팬 회전을 멈춰 정숙한 환경을 유지한다. 5세대 텐서 코어와 4세대 RT 코어는 DLSS 4 Multi Frame Generation, Ray Reconstruction, Reflex 2 Frame Warp 등 최신 RTX 기능을 모두 지원하며, 1440p 고해상도 게이밍과 AI 기반 콘텐츠 제작 환경에서도 높은 성능을 발휘한다. 에이수스 듀얼 RTX 5050 OC는 2슬롯(203×120.2×40mm) 규격으로 Mini-ITX 및 mATX 케이스에 최적화된 소형 설계를 바탕으로 공간 활용성을 높였다. 듀얼 90mm Axial-tech 팬과 히트파이프 기반 히트싱크, 통풍형 메탈 백플레이트를 적용해 부스트 클록 2677MHz(OC 모드)에서도 발열을 효과적으로 제어한다. HDR Ready HDMI 2.1b 1개, DP 2.1b 3개 구성으로 4K 480Hz 및 8K 165Hz 출력 환경을 구성할 수 있어 소형 게이밍 PC부터 PC방, 사무용 시스템까지 다양한 환경에 적합하다. 대원씨티에스는 엔트리 포지션을 전략적으로 겨냥한 엔비디아 RTX 5050 시리즈 신제품 2종이 1080p 해상도 게임과 1440p AAA 타이틀을 모두 소화할 수 있어, 블랙웰 세대의 AI·레이 트레이싱 기능을 합리적 가격으로 제공한다고 설명했다. 또한, 디스플레이포트 2.1 UHBR 20 지원으로 차세대 초고해상도·초고주사율 모니터 생태계까지 앞서 준비할 수 있다. 대원씨티에스 남혁민 본부장은 “에이수스 프라임 및 듀얼 RTX 5050 그래픽카드 2종은 폼팩터와 튜닝 지향성에 따라 선택 폭을 넓힌 RTX 50 시리즈의 핵심 라인업”이라며, “트리플 팬 하이엔드급의 프라임과 SFF를 위한 듀얼 제품을 통해 게이머, 크리에이터, AI PC 사용자 모두의 다양한 요구를 만족시키겠다”고 밝혔다.

작성일 : 2025-07-24

델, RTX 프로 블랙웰 탑재한 ‘델 프로 맥스’ 모바일 워크스테이션 신제품 공개

델 테크놀로지스가 AI 워크로드에서 높은 성능을 발휘하도록 만들어진 ‘델 프로 맥스(Dell Pro Max)’ 모바일 워크스테이션 신제품 6종을 공개했다. 올초 델은 새로운 통합 브랜딩 전략 하에 고성능 워크스테이션 제품군을 ‘델 프로 맥스(Dell Pro Max)’ 포트폴리오로 통합했다. 기존 브랜드인 ‘델 프리시전(Dell Precision)’을 계승한 델 프로 맥스는 엔비디아 RTX 프로 블랙웰 GPU(NVIDIA RTX PRO Blackwell Generation GPU) 기반의 높은 성능과 휴대성, 델 프로(Dell Pro)의 디자인을 적용한 통일감 있고 프로페셔널한 외관을 갖춰 AI 전문가, 개발자, 그래픽 디자이너, 엔지니어 등 전문 사용자의 효율과 만족도를 높인다. 이번에 발표한 신제품은 ▲강력한 성능과 휴대성, 디자인을 겸비한 최고급 모델인 델 프로 맥스 14∙16 프리미엄 ▲넓은 화면에 데스크톱 성능을 제공하는 메인스트림급 모델인 델 프로 맥스 16∙18 플러스 ▲가벼운 워크로드를 위한 엔트리급 모델인 델 프로 맥스 14∙16 등 총 6종이다. 디자인에 중점을 둔 최고급형 모델인 ‘델 프로 맥스 14 프리미엄(Dell Pro Max 14 Premium)’과 ‘델 프로 맥스 16 프리미엄(Dell Pro Max 16 Premium)’은 휴대성과 감각적인 디자인, 높은 성능의 조화를 추구했다. CNC 알루미늄을 적용해 슬림하고 견고한 폼팩터를 완성했고, 키캡 사이 간격을 최소화한 제로 래티스 키보드를 적용해 세련된 느낌을 더했다. 엔비디아 RTX 프로 3000 블랙웰 GPU와 인텔 코어 울트라 9 285H 프로세서(45W)를 탑재해 이전 세대 대비 각각 19%, 23% 높은 그래픽 성능을 구현하여 영상 편집이나 데이터 분석을 더욱 원활하게 수행할 수 있다. 베사(VESA) DisplayHDR 트루블랙 1000 인증을 획득하고 4K 탠덤 OLED 디스플레이를 옵션으로 제공해 어두운 색상을 한 층 깊게 구현하는 등 크리에이티브 또는 엔지니어링 프로젝트에 필요한 전문적인 성능을 발휘한다. 복잡하거나 데이터 집약적인 작업을 수행할 때 데스크톱 수준의 성능을 제공하는 ‘델 프로 맥스 16 플러스(Dell Pro Max 16 Plus)’와 ‘델 프로 맥스 18 플러스(Dell Pro Max 18 Plus)’는 각각 16, 18형의 넓은 화면 공간에서 멀티태스킹, 창의적 디자인, 심층 분석 워크로드 등을 넉넉히 지원한다. 엔비디아 RTX 프로 5000 블랙웰 GPU 및 인텔 코어 울트라 9 285HX 프로세서(55W)를 탑재하고, 최대 256GB의 메모리 및 16TB까지 확장할 수 있는 듀얼 스토리지를 갖췄다. 이 제품들은 이전 세대 대비 각각 53%, 44% 높은 그래픽 성능을 구현하여 AI 모델링 및 훈련부터 복잡한 시뮬레이션, 대규모 데이터 분석까지 컴퓨팅 집약적인 프로젝트를 효과적으로 실행할 수 있다. 특히, 델 프로 맥스 플러스 제품군은 새롭게 특허 받은 방열 설계 방식을 통해 고집약적 워크로드를 실행할 때도 온도를 낮게 유지하면서 전체 성능을 최대 36%까지 향상시킨다. 또한, 점점 더 복잡해지는 워크로드에 대비해 CAMM2 메모리를 새로 탑재했다. 비교적 가볍고 일상적인 워크로드에 초점을 맞춘 ‘델 프로 맥스 14(Dell Pro Max 14)’와 ‘델 프로 맥스 16(Dell Pro Max 16)’은 최대 QHD+ 해상도와 16:10 화면비를 지원하는 14, 16형 디스플레이를 탑재했다. 사용자의 니즈에 따라 인텔 또는 AMD 프로세서를 선택할 수 있으며, AMD 라이젠 AI 프로세서를 탑재한 제품은 델 프로 맥스 라인업 중 50 TOPS 이상의 단독 NPU 연산 성능을 구현한 최초의 코파일럿 플러스(Copilot+) PC다. 인텔 프로세서 기반의 제품은 최대 인텔 코어 울트라 9 285H 프로세서와 엔비디아 RTX 프로 2000 블랙웰 외장 GPU를 탑재해 이전 세대 대비 각각 36%, 33% 더 강력한 성능을 구현한다. 각각 최대 18시간, 20시간의 긴 배터리 수명을 제공해 전원에 연결하지 않고 디자인 애플리케이션 실행, 대규모 엑셀 파일 처리, 2D/3D 모델 생성 등의 멀티태스킹을 해야 하는 사용자에게 적합한 제품이다. 이번 신제품들은 기업용 PC를 위한 강력한 보안 기능을 갖춰 로컬 디바이스에서 구동하는 AI 워크로드를 효과적으로 보호한다. 또한 델 고유의 지속가능성의 가치를 반영해 재생 플라스틱(PCR), 바이오 플라스틱(bio-based plastic), 재활용∙저탄소 알루미늄 등 친환경 소재로 제작되었으며, 분리 가능한 모듈형 USB-C 포트를 탑재하여 내구성과 수리용이성을 높였다. 특히, 델 프로 맥스 플러스 제품의 경우 사용자가 보다 손쉽게 부품을 교체할 수 있도록 제품 밑면을 쉽게 여닫을 수 있도록 설계했다. 한국 델 테크놀로지스 김경진 총괄사장은 “델 프로 맥스 모바일 워크스테이션은 강력한 성능, 휴대성, 최첨단 디자인은 물론, 고급 보안과 관리 기능까지 갖춘 최상의 커머셜 AI PC이다. 델은 세계 1위 워크스테이션 제조업체로서 확보한 높은 신뢰를 바탕으로 독보적이고 차별화된 설계와 디자인을 제공하는데 집중하고 있다. 파워 유저, 엔지니어, 크리에이터 및 AI 개발자들은 델 프로 맥스를 통해 가장 까다로운 AI 워크플로를 원활히 처리할 뿐만 아니라, 한 차원 높은 성능과 창의성을 새롭게 경험하게 될 것”이라고 말했다.

작성일 : 2025-07-24

델, 최고급 컨슈머 노트북 ‘델 14∙16 프리미엄’ 첫 공개

델 테크놀로지스가 최고급 컨슈머 노트북 라인업인 ‘델 프리미엄(Dell Premium)’ AI PC 신제품 2종을 공개했다. 델은 올초 새로운 통합 브랜딩 전략 하에 업무, 엔터테인먼트, 학습 등 일상생활에서 높은 성능을 발휘하도록 설계된 소비자용 PC 제품군을 델(Dell) 포트폴리오로 통합했다. 기존 델의 최고급 컨슈머 제품 라인업인 ‘델 XPS’는 ‘델 프리미엄’으로 재탄생되었다. ‘델 프리미엄’은 ‘XPS’의 디자인 철학을 그대로 계승하여 단순미를 살린 혁신적인 미니멀리즘 디자인과 최고급 사양으로 한 차원 높은 사용자 경험을 제공한다. 이번 신제품인 ‘델 14 프리미엄(Dell 14 Premium)’과 ‘델 16 프리미엄(Dell 16 Premium)’은 각각 14.5, 16.3형 디스플레이를 탑재한 최고급 컨슈머 노트북으로 4면 베젤의 두께를 줄인 인피니티엣지(InfinityEdge) 기술을 적용해 강화된 몰입감을 선사한다. 두 제품은 7월 중에 출시된다. 델 14 프리미엄의 경우 인텔 코어 울트라 200H 시리즈 CPU를 탑재해 일상 업무에서 기존 XPS 14 대비 최대 33%, 간단한 3D 작업 및 크리에이티브 앱 사용 시에 최대 21% 더 빠른 처리 속도를 지원하며, 최대 8400MHz의 메모리 속도로 멀티태스킹, 비디오 편집, 온라인 협업 등을 원활히 지원한다. 고급 멀티스레딩 기술을 통해 다중 CPU 코어를 병렬로 사용함으로써 고해상도 비디오 편집 등 복잡한 워크플로의 작업 속도도 XPS 14 대비 최대 23% 끌어올렸다. 전력 절약형 2K LCD 디스플레이를 적용해 더 긴 배터리 수명을 보장하는 것도 특징이다. 델 14 프리미엄은 최대 20시간, 델 16 프리미엄은 최대 27시간의 배터리 수명을 제공해 전원 연결 없이 작업의 연속성을 보장한다. 또한, 액정폴리머 소재를 적용한 팬 블레이드와 공기 흐름을 극대화하는 섀시 설계로 데이터 집약적인 작업 시에도 조용하고 쾌적한 작업 환경을 유지할 수 있다. CNC 가공 알루미늄과 고릴라 글라스 3 소재를 적용해 슬림하면서도 세련되고 견고한 내구성을 갖췄으며, 키보드 맨 윗줄에 정전식 터치 버튼, 키보드 양 옆 공간을 큼지막한 키캡으로 채운 ‘엣지-투-엣지’ 키보드 등의 스타일리시한 디자인은 심미적 만족감까지 높여준다. 이번 신제품은 델 고유의 지속가능성의 가치를 반영한 친환경 노트북으로, 미국 전자제품 친환경 인증제도(EPEAT)에서 '골드' 등급 및 Climate+ 인증, 에너지 스타(Energy Star) 인증을 취득했고, 추후에 다시 100% 재활용이 가능한 100% 친환경 포장재에 담겨 고객에게 배송된다. 더 넓은 디스플레이와 고성능에 초점을 맞춘 델 16 프리미엄은 인텔 코어 울트라 프로세서 9(45W)과 엔비디아 블랙웰(NVIDIA Blackwell) 아키텍처 기반의 지포스 RTX 50 시리즈 노트북 GPU를 탑재해 AI를 기반으로 몰입감을 높이는 뛰어난 그래픽 품질을 지원하며, 엔비디아 DLSS 4 기술로 이미지 생성 성능을 향상시켰다. 인텔 썬더볼트 5(옵션)는 최대 80/120Gbps의 속도로 효율적인 멀티태스킹과 초고속 데이터 전송을 지원한다. 크리에이티브 작업을 주로 하는 사용자를 위해 4K 해상도와 120Hz 주사율을 지원하는 OLED 디스플레이 옵션도 제공한다. 휴대성과 성능의 조화를 갖춘 델 14 프리미엄은 엔비디아 지포스 RTX 4050(NVIDIA GeForce RTX 4050) GPU와 3.2K 해상도를 지원하는 OLED 디스플레이를 옵션으로 제공해 XPS 14 대비 최대 29% 빠른 작업 속도를 구현하며, 더욱 선명한 화면에서 업무를 수행하거나, 콘텐츠를 감상할 수 있다. 이전 세대 대비 4.8배 빠른 최신 Wi-Fi 7 기능도 지원해 고품질 및 대용량 파일을 초고속으로 다운받을 수 있다. 한국 델 테크놀로지스의 김경진 총괄사장은 “충성도 높은 최고급 노트북 브랜드 XPS를 계승한 델 프리미엄 노트북은 성능, 디자인, 지속가능성이 완벽한 조화를 이루며 크리에이터 등 다양한 사용자들에게 최고의 컴퓨팅 경험을 선사할 것으로 기대한다”면서, “윈도우 10 지원이 종료되는 시점이 다가옴에 따라 빠른 성능과 AI 기반 애플리케이션, 탁월한 보안 기능을 통해 사용자들이 보다 효과적으로 AI 기반 미래에 대비할 수 있도록 지원할 것”이라고 전했다.

작성일 : 2025-07-16

AWS, 엔비디아 블랙웰 기반의 AI 컴퓨팅 인프라 공개

아마존웹서비스(AWS)는 추론 모델과 에이전틱 AI 시스템(Agentic AI systems) 등 새로운 생성형 AI 발전을 가속화하기 위해, 엔비디아 그레이스 블랙웰 슈퍼칩(NVIDIA Grace Blackwell Superchips)으로 구동되는 P6e-GB200 울트라서버(P6e-GB200 UltraServers)를 출시했다고 밝혔다. P6e-GB200 울트라서버는 크고 정교한 AI 모델의 훈련과 배포를 위해 설계되었다. AWS는 올해 초, 다양한 AI 및 고성능 컴퓨팅(HPC) 워크로드를 위해 엔비디아 블랙웰 GPU로 구동되는 P6-B200 인스턴스(P6-B200 Instances)를 출시한 바 있다. P6e-GB200 울트라서버는 현재 AWS가 제공하는 가장 강력한 GPU 제품으로, 최대 72개의 엔비디아 블랙웰 GPU를 탑재하고, 5세대 엔비디아 NV링크(NVIDIA NVLink)를 통해 상호 연결된 단일 컴퓨팅 유닛으로 작동한다. 각 울트라서버는 360페타플롭스(petaflops)의 FP8 고밀도 컴퓨팅과 13.4테라바이트(TB)의 총 고대역폭 GPU 메모리(HBM3e)를 제공한다. 이는 P5en 인스턴스와 비교하여 단일 NV링크 도메인에서 20배 이상의 컴퓨팅 성능과 11배 이상의 메모리를 제공한다. P6e-GB200 울트라서버는 4세대 일래스틱 패브릭 어댑터(Elastic Fabric Adapter : EFAv4) 네트워킹으로 최대 초당 28.8테라비트(Tbps)의 통합 대역폭을 지원한다. P6-B200 인스턴스는 다양한 AI 활용 사례에 유연하게 대응할 수 있는 옵션이다. 각 인스턴스는 NV링크로 상호 연결된 8개의 엔비디아 블랙웰 GPU와 1.4TB의 고대역폭 GPU 메모리, 최대 3.2Tbps의 EFAv4 네트워킹, 5세대 인텔 제온 스케일러블 프로세서(Intel Xeon Scalable processors)를 제공한다. 또한, P6-B200 인스턴스는 P5en 인스턴스와 비교하여 최대 2.25배 향상된 GPU 테라플롭스(TFLOPs) 연산 성능, 1.27배의 GPU 메모리 크기, 1.6배의 GPU 메모리 대역폭을 제공한다. AWS는 사용자의 구체적인 워크로드 요구사항과 아키텍처 요구사항에 따라 P6e-GB200과 P6-B200를 선택해야 한다고 전했다. P6e-GB200 울트라서버는 조 단위 매개변수(trillion-parameter) 규모의 프론티어 모델 훈련 및 배포와 같은 컴퓨팅 및 메모리 집약적인 AI 워크로드에 적합하다. 엔비디아 GB200 NVL72 아키텍처는 이러한 규모에서 성능을 발휘한다. 72개의 GPU가 통합된 메모리 공간과 조정된 워크로드 분산을 통해 단일 시스템으로 작동할 때, 이 아키텍처는 GPU 노드 간 통신 오버헤드를 줄여 더 효율적인 분산 훈련을 가능하게 한다. 추론 워크로드의 경우, 1조 개 파라미터 모델을 단일 NV링크 도메인 내에 완전히 포함할 수 있어 대규모 환경에서도 더 빠르고 일관된 응답 시간을 제공한다. P6-B200 인스턴스는 광범위한 AI 워크로드를 지원하며 중대형 규모의 훈련 및 추론 워크로드에 적합하다. 기존 GPU 워크로드를 이식하려는 경우, P6-B200 인스턴스는 코드 변경을 최소화하고 현재 세대 인스턴스로부터의 마이그레이션을 간소화하는 친숙한 8-GPU 구성을 제공한다. 또한 엔비디아의 AI 소프트웨어 스택이 Arm과 x86 모두에 최적화되어 있지만, 워크로드가 x86 환경에 특별히 구축된 경우 인텔 제온 프로세서를 사용하는 P6-B200 인스턴스가 효과적인 선택이 될 것이다. 한편, AWS는 3세대 EC2 울트라클러스터(EC2 UltraClusters)에 P6e-GB200 울트라서버를 배포하여, 가장 큰 데이터센터들을 포괄할 수 있는 단일 패브릭을 구현했다고 전했다. 3세대 울트라클러스터는 전력 소모를 최대 40% 줄이고 케이블링 요구사항을 80% 이상 줄여 효율성을 높이는 동시에, 장애 가능성을 유발하는 요소를 감소시킨다. 이러한 대규모 환경에서 일관된 성능을 제공하기 위해, AWS는 SRD(Scalable Reliable Datagram) 프로토콜을 사용하는 EFA(Elastic Fabric Adapter)를 활용한다. 여러 네트워크 경로를 지능적으로 활용해 트래픽을 분산시켜, 혼잡이나 장애 상황에서도 원활한 운영을 유지한다. AWS는 4세대에 걸쳐 EFA의 성능을 지속적으로 개선해 왔다. EFAv4를 사용하는 P6e-GB200과 P6-B200 인스턴스는 EFAv3을 사용하는 P5en 인스턴스와 비교하여 분산 훈련에서 최대 18% 더 빠른 집합 통신 성능을 보여준다. P6-B200 인스턴스는 검증된 공기 냉각 인프라를 사용하는 반면, P6e-GB200 울트라서버는 액체 냉각 방식을 사용하여 대규모 NV링크 도메인 아키텍처에서 더 높은 컴퓨팅 밀도를 가능하게 하고 더 높은 시스템 성능을 제공한다. P6e-GB200은 새로운 기계식 냉각 솔루션을 적용한 액체 냉각 방식으로 설계되었다. 이 시스템은 신규 및 기존 데이터 센터 모두에서 칩 수준까지 냉각이 가능한 유연한 액체-칩(liquid-to-chip) 냉각 방식을 제공한다. 이를 통해 하나의 시설 내에서 액체 냉각 방식의 가속기와 공랭 방식의 네트워크 및 스토리지 인프라를 함께 운영할 수 있다. 이러한 유연한 냉각 설계를 통해 AWS는 낮은 비용으로 높은 성능과 효율을 제공할 수 있다. AWS는 “아마존 세이지메이커 하이퍼팟(Amazon SageMaker HyperPod), 아마존 EKS(Amazon EKS), AWS에 탑재된 엔비디아 DGX 클라우드 등 여러 배포 경로를 통해 P6e-GB200 울트라서버와 P6-B200 인스턴스를 간편하게 시작할 수 있도록 했으며, 조직에 가장 적합한 운영 모델을 유지하면서 블랙웰 GPU 사용을 신속하게 시작할 수 있다”고 밝혔다.

작성일 : 2025-07-15

HPE, 엔비디아와 협력을 통해 신규 AI 팩토리 설루션 공개

HPE는 모든 유형의 조직이 전체 AI 라이프사이클에 걸쳐 인공지능(AI) 팩토리 구축, 도입 및 관리를 강화할 수 있도록 지원하는 새로운 설루션을 발표했다. HPE는 서비스 제공업체, 모델 개발자 등을 위한 맞춤형 컴포저블 설루션과 엔터프라이즈용 턴키 AI 팩토리인 차세대 HPE 프라이빗 클라우드 AI(HPE Private Cloud AI)를 포함해 엔비디아 블랙웰(NVIDIA Blackwell) GPU를 탑재한 ‘HPE 포트폴리오 기반 엔비디아 AI 컴퓨팅(NVIDIA AI Computing by HPE portfolio)’ 설루션 포트폴리오를 확대하고 있다. AI 팩토리를 위한 통합형 엔드투엔드 설루션과 서비스는 고객이 최신 AI를 위한 데이터센터를 구축할 때 자체적으로 AI 기술 스택을 구성하는 데 따르는 복잡성을 줄여준다. HPE 기반 엔비디아 AI 컴퓨팅 포트폴리오의 대표 제품인 프라이빗 클라우드 AI는 엔비디아 가속 컴퓨팅, 네트워킹 및 소프트웨어를 포함한 올인원 AI 팩토리 설루션이다. 엔비디아 블랙웰 가속 컴퓨팅을 지원하는 HPE 프로라이언트 컴퓨트 Gen12 서버는 변조 방지를 위한 시큐어 인클레이브(Secure Enclave), 양자 이후 암호화, 랙 및 서버 수준의 신뢰할 수 있는 공급망 역량을 제공한다. 또한, 엔비디아 H200 NVL 및 엔비디아 RTX PRO 6000 서버 에디션 GPU를 포함해 다양한 기업용 AI 워크로드(에이전트 및 물리형 AI 사례 포함)를 지원한다. 새로운 연합 아키텍처를 통해 리소스 풀링이 통합되어, 모든 AI 워크로드에 새로운 GPU와 리소스를 공유할 수 있다. 프라이빗 클라우드 AI는 엄격한 데이터 프라이버시 요구사항을 갖춘 조직을 위한 폐쇄형 클라우드(air-gapped) 관리 기능 및 기업이 팀 간 협업과 리소스 분할을 가능하게 하는 멀티 테넌시 기능을 지원한다. 그리고, AI 에이전트 생성 및 워크플로에 특화된 엔비디아 AI-Q 블루프린트 등 최신 엔비디아 AI 블루프린트(NVIDIA AI Blueprints)를 제공한다. 고객은 구매 전 에퀴닉스(Equinix) 전 세계 고성능 데이터센터 네트워크에서 프라이빗 클라우드 AI를 테스트해볼 수 있는 새로운 ‘트라이 앤 바이(Try and Buy)’ 프로그램을 활용할 수 있다. 한편, HPE는 자사의 AI 팩토리 포트폴리오를 확대하면서 신규 검증 설루션도 선보였다. 이 설루션에는 액체 냉각 기술, 하이브리드 클라우드 운영, 통합 제어를 위한 HPE Morpheus Enterprise Software 등이 포함됐다. HPE의 종단 간 컴포저블 설루션은 고객을 위해 사전 통합된 모듈형 기술 스택으로 제공돼, 구축 시간과 가치를 실현하는 속도를 높인다. HPE의 AI 팩토리 설루션은 엔비디아 엔터프라이즈 AI 팩토리의 검증된 설계를 활용함으로써 최신 엔비디아 가속 컴퓨팅, 엔비디아 스펙트럼-X(NVIDIA Spectrum-X) 이더넷 네트워킹, 엔비디아 블루필드-3(NVIDIA BlueField-3) DPU, 및 엔비디아 AI 엔터프라이즈 소프트웨어(NVIDIA AI Enterprise software)를 통해 배포 가능하다. 이를 통해 차세대 AI 시대를 위한 고성능, 강력한 보안, 효율적인 저장 가속화, 및 확장 가능한 인프라를 제공한다. HPE의 안토니오 네리(Antonio Neri) 사장 겸 최고경영자(CEO)는 “생성형 AI, 에이전틱 AI, 피지컬 AI는 글로벌 생산성을 혁신하고 지속가능한 사회적 변화를 가져올 잠재력을 품고 있다. 하지만 이러한 AI의 성공은 결국 이를 뒷받침하는 인프라와 데이터의 역량에 의해 좌우된다”며, “조직이 AI가 제공하는 기회를 실현하기 위해서는 올바른 데이터, 인텔리전스, 비전이 필요하며, 무엇보다 이를 실행할 수 있는 올바른 IT 기반을 마련하는 것이 핵심이다. HPE는 업계를 선도하는 AI 인프라와 서비스를 결합한 가장 포괄적인 접근 방식을 통해 조직이 AI 비전을 실현하고 지속가능한 비즈니스 가치를 창출할 수 있도록 지원하고 있다”고 말했다. 엔비디아의 젠슨 황(Jensen Huang) CEO는 “우리는 새로운 산업 시대에 들어서고 있다, 이는 대규모로 인텔리전스를 생성하는 능력으로 정의되는 시대”라며, “HPE와 엔비디아는 이 변혁을 주도하기 위해 전체 스택 AI 공장 인프라를 제공하며, 기업들이 데이터를 활용하고 전례 없는 속도와 정밀도로 혁신을 가속화할 수 있도록 지원한다”고 밝혔다.

작성일 : 2025-06-25

엔비디아, “모델 양자화로 스테이블 디퓨전 성능 높였다”

엔비디아가 양자화를 통해 스테이블 디퓨전 3.5(Stable Diffusion 3.5) 모델의 성능을 향상시켰다고 발표했다. 생성형 AI는 사람들이 디지털 콘텐츠를 만들고, 상상하며, 상호작용하는 방식을 혁신적으로 바꾸고 있다. 그러나 지속적으로 AI 모델의 기능이 향상되고 복잡성이 증가면서 더 많은 VRAM이 요구되고 있다. 예를 들어 기본 스테이블 디퓨전 3.5 라지(Large) 모델은 18GB 이상의 VRAM을 사용하므로 고성능 시스템이 아니면 실행이 어렵다. 엔비디아는 이 모델에 양자화를 적용하면 중요하지 않은 레이어를 제거하거나 더 낮은 정밀도로도 실행할 수 있다고 설명했다. 엔비디아 지포스(GeForce) RTX 40 시리즈와 에이다 러브레이스(Ada Lovelace) 세대 엔비디아 RTX PRO GPU는 FP8 양자화를 지원해 이러한 경량화된 모델을 실행할 수 있다. 또한 최신 엔비디아 블랙웰(Blackwell) GPU는 FP4도 지원한다. 엔비디아는 스태빌리티 AI(Stability AI)와 협력해 최신 모델인 스테이블 디퓨전 3.5 라지를 FP8로 양자화해 VRAM 사용량을 40%까지 줄였다. 여기에 엔비디아 텐서RT(TensorRT) 소프트웨어 개발 키트(SDK)를 통한 최적화로 스테이블 디퓨전 3.5 라지와 미디엄 모델의 성능을 2배로 끌어올렸다. 또한, 텐서RT가 RTX AI PC 환경을 위해 새롭게 설계됐다. 높은 성능과 JIT(Just-In-Time), 온디바이스 엔진 구축 기능을 더하고 패키지 크기를 8배 줄여 1억 대 이상의 RTX AI PC에 AI를 원활하게 배포할 수 있게 됐다. RTX용 텐서RT는 이제 개발자를 위한 독립형 SDK로 제공된다. 엔비디아와 스태빌리티 AI는 인기 있는 AI 이미지 생성 모델 중 하나인 스테이블 디퓨전 3.5의 성능을 높이고 VRAM 요구 사항을 낮췄다. 엔비디아 텐서RT 가속과 양자화 기술을 통해, 사용자는 엔비디아 RTX GPU에서 이미지를 더 빠르고 효율적으로 생성하고 편집할 수 있다. 스테이블 디퓨전 3.5 라지의 VRAM 한계를 해결하기 위해 이 모델은 텐서RT를 활용해 FP8로 양자화됐다. 그 결과, VRAM 요구량이 40% 줄어 11GB면 충분해졌다. 즉, 단 한 대의 GPU가 아닌 다섯 대의 지포스 RTX 50 시리즈 GPU가 메모리에서 모델을 동시에 실행할 수 있게 됐다. 또한 스테이블 디퓨전 3.5 라지와 미디엄 모델은 텐서RT를 통해 최적화됐다. 텐서RT는 텐서 코어를 최대한 활용할 수 있도록 설계된 AI 백엔드로, 모델의 가중치와 모델 실행을 위한 명령 체계인 그래프를 RTX GPU에 맞게 최적화한다. FP8 텐서RT는 스테이블 디퓨전 3.5 라지의 성능을 BF16 파이토치 대비 2.3배 향상시키면서 메모리 사용량은 40% 줄여준다. 스테이블 디퓨전 3.5 미디엄의 경우, BF16 텐서RT는 BF16 파이토치 대비 1.7배 더 빠르다. FP8 텐서RT를 적용한 결과, 스테이블 디퓨전 3.5 라지 모델은 BF16 파이토치(PyTorch)에서 실행했을 때보다 성능이 2.3배 향상됐고, 메모리 사용량은 40% 감소했다. 스테이블 디퓨전 3.5 미디엄 모델도 BF16 텐서RT를 통해 BF16 파이토치 대비 1.7배 더 높은 성능을 발휘했다. 최적화된 모델은 현재 스태빌리티 AI의 허깅페이스(Hugging Face) 페이지에서 이용할 수 있다. 또한 엔비디아와 스태빌리티 AI는 스테이블 디퓨전 3.5 모델을 엔비디아 NIM 마이크로서비스 형태로도 출시할 계획이다. 이를 통해 크리에이터와 개발자는 다양한 애플리케이션에서 보다 쉽게 모델을 접근하고 배포할 수 있게 된다. 이 NIM 마이크로서비스는 오는 7월 출시될 예정이다.

작성일 : 2025-06-18

1
2
3
4
5
6