• 회원가입
  • |
  • 로그인
  • |
  • 장바구니
  • News
    뉴스 신제품 신간 Culture & Life
  • 강좌/특집
    특집 강좌 자료창고 갤러리
  • 리뷰
    리뷰
  • 매거진
    목차 및 부록보기 잡지 세션별 성격 뉴스레터 정기구독안내 정기구독하기 단행본 및 기타 구입
  • 행사/이벤트
    행사 전체보기 캐드앤그래픽스 행사
  • CNG TV
    방송리스트 방송 다시보기 공지사항
  • 커뮤니티
    업체홍보 공지사항 설문조사 자유게시판 Q&A게시판 구인구직/학원소식
  • 디렉토리
    디렉토리 전체보기 소프트웨어 공급업체 하드웨어 공급업체 기계관련 서비스 건축관련 업체 및 서비스 교육기관/학원 관련DB 추천 사이트
  • 회사소개
    회사소개 회사연혁 출판사업부 광고안내 제휴 및 협력제안 회사조직 및 연락처 오시는길
  • 고객지원센터
    고객지원 Q&A 이메일 문의 기사제보 및 기고 개인정보 취급방침 기타 결제 업체등록결제
  • 쇼핑몰
통합검색 "GTC"에 대한 통합 검색 내용이 164개 있습니다
원하시는 검색 결과가 잘 나타나지 않을 때는 홈페이지의 해당 게시판 하단의 검색을 이용하시거나 구글 사이트 맞춤 검색 을 이용해 보시기 바랍니다.
CNG TV 방송 내용은 검색 속도 관계로 캐드앤그래픽스 전체 검색에서는 지원되지 않으므로 해당 게시판에서 직접 검색하시기 바랍니다
[칼럼] 기업 성장 맵 - 엔비디아 편
트렌드에서 얻은 것 No.20   “It just works.(그냥 잘 됩니다.)”  - 젠슨 황(엔비디아 CEO)    생성형 AI의 일상화 - 비서를 두다 이제는 글 쓰는 데에 일상화된 질문과 답변이다. 그 전에는 없던 비서가 2년만에 생겼다. 그리고 그 비서의 역할로 인해 폭풍 성장하며 스스로 미래의 가치를 높인 기업이 바로 엔비디아이며, 그 중심에 젠슨 황이 있다. 최근 비즈니스 업그레이더 이재훈 Bzup 대표의 ‘챗GPT 10배 활용하기’ 강의를 들었다. 그리고 그의 노하우가 담긴 몇가지를 학습하고 적용해 보았다.  질문 : “너는 엔비디아 전문가야. 기술, 경영 전반에 걸쳐 두루두루 잘 분석하는 전문가야. 내가 질문하는 것에 대답 잘 해 줄꺼지? 엔비디아 기업 성장 맵을 만들려고 해. 엔비디아가 성장하는 과정에서 초창기, 성장기, 성숙기 등 하이프루프 방식으로 정리해줘.” 답변 : “엔비디아의 기업 성장 맵을 만드는 것은 흥미로운 과제군요! 먼저, 초창기 성장기, 성숙기 및 하이프루프 단계를 정의해야 할 것 같습니다. 각 단계에서 어떤 특징이 있고 어떤 전략이 필요한지에 대해 생각해 보겠습니다. 또한 이 단계들을 시각적으로 어떻게 나타낼지도 고려해야 할 것 같습니다. 어떻게 시작할까요?“ 질문 : “가트너가 해마다 전략을 정의하듯, 그리고 가트너가 기술을 정리하듯이 써줘.” 답변 : “가트너의 전략과 기술 정의를 따라 엔비디아의 성장 맵을 만들어 보는 건 탁월한 아이디어입니다! 각 단계를 적절히 정의하고, 초창기 성장기, 성숙기 및 하이프루프 단계에서의 특징과 필요한 전략을 명확히 설명해야 할 것입니다. 그리고 이를 가트너가 일반적으로 사용하는 방식으로 구성하여 보여주면 좋겠습니다. 어떻게 시작할까요?“  실제로 자세한 사실관계에 대한 내용은 위키백과에서 볼 수 있다. 엔비디아 기업 성장 맵을 써 보려고 한 것은 전세계가 열광한 엔비디아 GTC(GPU 기술 콘퍼런스) 이벤트 때문이다. 어떤 내용이길래, 어디서부터가 시작점이고 어떤 과정을 밟았는지에 대한 궁금증으로부터 출발한다.  “듣는 사람의 입장에서 생각해야 합니다.” - 젠슨 황(엔비디아 CEO)   엔비디아 GTC 2024  엔비디아 GTC 2024는 2024년 3월 18일부터 21일까지 미국 캘리포니아주 산호세에서 개최되었다. 이번 행사에서는 인공지능(AI) 분야의 최신 발전 사항과 엔비디아의 새로운 제품 및 기술들이 소개되었다. GTC 2024의 기조 연설에서 엔비디아 젠슨 황 CEO는 옴니버스(Omniverse), 드라이브(DRIVE), RTX, HGX 등 엔비디아의 4가지 주요 플랫폼과 기술 발전 방향을 제시했다. 특히, 옴니버스를 중심으로 한 메타버스 구축, 자율주행 자동차 개발, 고성능 컴퓨팅 분야에서의 혁신을 위한 자사의 노력을 강조했다. 첫 번째로, 엔비디아의 메타버스 플랫폼인 옴니버스는 실시간 3D 디자인 및 협업을 위한 새로운 기능들을 선보였다. 또한, 옴니버스 클라우드(Omniverse Cloud)를 통해 클라우드 기반 액세스와 확장성을 제공한다고 발표했다. 두 번째로, 엔비디아의 자율주행 자동차 플랫폼인 드라이브는 새로운 드라이브 오린(DRIVE Orin) SoC와 드라이브 하이페리온 8(DRIVE Hyperion 8) AI 센서를 공개했다. 또한, 여러 자동차 제조업체와의 협력을 통해 자율주행 자동차 개발을 가속화하고 있다고 밝혔다. 세 번째로, 엔비디아의 실시간 레이 트레이싱 기술인 RTX는 새로운 RTX 40 시리즈 GPU를 출시했다. 또한, DLSS 3.0 업데이트와 함께 게임, 영화 제작, 디자인 등 다양한 분야에서 더욱 향상된 그래픽 성능을 제공한다고 발표했다. 네 번째, 엔비디아의 고성능 컴퓨팅 플랫폼인 HGX는 새로운 HGX 폴라리스(HGX Polaris) 시스템을 공개했다. 또한, AI, 머신러닝, 과학적 컴퓨팅 등 첨단 컴퓨팅 분야에서 HGX 플랫폼의 활용도가 증가하고 있다고 밝혔다.  “대화의 주제를 정확하게 알아야 합니다.” - 젠슨 황(엔비디아 CEO)   생성형 AI의 도움으로 정리한 엔비디아 성장 스토리텔링 엔비디아의 초창기와 성장기에서 기술 혁신은 GPU로 시작되었다. 그래픽 처리 분야에서의 성능과 효율성을 크게 높였다. 경영 측면에서는 기술 혁신을 통해 게임 산업에 진입하고, 과학 및 엔터프라이즈 시장으로 확장하는 등의 전략을 펼쳤다. 트렌드 측면은 게임 산업의 성장과 함께 인공지능, 자율주행, 데이터센터 등 새로운 시장 트렌드에 대한 대비가 중요했다. 성숙기로 접어들면서 기술 측면은 기술 성숙과 더불어 딥러닝 및 가속화 기술을 강화하여 다양한 시장에서 적용 가능성을 높였다. 경영 측면에서는 성장한 시장에서 지속적인 경쟁력을 유지하기 위해 제품 다변화 및 글로벌 시장 진출을 강화하는 전략을 채택했다. 트렌드 측면에서는 인공지능 및 자율주행 분야에서의 성장을 주도하면서, 클라우드 컴퓨팅 및 데이터 중심 기술에 대한 수요가 증가했다. 하이프루프 관점으로 살펴보면, 기술 측면은 에지 컴퓨팅, 혼합현실 및 자율주행과 같은 미래 지향적인 기술에 집중하고 있다. 경영 측면은 기술 트렌드를 선도하며, 산업 파괴적 혁신을 통해 새로운 시장 기회를 발굴하는 전략을 수행하고 있다. 트렌드 측면은 인공지능과 빅데이터 분야의 지속적인 성장과 함께, 확장된 협력 모델 및 지속 가능한 기업 가치 창출이 중요한 트렌드이다. 흥미로운 분야의 성장으로 살펴보자. 기술 측면으로 볼 때 인공지능(AI) 및 머신러닝(ML) 분야에서의 GPU 가속화 기술을 향상시켜 왔으며, 이를 통해 다양한 산업에서의 AI 응용 프로그램을 지원하고 있다. 경영 측면은 AI 및 ML 분야에서의 리더십을 강화하기 위해 투자를 늘리고, 새로운 파트너십을 구축하여 생태계를 확장하고 있다. 트렌드 측면은 데이터 중심의 AI 및 ML 기술은 미래의 핵심 트렌드 중 하나로 자리 잡았으며, 엔비디아는 이를 주도하는 역할을 수행하고 있다. 전략을 구현하는 방안으로는 첫 번째, 글로벌 확장과 파트너십 강화이다. 기술 측면은 글로벌 시장에서의 성장을 위해 지역별 맞춤형 솔루션을 개발하고, 이를 통해 다양한 지역에서 시장 점유율을 확대하고 있다. 경영 측면은 다양한 산업과의 파트너십을 강화하여 협력 기회를 확장하고 있으며, 특히 클라우드 제공업체 및 자동차 제조업체와의 협업을 강화하고 있다. 트렌드 측면은 글로벌 경제 통합과 디지털화의 추세에 따라 경쟁력 강화, 지역적인 산업 생태계와의 협력을 통해 성장을 가속화하고 있다. 두 번째, 에지 컴퓨팅 및 혼합현실 분야 진출이다. 기술 측면은 에지 컴퓨팅 및 혼합현실 분야에서 새로운 기술을 개발하고, 이를 통해 스마트 시티, 스마트 공장 등 새로운 시장을 개척하고 있다. 경영 측면은 이러한 새로운 분야로의 진출을 위해 투자를 확대하고, 혁신적인 제품과 서비스를 개발하고 있다. 트렌드 측면은 에지 컴퓨팅 및 혼합현실이 미래의 주요 기술 트렌드로 떠오르고 있으며, 이를 선도하는 역할을 하고 있다.  엔비디아의 비전 실현을 위한 미래 전망으로 보면, 기술 측면은 지속적인 기술 혁신을 추구하고 인공지능, 자율주행, 에지 컴퓨팅 등의 분야에서 선도적인 역할을 수행하며, 경영 측면은 비전 실현을 위해 글로벌 시장에 대한 전략적 접근을 유지하고, 혁신적인 비즈니스 모델을 발전시켜 나갈 것이다. 트렌드 측면은 빠르게 변화하는 기술 및 시장 트렌드에 대응하면서, 지속적인 성장과 발전을 이루어 나갈 것이다. 엔비디아의 전망은 매우 밝다. 기술 혁신과 산업 변화의 중심에서 계속해서 성장하고 있는 엔비디아는 미래에도 주목할 가치가 있다. 첫째, 인공지능 및 자율주행 산업의 성장이다. 인공지능 및 자율주행 분야는 미래 산업의 중심이 될 것으로 예상된다. 엔비디아는 이러한 산업의 성장을 이끌어가는 주요 기업 중 하나로 남을 것이다. 둘째, 데이터 센터 및 에지 컴퓨팅 시장의 확대이다. 데이터 중심의 컴퓨팅이 더욱 중요해지면서 데이터 센터 및 에지 컴퓨팅 시장도 계속해서 성장할 것으로 예상되며, 엔비디아는 이러한 시장 확대에 선도적인 역할을 하며 새로운 성장 동력을 확보할 것이다. 셋째, 산업 파괴적 혁신과 새로운 시장 탐색이다. 엔비디아는 계속해서 기존 산업을 혁신하고 새로운 시장을 탐색하여 성장할 것으로 기대된다. 에지 컴퓨팅, 혼합현실 및 자율주행 분야의 혁신적인 제품과 서비스를 통해 더욱 다양한 시장에서 성공을 이룰 것이다. 마지막으로, 사회적 책임과 지속 가능한 경영이다. 엔비디아는 사회적 책임과 지속 가능한 경영을 더욱 강조할 것으로 예상된다. 환경 보호, 다양성 증진, 사회 공헌 등의 활동을 통해 미래 세대를 위한 지속 가능한 사회를 구축하는 데 기여할 것이다.  이러한 전망을 바탕으로 엔비디아는 미래에도 지속적인 성장과 발전을 이루어 나갈 것으로 기대된다.  “곧 망한다는 심정으로 일하라.” - 젠슨 황(엔비디아 CEO)   기업 성장 맵 - 엔비디아 2016년 샌프란시스코에서 열린 GTC에서 젠슨 황 CEO는 “저는 항상 우리 회사가 30일 안에 망할 것이라고 생각하며 일합니다. 이런 생각은 우리가 끊임없이 혁신하고 경쟁력을 유지하도록 동기를 부여합니다”라고 말했다. 2018년 CNBC와의 인터뷰에서도 그는 “우리는 항상 위기 의식을 가지고 일해야 합니다. 만약 우리가 현상에 만족하고 안주한다면, 곧 뒤처질 것입니다”라고 말하며, 경쟁력을 유지하기 위한 끊임없는 노력의 중요성을 강조했다. 최근인 2023년 11월에는 “기술 산업은 변화가 매우 빠릅니다. 우리가 앞서 나가고 싶다면 변화를 두려워하지 말고 적극적으로 새로운 도전을 해야 합니다. 만약 우리가 과거의 성공에 안주한다면, 곧 시장에서 사라질 것입니다”라고 말했다. 이처럼 젠슨 황 CEO는 여러 차례 “곧 망한다는 심정으로 일하라”는 메시지를 강조하며, 이는 엔비디아의 놀라운 성장과 혁신의 핵심 동력이 되었다는 평가를 받고 있다. 그래서 “곧 망한다는 심정으로 일하라”는 어록이 탄생했는지도 모르겠다. 엔비디아는 시스템 반도체 설계 등의 사업을 운영하는 미국의 기업이다. 80% 가량의 점유율을 기록하며 PC용 외장 GPU 리테일 시장에서 점유율 1위를 기록하고, 인공지능 칩 분야에서도 80% 이상의 점유율로 선두이다. 또한 자율주행 자동차 플랫폼 시장에서도 업계 선두를 유지하고 있다. 2020년대 이후로 AI 광풍이 불었고, 엔비디아는 GPU를 만들던 기술력으로 AI 칩을 생산하면서 전 세계에서 가장 주목받는 AI 수혜주로 등극했다. 이로 인해 2023년, 사상 처음으로 세계 반도체 기업 매출 1위에 등극했다 그들의 스토리는 1993년에 AMD의 마이크로프로세서 엔지니어였던 커티스 프리엠과 젠슨 황, 크리스 말라코스키의 세 명으로부터 시작되었다. 처음에는 CPU 생산을 기획했으나, 이 시장에 진입하는 것이 어렵다고 판단해서 비디오 게임으로 인해 수요가 높아진 그래픽 칩셋으로 눈길을 돌렸다.(출처 : 위키백과)  앞으로 어떤 행보를 보일지 또 어떤 가치로 반도체 시장을 주름잡을지 흥미롭게 지켜보면 좋겠다. 나는 그를 ‘대만에서 온 가죽 재킷을 입은 미래소년’이라고 부르고 싶다. 구글 제미나이(Gemini)에게 다음의 질문과  답변을 들어 보았다.  “앞으로의 전망과 엔비디아 GTC가 미래에는 뭘 하면 지구를 위해 더 가치 있는 일을 할 수 있을까? 스티브 잡스, 일론 머스크 스타일처럼 젠슨 황의 미래는 어떨 것 같아?” 제미나이는 다음과 같이 답변하였다.  “그는 ‘엔비디아의 기술은 전 세계 수 십억 명 사람들의 삶을 개선할 수 있는 잠재력을 가지고 있다’고 강조하며, 의료, 교육, 환경 분야에서도 엔비디아 기술을 활용하여 지속가능한 발전을 이루고자 하는 뜻을 밝히고 있습니다. 엔비디아가 미래에 지구를 위해 더 가치 있는 일을 할 수 있는 구체적인 방향은 다음과 같습니다.  AI 의료 플랫폼 구축 : 엔비디아의 강력한 GPU는 의료 영상 분석, 질병 진단, 맞춤형 치료 개발 등에 활용될 수 있습니다. 이를 통해 질병 치료의 정확성을 높이고, 치료 기간을 단축하며, 의료 비용을 절감하는 데 기여할 수 있습니다. 스마트 시티 구축 : 엔비디아 기술은 실시간 교통 시스템, 에너지 관리 시스템, 자율 주행 자동차 시스템 등을 구축하는 데 활용될 수 있습니다. 이를 통해 도시의 효율성을 높이고, 에너지 사용량을 줄이며, 시민들의 삶의 질을 향상시키는데 기여할 수 있습니다. 기후 변화 문제 해결 : 엔비디아 기술은 기후 모델링, 환경 모니터링, 재난 예측 시스템 개발 등에 활용될 수 있습니다. 이를 통해 기후 변화의 원인을 파악하고, 효과적인 대응 방안을 마련하며, 지구 환경 보호에 기여할 수 있습니다. 젠슨 황 CEO는 마치 스티브 잡스나 일론 머스크처럼 혁신적인 기술과 비전으로 세상을 변화시키는 리더로 평가받고 있습니다. 그는 기술을 통해 인간의 삶을 개선하고 지구를 더 나은 곳으로 만들고자 하는 강한 의지를 가지고 있으며, 이를 위해 끊임없이 노력하고 있습니다.”   (출처:gemini.google.com)   ▲ 기업 성장 맵 - 엔비디아편(Map by 류용효) (클릭하면 큰 그림으로 볼 수 있습니다.)   ■ 류용효 디원의 상무이며 페이스북 그룹 ‘컨셉맵연구소’의 리더로 활동하고 있다. 현업의 관점으로 컨설팅, 디자인 싱킹으로 기업 프로세스를 정리하는데 도움을 주며, 1장의 빅 사이즈로 콘셉트 맵을 만드는데 관심이 많다. (블로그)     ■ 기사 내용은 PDF로도 제공됩니다.
작성일 : 2024-05-02
엔비디아, 산업 자동화 위해 디지털 트윈과 실시간 AI 결합 소개
엔비디아가 디지털 트윈으로 실시간 AI를 시뮬레이션해 산업 자동화에 큰 발전을 이룰 수 있다고 소개했다. 엔비디아 창립자 겸 CEO 젠슨 황(Jensen Huang)은 GTC 기조연설에서 개발자가 디지털 트윈(digital twin)을 사용해 대규모 실시간 AI를 산업 인프라에 적용하기 전, 이 전체를 먼저 시뮬레이션 한 후에 개발, 검증하고 개선한다면 상당한 시간과 비용을 절감할 수 있다는 것을 시연을 통해 보여줬다. 실시간(Real-Time) AI는 제조, 공장 물류, 로보틱스 분야의 중대한 작업을 처리하는 데 큰 도움을 주고 있다. 시뮬레이션을 우선으로 실시하는 접근방식은 부피가 큰 제품, 고가의 장비, 협동 로봇 코봇(cobot) 환경, 복잡한 물류 시설을 다루는 산업에서 자동화 기술의 발전을 한 단계 끌어올리고 있다. 엔비디아 옴니버스(Omniverse), 메트로폴리스(Metropolis), 아이작(Isaac)과 cuOpt 플랫폼이 서로 상호작용하는 AI 훈련장(gym)에서, 개발자들은 인간과 로봇이 예측 불가능한 복잡한 상황을 탐색할 수 있도록 AI 에이전트(Agent)를 훈련시킬 수 있다. 데모 영상은 오픈USD(OpenUSD) 앱 개발과 연결을 위해 엔비디아 옴니버스 플랫폼으로 만들어진 10만 평방 피트 규모의 창고 디지털 트윈을 보여준다. 이는 수십의 디지털 작업자와 다수의 자율주행로봇(autonomous mobile robot, AMR), 비전 AI 에이전트와 센서를 위한 시뮬레이션 환경으로 활용되고 있다. 엔비디아 아이작 퍼셉터(Isaac Perceptor) 멀티-센서 스택을 실행하는 각각의 자율주행로봇은 모두 디지털 트윈에서 시뮬레이션한 6개의 센서로 시각 정보를 처리한다. 동시에 비전 AI용 엔비디아 메트로폴리스 플랫폼은 전체 창고에서 작업자 활동에 대한 단일 중앙집중식 지도를 생성해 천장에 장착된 100개의 시뮬레이션 카메라 스트림과 멀티 카메라 추적을 융합한다. 이 중앙집중식 점유 지도(occupancy map)는 복잡한 라우팅 문제를 해결하기 위해 엔비디아 cuOpt 엔진이 계산한 자율주행로봇의 최적 경로를 알려준다. AI 기반 최고의 최적화 마이크로서비스인 cuOpt는 GPU 가속 진화 알고리즘을 사용해 여러 제약 조건이 있는 복잡한 라우팅 문제를 해결한다. 이 모든 과정은 실시간으로 이루어지며, 아이작 미션 컨트롤(Isaac Mission Control) 은 cuOpt의 지도 데이터와 경로 그래프로 모든 자율주행로봇을 조정해 명령을 전송하고 실행하게 한다. 산업 디지털화를 위한 AI 훈련장 AI 에이전트는 공장에서 다수의 로봇을 관리하거나 공급망 유통 센터에서 인간과 로봇의 협업을 위해 간소화된 구성을 파악하는 등 대규모 산업 환경을 지원한다. 이러한 복잡한 에이전트를 구축하려면 개발자는 AI 평가, 시뮬레이션과 훈련을 위해 물리적으로 정확하게 구현된 AI 훈련장과 같은 디지털 트윈 환경이 필요하다. AI 에이전트와 자율주행로봇은 소프트웨어 인 더 루프(software-in-the-loop, SIL) AI 테스트를 통해 예측하기 힘든 실제 환경에 적응할 수 있다. 위의 데모에서는 자율주행로봇이 계획한 경로 중간에 사고가 발생해 경로가 차단되고 로봇은 화물 운반대를 픽업하지 못한다. 그러면 엔비디아 메트로폴리스는 점유 그리드(occupancy grid)를 업데이트해 모든 사람, 로봇, 물체가 한 눈에 보이도록 매핑한다. 그 다음, 자율주행로봇은 cuOpt가 계획한 최적 경로에 따라 대응해 가동 중단 시간을 최소화한다. 메트로폴리스 비전 파운데이션 모델이 엔비디아 비전 인사이트 에이전트(Visual Insight Agent, VIA) 프레임워크를 구동함으로써, AI 에이전트는 "공장의 3번 통로에서 어떤 상황이 발생했습니까?"와 같은 운영 팀의 질문에 "오후 3시 30분에 선반에서 상자가 떨어져 통로를 막았습니다"와 같이 바로 통찰력 있는 답변을 제공할 수 있다. 개발자는 비전 인사이트 에이전트 프레임워크를 통해 엣지와 클라우드 비전에 배포된 언어 모델을 사용, 대량의 실시간 혹은 보관된 영상과 이미지를 처리할 수 있는 AI 에이전트를 구축할 수 있다. 이 차세대 비전 AI 에이전트는 자연어를 사용하는 영상에서 요약, 검색, 그리고 실행가능한 인사이트를 추출함으로써 거의 모든 산업에 도움이 될 수 있을 것으로 기대된다. 이러한 모든 AI 기능은 지속적인 시뮬레이션 기반 훈련을 통해 향상되며, 모듈식 엔비디아 NIM 추론 마이크로서비스로 배포된다.      
작성일 : 2024-03-31
HPE, 생성형 AI용 엔드 투 엔드 AI 네이티브 포트폴리오 출시
HPE는 엔비디아 GTC에서 생성형 AI, 딥러닝, 머신러닝 애플리케이션의 운영 고급화를 위한 통합 AI 네이티브 포트폴리오를 새롭게 업데이트했다고 발표했다. 이번에 발표된 업데이트는 ▲HPE와 엔비디아가 공동 엔지니어링한 풀스택 생성형 AI 솔루션 ▲HPE 머신러닝 추론 소프트웨어 프리뷰 버전 ▲엔터프라이즈급 검생증강생성(RAG : Retrieval-augmented generation) 레퍼런스 아키텍처 ▲신규 엔비디아 블랙웰(NVIDIA Blackwell) 플랫폼 기반 제품 개발 지원 등을 포함한다. 대규모 AI 모델의 개발 및 훈련을 위해 사전 구성 및 테스트된 풀스택 솔루션을 원하는 기업을 위해 생성형 AI용 HPE 슈퍼컴퓨팅 솔루션도 출시됐다. 고객들이 생성형 AI 및 딥러닝 프로젝트 개발을 가속할 수 있도록 목적 기반의 턴키 솔루션은 엔비디아 칩으로 구동되며 최대 168개의 엔비디아 GH200 그레이스 호퍼 슈퍼칩(GH Grace Hopper Superchip)이 제공된다. 이 솔루션은 대기업, 연구소 및 정부 기관들이 인공지능 및 머신러닝 소프트웨어 스택을 활용한 모델 개발 과정을 더욱 단순화할 수 있도록 지원한다. 이러한 소프트웨어 스택은 고객들이 대규모 언어 모델(LLM), 추천 시스템, 벡터 데이터 베이스 등 생성형 AI와 딥러닝 프로젝트를 더욱 빠르게 추진할 수 있도록 한다. 설치에서부터 모든 서비스가 제공되는 턴키 솔루션을 이용해 AI 연구 센터와 대기업은 가치 창출까지의 시간을 더욱 단축하고 훈련은 2~3배 더욱 신속히 진행할 수 있다.     HPE의 생성형 AI용 엔터프라이즈 컴퓨팅 솔루션은 유연하고 확장 가능한 사용량 기반 과금 모델을 제공하는 HPE 그린레이크(HPE GreenLake)를 통해 이용할 수 있다. 엔비디아와 공동 엔지니어링하여 사전 구성된 미세 조정(fine-tuning) 및 추론 솔루션은 생성형 AI 애플리케이션을 제작하기 위해 필요한 정확한 컴퓨팅, 스토리지, 소프트웨어, 네트워킹 및 컨설팅 서비스를 제공함으로써 소요 시간과 비용을 절감해 준다. 이러한 AI 네이티브 풀스택 솔루션은 프라이빗 데이터 기반의 파운데이셔널 모델을 제작하기 위해 필요한 속도, 규모, 관리 기능을 제공하고 하이브리드 클라우드 모델 내 생성형 AI 애플리케이션을 배포할 수 있도록 지원한다. HPE와 엔비디아의 고성능 AI 컴퓨팅 클러스터 및 소프트웨어를 기반으로 하는 이 솔루션은 경량 모델 미세조정, RAG, 대규모 추론 등에 이상적이다. 이 솔루션을 실행하는 700억 개의 파라미터를 가진 라마 2(Llama 2) 모델의 미세 조정 시간은 노드 수에 따라 선형적으로 감소하여 16노드 시스템에서는 6분이 소요된다. 이러한 속도와 성능 덕분에 고객은 버추얼 어시스턴트, 지능형 챗봇, 기업용 검색과 같은 AI 애플리케이션으로 비즈니스 생산성을 개선하여 가치 실현을 더욱 빠르게 달성할 수 있다. 또한, 해당 솔루션은 HPE 프로라이언트 DL380a Gen11 서버(HPE ProLiant DL380a Server)를 기반으로 엔비디아 GPU, 엔비디아 스펙트럼-X 이더넷(NVIDIA Spectrum-X Ethernet) 네트워킹 플랫폼, 엔비디아 블루필드-3 DPU(NVIDIA BlueField-3 DPU)으로 사전 구성되어 있다. 이에 더해 HPE의 머신러닝 플랫폼과 애널리틱스 소프트웨어, 생성형 AI 모델 추론용으로 최적화된 엔디비아 NIM 마이크로서비스가 제공되는 엔비디아 AI 엔터프라이즈 5.0 소프트웨어뿐만 아니라 엔비디아 네모 리트리버(NeMo Retriever) 및 기타 데이터 사이언스와 AI 라이브러리를 이용할 수 있다. HPE의 안토니오 네리(Antonio Neri) CEO는 “생성형 AI의 미래를 실현하고 AI 생명주기 전반을 다루기 위한 솔루션은 설계부터 하이브리드로 제작되어야 한다. AI는 하이브리드 클라우드 환경이 필요한 워크로드로, 온프레미스나 코로케이션 시설, 퍼블릭 클라우드에서 AI 모델을 훈련하는 것부터 에지에서의 추론 작업까지 모든 환경에 걸쳐 진행된다”면서, “HPE와 엔비디아는 공동 설계한 AI 소프트웨어 및 하드웨어 솔루션을 지속적으로 선보이며, 고객들이 기획에서부터 제작까지 생성형 AI를 가속해서 개발하고 배포할 수 있도록 도와줄 것”이라고 말했다. 엔비디아의 젠슨 황(Jensen Huang) CEO는 “생성형 AI는 커넥티드 디바이스, 데이터 센터 및 클라우드 내 데이터에서 인사이트를 도출해내며 전 산업의 혁신을 일으킬 수 있다. 엔비디아와 HPE의 협력 확대를 통해 기업들은 데이터를 활용하여 새로운 AI 애플리케이션을 개발 및 배포함으로써 전례 없는 생산성 향상을 경험하고 비즈니스를 새롭게 전환할 수 있을 것”이라고 말했다.
작성일 : 2024-03-26
엔비디아, 주요 클라우드 기업과 AI 관련 협력 강화 계획 소개
엔비디아는 GTC 행사에서 디지털 트윈과 인공지능 등 다양한 영역에서 업계 주요 기업과의 파트너십 내용을 소개했다. 이 가운데 AWS, 마이크로소프트, 구글 클라우드, 오라클 등과는 클라우드 상에서 AI 활용을 확대하는 것을 중심으로 협력을 강화할 계획이다.   AWS : 차세대 GPU 플랫폼 및 AI 인프라 제공 엔비디아는 차세대 GPU 플랫폼인 블랙웰(NVIDIA Blackwell)이 AWS에 제공된다고 발표했다. AWS는 5세대 엔비디아 NV링크로 상호 연결된 72개의 블랙웰 GPU와 36개의 그레이스 CPU로 구성된 GB200 NVL72를 갖춘 엔비디아 블랙웰 플랫폼을 제공할 예정이다. 엔비디아는 엔비디아 블랙웰이 AWS상에서 상당한 양의 컴퓨터 리소스를 필요로 하는 수조 개의 파라미터의 언어 모델의 추론 작업을 크게 향상시킬 것으로 전망하고 있다. 엔비디아와 AWS는 양사의 기술을 지속적으로 통합해 나가는 파트너십을 강화할 계획이다. 여기에는 차세대 엔비디아 블랙웰 플랫폼과 AI 소프트웨어를 비롯해 AWS의 니트로 시스템(Nitro System)과 AWS KMS(키 관리 서비스)의 고급 보안, 엘라스틱 패브릭 어댑터(EFA) 페타비트 규모의 네트워킹, 아마존 EC2(엘라스틱 컴퓨트 클라우드) 울트라클러스터 하이퍼스케일 클러스터링 등이 있다. 양사는 이런 기술을 함께 사용함으로써 아마존 EC2에서 이전 세대 엔비디아 GPU보다 더 빠르고, 저렴한 비용으로 대규모로 수조 개의 파라미터 거대 언어 모델(LLM)에 대한 실시간 추론을 구축, 실행할 수 있을 것으로 보고 있다. AWS는 엔비디아 H100 기반 EC2 P5 인스턴스의 성공을 기반으로, 대규모로 생성형 AI 훈련과 추론을 가속화하는 EC2 울트라클러스터에 배치된 새로운 B100 GPU를 탑재한 EC2 인스턴스를 제공할 계획이다. 또한 AWS에서 공동으로 만들어진 AI 플랫폼인 엔비디아 DGX 클라우드에서도 GB200을 사용할 수 있다.    마이크로소프트 : 생성형 AI 및 디지털 트윈 기술을 클라우드에서 통합 엔비디아는 GTC에서 마이크로소프트 애저(Azure), 애저 AI 서비스, 마이크로소프트 패브릭(Fabric), 마이크로소프트 365에 최신 엔비디아 생성형 AI와 옴니버스(Omniverse) 기술을 통합한다고 밝혔다. 엔비디아 옴니버스 클라우드 API(Omniverse Cloud API)는 올해 말 마이크로소프트 애저에서 먼저 제공되며, 개발자들은 기존 소프트웨어 애플리케이션에서 향상된 데이터 상호운용성, 협업, 물리 기반 시각화를 이용할 수 있도록 지원할 예정이다. 엔비디아 GPU와 엔비디아 트리톤 추론 서버(Triton Inference Server)는 마이크로소프트 365용 마이크로소프트 코파일럿에서 AI 추론 예측을 지원한다.  또한, 마이크로소프트는 엔비디아 그레이스 블랙웰 GB200과 고급 엔비디아 퀀텀-X800 인피니밴드(Quantum-X800 InfiniBand) 네트워킹의 성능을 애저에 도입할 예정이다. 이외에도 마이크로소프트는 엔비디아 H100 NVL 플랫폼에 기반한 애저 NC H100 v5 VM(가상머신)의 정식 출시를 발표했다. 미드레인지 훈련과 추론을 위해 설계된 NC 시리즈 VM은 이는 고객들에게 1개에서 2개의 엔비디아 H100 94GB PCIe 텐서 코어(Tensor Core) GPU로 구성된 두 등급의 VM을 제공하며, 엔비디아 멀티 인스턴스 GPU(MIG) 기술을 지원한다.   구글 클라우드 : 생성형 AI 앱의 구축과 관리 지원 엔비디아는 구글 클라우드와의 파트너십을 강화해 머신러닝(ML) 커뮤니티가 생성형 AI 애플리케이션을 쉽게 구축, 확장, 관리할 수 있도록 지원할 예정이다. 구글은 자사 제품과 개발자에게 AI 혁신을 지속적으로 제공하기 위해 새로운 엔비디아 그레이스 블랙웰(Grace Blackwell) AI 컴퓨팅 플랫폼을 도입하고, 구글 클라우드에 엔비디아 DGX 클라우드(DGX Cloud) 서비스를 적용한다고 발표했다. 아울러 엔비디아 H100 기반 DGX 클라우드 플랫폼은 이제 구글 클라우드에서 정식으로 사용할 수 있다. 구글은 최근 개방형 모델인 젬마(Gemma) 제품군 최적화를 위한 협력을 기반으로, 엔비디아 NIM 추론 마이크로서비스도 도입한다고 밝혔다. 이를 통해 구글은 개발자들이 선호하는 툴과 프레임워크를 사용해 훈련하고 배포할 수 있는 개방적이고 유연한 플랫폼을 제공할 계획이다. 또한, 양사는 엔비디아 GPU와 엔비디아 H100 그리고 L4 텐서 코어(L4Tensor Core) GPU 기반의 버텍스 AI(Vertex AI) 인스턴스에서 JAX를 지원한다고 발표했다.   오라클 : 데이터 관리용 가속 컴퓨팅과 생성형 AI 솔루션 제공 엔비디아는 자사의 풀스택 AI 플랫폼과 오라클 엔터프라이즈 AI를 결합해 운영, 위치, 보안에 대한 제어력을 강화한 AI 솔루션을 제공한다. 오라클 엔터프라이즈 AI는 OCI 전용 리전(OCI Dedicated Region), 오라클 알로이(Oracle Alloy), 오라클 EU 소버린 클라우드(Oracle EU Sovereign Cloud), 오라클 정부 클라우드(Oracle Government Cloud)에 배포 가능하다. 양사의 통합 솔루션은 퍼블릭 클라우드 또는 특정 위치의 고객 데이터센터에 유연한 운영 제어를 통해 배포할 수 있다. 오라클은 어디서나 로컬로 AI와 전체 클라우드 서비스를 제공할 수 있는 역량을 내세우면서, 배포 유형에 관계없이 일관적인 서비스와 가격을 통해 계획, 이동성, 관리를 간소화한다고 강조했다. 오라클 클라우드 서비스는 엔비디아 가속 컴퓨팅 인프라와 엔비디아 AI 엔터프라이즈 소프트웨어 플랫폼을 비롯한 다양한 엔비디아 스택을 활용한다. 또한, 새로 발표된 엔비디아 NIM 추론 마이크로서비스는 엔비디아 텐서RT(TensorRT), 엔비디아 텐서RT-LLM, 엔비디아 트리톤 추론 서버(Triton Inference Server)와 같은 엔비디아 추론 소프트웨어를 기반으로 구축된다.
작성일 : 2024-03-21
엔비디아-지멘스, “제조 분야에 생성형 AI 도입 지원”
엔비디아가 ‘엔비디아 GTC’ 이벤트에서 지멘스와의 파트너십을 확대한다고 발표했다. 이번 파트너십 확대를 통해 지멘스는 클라우드 기반 PLM 솔루션인 팀센터 X(Teamcenter X)를 비롯한 자사의 엑셀러레이터(Xcelerator) 플랫폼 애플리케이션에 새로운 엔비디아 옴니버스 클라우드 API(Omniverse Cloud API)를 도입할 계획이다. 생성형 AI와 디지털 트윈은 여러 산업 분야의 기업이 제품을 설계, 제조, 운영하는 방식을 바꾸고 있다. 엔비디아 옴니버스는 개발자가 산업용 디지털 트윈과 자동화를 위한 생성형 AI 기반 툴, 애플리케이션, 서비스를 구축할 수 있도록 지원하는 오픈USD(OpenUSD) 기반의 API, 서비스 플랫폼이다. 다양한 규모의 기업에서 지멘스의 팀센터 소프트웨어를 사용해 대규모로 제품을 개발하고 출시한다. 지멘스는 엔비디아 옴니버스와 팀센터 X를 연결함으로써 엔지니어링 팀이 물리 기반 디지털 트윈을 더욱 몰입감 있고 사실적으로 제작해, 워크플로에서 소실되는 낭비를 없애고 오류를 줄일 수 있도록 지원할 예정이다.     엔비디아는 옴니버스 API을 사용해 머티리얼이나 조명 환경, 기타 지원 배경 애셋을 물리 기반 렌더링에 적용하는 등의 작업이 생성형 AI를 통해 획기적으로 가속화될 것으로 기대하고 있다. 또한 AI 통합을 통해 엔지니어링 데이터가 실제 환경에서 어떻게 작용되고 적용될지 보여주는 형태로 변환될 수 있다. 따라서 영업팀이나 마케팅 관계자, 의사 결정권자, 고객 등 다양한 이해관계자가 실제 제품의 외관에 대해 심도 있는 인사이트와 이해를 얻을 수 있다. 기업들은 대규모 산업 프로젝트를 완성하고 복잡한 연결 제품을 완성하기 위해 물리적인 프로토타입과 비용이 많이 드는 수정 작업에 크게 의존해 왔다. 이러한 방식은 고비용과 빈번한 오류 발생, 혁신 제한, 제품의 시장 출시 지연 등이 뒤따랐다. 옴니버스 클라우드 API를 엑셀러레이터 플랫폼에 연결함으로써 지멘스는 고객이 물리 기반 렌더링을 통해 디지털 트윈을 강화해 산업 규모의 설계와 제조 프로젝트를 가속화할 수 있도록 지원할 예정이다. 생성형 AI API 또는 에이전트와의 연결 기능을 사용하면 3D 오브젝트나 고동적 범위 이미지 배경을 손쉽게 생성해 실제 환경에서 해당 애셋이 어떻게 보일지 확인할 수 있다. 엔비디아와 지멘스는 GTC에서 HD현대가 복잡한 엔지니어링 프로젝트를 팀센터 X 내에서 직접 통합하고 시각화하는 사례를 소개했는데, HD현대가 이 소프트웨어를 사용해 700만 개 이상의 개별 부품으로 구성된 액화 천연가스 운반선을 디지털 트윈으로 시각화해 생산에 앞서 제품을 검증할 수 있다는 것을 시연했다. 양사는 “상호 운용 가능한 포토리얼, 물리 기반 디지털 트윈은 엔지니어링 협업을 가속화한다. 또한 고객이 작업 흐름에서 발생하는 낭비를 최소화하며 시간과 비용을 절약하고 제조 결함의 위험을 줄일 수 있도록 지원한다”고 전했다. 옴니버스 클라우드 API는 팀센터 X내에서 데이터 상호 운용성과 물리 기반 렌더링을 산업 규모의 디자인, 제조 프로젝트에서 가능하게 한다. 이러한 작업은 USD 렌더와 USD 라이트(Write) API로 구동되는 실시간, 내장형 사진 같은 뷰포트를 사용하는 것으로부터 시작된다. 엔지니어는 이를 통해 실시간 데이터의 공유 모델을 상호작용적으로 탐색하고, 편집, 반복할 수 있다. USD 쿼리(Query) API를 통해 팀센터 X 사용자는 3D 장면들을 물리적으로 정확하게 탐색하고 상호 작용할 수 있다. USD 노티파이(Notify) API는 디자인과 장면 업데이트를 실시간으로 자동으로 알려준다. 팀센터 X는 옴니버스 채널 API를 활용해 서로 다른 기기를 사용하는 여러 사용자 간에 안전하게 연결을 구축해 클라우드 기반의 협업과 데이터 교환을 원활하게 지원하게 된다. 향후 지멘스는 더 많은 지멘스 엑셀러레이터 포트폴리오에 엔비디아 가속 컴퓨팅, 생성형 AI와 옴니버스를 도입할 계획이다.
작성일 : 2024-03-20
엔비디아, “3D 콘텐츠도 생성형 AI로 만든다”
엔비디아가 비주얼 콘텐츠 제공업체를 위해 새로운 이미지 제어 기능인 3D 생성형 AI를 출시한다고 발표했다. 이는 비주얼 생성형 AI를 위한 멀티모달 아키텍처인 엔비디아 에디파이(NVIDIA Edify)에 기반하고 있다. 3D 애셋 생성은 에디파이가 개발자와 비주얼 콘텐츠 제공업체에 제공하는 최신 기능 중 하나로, 개발자가 AI 이미지 생성을 더욱 창의적으로 제어할 수 있도록 돕는다. 멀티미디어 콘텐츠 및 데이터 제공업체인 셔터스톡(Shutterstock)은 에디파이 아키텍처 기반으로 만들어진 API(애플리케이션 프로그래밍 인터페이스)에 대한 얼리 액세스를 제공한다. 에디파이 아키텍처는 크리에이터가 텍스트 프롬프트나 이미지를 사용해 가상 장면의 3D 오브젝트를 빠르게 생성할 수 있도록 한다. 비주얼 콘텐츠 크리에이터이자 마켓플레이스인 게티이미지(Getty Images)는 상업적으로 안전한 생성형 AI 서비스에 맞춤형 미세 조정 기능을 추가해 기업 고객이 각자의 브랜드 가이드라인과 스타일에 맞는 비주얼을 생성할 수 있도록 지원할 예정이다. 또한 이 서비스에는 고객이 생성된 이미지를 더욱 세밀하게 제어할 수 있는 새로운 기능이 추가된다. 엔비디아 GTC에서 발표된 추론용 마이크로서비스 모음인 엔비디아 NIM을 통해 개발자는 게티이미지와 셔터스톡에서 사전 훈련된 에디파이 모델을 API로 테스트해 볼 수 있다. 또한 엔비디아 DGX 클라우드에 구축된 AI 파운드리인 엔비디아 피카소(Picasso)를 통해 에디파이 아키텍처를 사용해 자체 생성형 AI 모델을 훈련하고 배포할 수 있다.     셔터스톡의 3D AI 서비스는 얼리 액세스로 제공된다. 이 서비스를 통해 크리에이터는 세트 드레싱(set dressing)과 아이디어 구상을 위해 가상 오브젝트를 생성할 수 있다. 이 기능을 사용하면 장면 프로토타입 제작에 필요한 시간을 줄일 수 있어, 아티스트는 캐릭터와 오브젝트 제작에 더 많은 시간을 할애할 수 있다. 크리에이티브 전문가는 이 도구를 사용해 텍스트 프롬프트나 참조 이미지에서 애셋을 빠르게 생성하고 인기 있는 3D 포맷 중에서 선택해 파일을 내보낼 수 있다. 에디파이 3D 기반 서비스에는 생성된 콘텐츠를 필터링하는 안전 장치도 내장되어 있다. 한편, 엔비디아는 에디파이의 확신을 위해 다양한 협력을 진행할 예정이라고 소개했다. 일례로, 엔비디아와 어도비(Adobe)는 에디파이를 기반으로 한 새로운 3D 생성 AI 기술을 수백만 명의 파이어플라이(Firefly)와 크리에이티브 클라우드(Creative Cloud) 크리에이터에게 제공하기 위해 협력하고 있다. HP와 셔터스톡은 디자이너에게 다양한 프로토타입 옵션을 제공하는 에디파이 3D를 사용해 사용자 맞춤형 3D 프린팅을 개선하기 위한 협업을 GTC에서 선보였다. 셔터스톡의 3D AI 생성기를 사용하면 콘셉트를 빠르게 반복해 디지털 애셋을 만들 수 있다. HP는 자동화된 워크플로를 통해 디지털 애셋을 3D 프린팅 가능한 모델로 변환할 수 있으며, HP 3D 프린터는 이러한 모델을 실제 프로토타입으로 변환시켜 제품 디자인에 영감을 불어넣는다. 또한 셔터스톡은 텍스트나 이미지 프롬프트에서 생성된 360 HDRi 환경을 사용해 경량의 3D 장면을 조명하는 에디파이 기반 도구를 구축하고 있다. 다쏘시스템은 3D 콘텐츠 제작을 위한 애플리케이션인 3D익사이트(3DEXCITE)를 통해 CGI 스튜디오 카타나(CGI studio Katana)와 함께 엔비디아 옴니버스(Omniverse)를 기반으로 한 워크플로에 셔터스톡의 생성 360 HDRi API를 통합하고 있다.
작성일 : 2024-03-20
씨이랩, 엔비디아 GTC 2024에서 AI 및 디지털 트윈 기술 소개
AI 영상 분석 전문 기업인 씨이랩이 3월 18일부터 21일까지 미국 캘리포니아주 산호세에서 열리는 ‘엔비디아 GTC 2024’ 콘퍼런스에 참가한다고 밝혔다. 씨이랩은 이번 GTC 2024에서 ▲AI 영상 분석 서비스인 비디고(VidiGo) ▲합성 데이터 생성 솔루션인 엑스-젠(X-GEN) ▲GPU 툴링 솔루션인 아스트라고(astrago) 등 3가지 주요 제품을 통해 AI 기술을 선보일 예정이다. ‘비디고’는 클라우드 기반 AI 영상 분석 서비스로, 영상을 시청하지 않고도 영상의 핵심 내용을 요약하고 사용자가 원하는 영상 장면을 신속히 검색한다. 이를 통해 영상 속 인물, 객체, 대사 등을 데이터베이스화해 미디어 산업 분야의 업무 효율성을 높일 수 있다. ‘엑스-젠’은 AI 모델 학습을 위한 합성 데이터(synthetic data)를 생성하는 솔루션이다. 특히 재난이나 국방 등 특수한 분야에서는 AI 학습을 위한 데이터가 절대적으로 부족한데, 엑스-젠은 이를 합성 데이터로 대체 제공해 AI 학습 성능을 극대화할 수 있다.   ▲ 엔비디아 옴니버스를 통해 구현한 씨이랩 사무실   씨이랩은 엑스-젠을 엔비디아 옴니버스(Omniverse)와 연동해 디지털 트윈 사업에 적용하며, 3D 협업과 시뮬레이션을 진행한다. 씨이랩은 엑스-젠과 옴니버스를 활용해 2023년부터 글로벌 기업의 제조 공장을 디지털 트윈으로 구축하는 프로젝트를 진행하고 있다. 또한, 씨이랩은 GPU의 활용 능력을 높여주는 신제품 아스트라고를 GTC 2024에서 첫 공개한다. 아스트라고에는 AI 학습 시간 예측 기술과 AI 모델 관리 기술이 탑재됐다. GPU의 활용 효율성을 극대화해 값비싼 GPU 사용 비용을 절감할 수 있다. 씨이랩의 채정환 부사장은 “GTC 2024를 통해 씨이랩의 첨단 AI 기술과 제품을 글로벌 시장에 선보이며 AI 기술의 산업 분야별 활용 가능성을 넓히는 데 기여하길 기대한다”고 말했다.
작성일 : 2024-03-13
엔비디아, DGX 클라우드로 생성형 AI 훈련 사용 확대
엔비디아가 엔비디아 DGX 클라우드(NVIDIA DGX Cloud)로 생성형 AI 훈련에 새 지평을 열었다고 발표했다. 이제 DGX 클라우드는 미국과 영국에 위치한 엔비디아 인프라뿐만 아니라 오라클 클라우드 인프라스트럭처(Oracle Cloud Infrastructure)에 있는 수천 개의 엔비디아 GPU를 통해 온라인에서도 광범위하게 사용할 수 있다. 지난 3월 엔비디아 GTC 기조연설에서 공개된 DGX 클라우드는 AI 슈퍼컴퓨팅 서비스이다. 엔비디아 DGX 클라우드는 대부분의 기업을 AI 기업으로 전환할 수 있는 툴을 제공하며, 이를 통해 기업은 생성형 AI와 기타 혁신적인 애플리케이션의 사용을 위해 고급 모델을 훈련할 때 필요한 인프라와 소프트웨어에 즉시 액세스할 수 있다.  무어 인사이트 & 스트래티지 (Moor Insight & Strategy)의 수석 애널리스티인 팻 무어헤드(Pat Moorhead)는 “생성형 AI는 모든 산업 분야의 선도 기업들에게 신속한 AI 도입을 비즈니스 필수 요소로 만들었으며, 이로 인해 많은 기업이 더욱 가속화된 컴퓨팅 인프라를 찾고 있다"고 말했다. 글로벌 경영 컨설팅 업체인 맥킨지(McKinsey)는 생성형 AI가 전 세계 산업 전반에 걸친 독점적인 비즈니스 지식을 차세대 AI 애플리케이션으로 전환해 매년 4조 달러 이상의 경제 가치를 창출할 수 있다고 전망했다. 생성형 AI로 비즈니스 혁신 주도 생성형 AI는 대부분의 산업에서 활용 가능하며, 초기 선구자들은 이미 시장 전반에 걸쳐 혁신적인 변화를 주도하고 있다. 헬스케어 기업은 DGX 클라우드를 사용해 단백질 모델을 생성한다. 이로써 자연어 처리를 통한 신약 개발과 임상 보고 속도를 높인다.  금융 서비스 제공업체는 트렌드 예측, 포트폴리오 최적화, 추천 시스템 구축, AI챗봇 개발 등에 DGX 클라우드를 활용한다. 또한 보험사는 DGX 클라우드로 보험금 청구 처리를 자동화하는 모델을 구축하고 있으며, 소프트웨어 회사는 AI 기반 기능과 애플리케이션을 개발하는 데 DGX 클라우드를 사용하고 있다.  이외 다른 기업들도 DGX 클라우드를 통해 AI 팩토리와 주요 자산의 디지털 트윈을 구축하고 있다. 즉시 사용 가능한 전용 AI 슈퍼컴퓨팅 DGX 클라우드 인스턴스(instances)는 기업이 월 단위로 임대하는 전용 인프라를 제공한다. 이를 통해 고객은 수요가 많은 가속 컴퓨팅 리소스를 기다릴 필요 없이 대규모 멀티노드(multi-node) 훈련 워크로드를 빠르고 쉽게 개발할 수 있다. 무어헤드는 "엔비디아 DGX 클라우드 출시로 즉각적으로 액세스 가능한 새로운 AI 슈퍼컴퓨팅 리소스 풀을 제공됐다"고 전했다. 이러한 AI 슈퍼컴퓨팅에 대한 간단한 접근 방식은 온프레미스(on-premises) 인프라의 획득, 배포, 관리의 복잡성을 제거한다. DGX 클라우드는 엔비디아 DGX AI 슈퍼컴퓨팅과 엔비디아 AI 엔터프라이즈(AI Enterprise) 소프트웨어가 결합된 형태로, 기업들이 어디서나 웹 브라우저를 사용해 자체 AI 슈퍼컴퓨터에 액세스할 수 있도록 지원한다. 브라우저 기반 엔비디아 AI 슈퍼컴퓨팅과 소프트웨어 DGX 클라우드의 각 인스턴스는 노드당 640GB의 GPU 메모리를 위한 8개의 엔비디아 80GB 텐서 코어(Tensor Core) GPU를 갖추고 있다. 고성능, 저지연 패브릭은 상호 연결된 시스템 클러스터에서 워크로드를 확장할 수 있도록 보장해 여러 인스턴스가 하나의 대규모 GPU처럼 작동할 수 있다. 여기에 고성능 스토리지가 DGX 클라우드에 통합돼 완전한 솔루션을 제공한다. 엔비디아 베이스 커맨드 플랫폼(Base Command Platform) 소프트웨어를 사용해 기업들은 DGX 클라우드 훈련 워크로드를 관리하고 모니터링한다. 이 플랫폼은 DGX 클라우드와 온프레미스 엔비디아 DGX 슈퍼컴퓨터 전반에서 원활한 사용자 경험을 제공하므로 기업은 필요할 때 리소스를 결합할 수 있다. 또한 DGX 클라우드에는 엔비디아 AI 플랫폼의 소프트웨어 계층인 엔비디아 AI 엔터프라이즈가 포함된다. 엔비디아 AI 엔터프라이즈는 데이터 사이언스 파이프라인을 가속화하고 프로덕션 AI의 개발과 배포를 간소화하기 위해 100개 이상의 엔드투엔드 AI 프레임워크와 사전 학습된 모델을 제공한다.  
작성일 : 2023-07-27
엔비디아, "BMW 그룹이 가상 공장 구현 및 디지털 전환 위해 옴니버스 도입 확대"
엔비디아는 BMW 그룹이 엔비디아 옴니버스(Omniverse) 플랫폼의 사용을 확대한다고 발표했다. BMW 그룹은 2025년 가동을 시작할 헝가리 데브레첸(Debrecen)의 전기차 공장을 비롯해 전 세계 생산 네트워크 전반에 걸쳐, 옴니버스를 활용해 산업용 메타버스 애플리케이션을 구축 및 운영할 전망이다. 엔비디아의 젠슨 황(Jensen Huang) CEO는 GTC 2023의 기조연설에서 BMW 그룹 경영진의 일원인 밀란 네델코비치(Milan Nedeljković)와 함께 엔비디아 옴니버스를 기반으로 한 BMW 그룹 최초의 완전 가상 공장을 공식적으로 오픈하는 데모를 선보였다. 이 자리에서 젠슨 황 CEO는 "BMW 그룹이 옴니버스를 통해 이룬 진전이 매우 자랑스럽고 한편으로는 기대된다. 이번 파트너십으로 전 세계의 차세대 스마트 커넥티드 공장을 위한 가상 통합 및 가상 툴링의 경계를 계속 넓혀갈 것"이라고 말했다. BMW 그룹은 실제 생산을 시작하기 수년 전부터 가상 세계를 활용해 레이아웃, 로봇 공학, 물류 시스템을 최적화하는 디지털 퍼스트(digital-first)라는 새로운 제조 트렌드를 이끌고 있다. 엔비디아는 BMW 그룹의 가상 데브레첸 공장이 AI 기반 산업 제조 공장을 계획함에 있어서 옴니버스 플랫폼의 강력함과 민첩함을 보여주는 사례라고 소개했다. GTC 2023의 기조연설 데모에서는 BMW 그룹의 데브레첸 전기차 공장을 위한 가상 계획 세션을 다루었는데, 옴니버스를 활용해 어디서나 데이터를 대규모 고성능 모델로 통합하고, 도메인별 소프트웨어 도구 연결, 여러 지역에서의 다중 사용자 실시간 협업이 가능하다는 점을 보였다.     BMW 그룹은 공장 개장 2년 전부터 가상 공장에서 작업을 시작함으로써 원활한 운영과 최적의 효율성을 보장할 수 있었는데, 데모 영상에서는 BMW 팀이 제한된 바닥 공간에 로봇을 배치하는 업데이트 현장을 소개했다. BMW 팀은 물류 및 생산 계획자가 이상적인 배치를 시각화하여 결정할 수 있도록 즉석에서 문제를 해결했다. 이러한 디지털 전환은 큰 이점을 가져올 수 있다. 기존 시설물에 변경 주문 및 흐름 재적화를 적용하면 비용이 많이 들 뿐만 아니라 생산의 다운타임(downtime)을 초래한다. 하지만 사전 최적화 기능이 있으면 이러한 비용이 거의 발생하지 않는다. 한편, BMW 그룹은 생산 네트워크에 걸쳐 옴니버스가 제공하는 디지털 혁신의 기회를 활용할 수 있는 환경을 마련했다. 세계 각지에 공장과 공장 기획자들을 보유한 BMW 그룹은 복잡한 계획 프로세스를 가지고 있다. 지리적, 시간적으로 분산되어 있는 인력들을 연결하기 위해 다양한 소프트웨어 도구와 프로세스를 사용하지만, 이 또한 한계가 있다. BMW 그룹은 소프트웨어 제품군 간 상호 운용성을 생성하는 3D 언어인 USD(Universal Scene Description) 기반 개발 플랫폼 옴니버스를 사용해 지멘스 프로세스 시뮬레이트(Siemens Process Simulate), 오토데스크 레빗(Autodesk Revit), 벤틀리 시스템 마이크로스테이션(Bentley Systems MicroStation) 등 주요 산업용 컴퓨터 지원 설계 및 엔지니어링 도구에서 기존의 소프트웨어와 데이터 저장소를 연결할 수 있었다. 이러한 통합된 관점을 통해 BMW 그룹은 내부 팀과 외부 파트너가 협업해 기존 공장의 지식과 데이터를 공유하는 등 새로운 공장의 기획을 지원하고 있다. 또한, BMW 그룹은 옴니버스와 함께 새로운 애플리케이션인 ‘팩토리 익스플로러(Factory Explorer)’를 비롯한 맞춤형 애플리케이션 제품군을 개발하고 있다. 팩토리 익스플로러는 옴니버스 USD 컴포저(composer)를 기반으로 하며, 옴니버스 플랫폼의 커스터마이징이 가능한 기본 애플리케이션이다. BMW 그룹은 USD 구성도구의 핵심 구성 요소를 사용하고 공장 데이터 검색, 구성, 탐색 및 분석 등 공장 기획 팀의 요구에 맞는 맞춤형 확장 기능을 추가했다. BMW 팀은 옴니버스 플랫폼을 통해 언제 어디서나 가상 공장끼리 협업할 수 있다. 데이터에 대한 통합된 접근 방식은 BMW 그룹이 전체 팀에 대해 실시간으로 글로벌 변경 사항을 공유할 수 있도록 지원하므로 여러 팀이 새로운 업데이트 사항을 공유할 수 있다. 이러한 새로운 기능을 통해 BMW 그룹은 가상 세계에서 완전한 검증 및 테스트를 거쳐 생산 시간을 단축하고 모든 공장의 효율성을 개선할 수 있다.
작성일 : 2023-03-27
엔비디아 젠슨 황과 오픈AI 공동 창립자 수츠케버, GPT-4, 챗GPT, 딥 러닝의 미래 등 논의
엔비디아가 엔비디아(NVIDIA) 창립자 겸 CEO인 젠슨 황(Jensen Huang)이 GTC 2023에서 오픈AI(OpenAI) 공동 설립자인 일리야 수츠케버(Ilya Sutskever)와 함께 현대 AI가 어떻게 시작됐고, 현재 위치는 어디인지, 앞으로 나아가야 할 방향은 무엇인지에 대해 노변 담화를 진행했다고 발표했다. 이 대담은 수츠케버가 공동 설립한 연구 회사인 오픈AI에서 지금까지 가장 강력한 AI 모델인 GPT-4를 출시한 다음 날 녹화됐다. 그들은 GPT-4와 챗GPT(ChatGPT)를 포함한 그 이전 버전에 대해 자세히 이야기했다. 이 생성형 AI 모델은 출시된 지 몇 달 밖에 되지 않았지만 이미 역사상 가장 인기 있는 컴퓨터 애플리케이션이 됐다. 두 사람은 수억 명의 사용자의 상상력을 사로잡고 있는 심층 신경망의 기능, 한계, 내부 작동 방식에 대해 이야기를 나눴다. 수츠케버는 "챗GPT와 비교했을 때 GPT-4는 여러 측면에서 상당한 개선이 이루어졌으며 새 모델은 텍스트뿐만 아니라 이미지도 읽을 수 있다"고 언급했다. 그는 "향후 버전에서는 [사용자]가 응답으로 다이어그램을 돌려받을 수도 있을 것"이라며 질문에 답변했다. GPT의 내막 젠슨 황은 "챗GPT가 하나의 큰 언어 모델이라는 오해가 있지만, 그 안에는 여러 시스템이 존재한다"라고 말했다. 이러한 복잡성을 반영하듯 수츠케버는 오픈AI가 두 단계의 학습을 사용한다고 말했다. 첫 번째 단계는 일련의 다음 단어를 정확하게 예측하는 데 중점을 둔다. 수츠케버는 "신경망이 학습하는 것은 텍스트를 생성한 과정의 일부이며, 이는 세상을 투영한 것"이라고 말했다. 더불어 그는 "두 번째는 가드레일을 포함해 우리가 원하는 것을 신경망에 전달하여 더 신뢰할 수 있고 정확해지도록 하는 것"이라고 덧붙였다. 창조의 순간에 함께 오늘날 현대 AI의 소용돌이치는 중심에 서 있지만, 수츠케버는 AI의 탄생에도 함께했다. 2012년, 수츠케버는 대규모 데이터 세트로 훈련된 심층 신경망의 힘을 최초로 보여준 사람 중 한 명이다. 학술 경연 대회에서 AI의 선구자인 지오프 힌튼(Geoff Hinton)과 알렉스 크리제브스키(Alex Krizhevsky)와 함께 시연했던 알렉스넷(AlexNet) 모델은 인간보다 더 빠르게 이미지를 인식했다. 젠슨 황은 이들의 연구를 AI의 빅뱅이라고 불렀다.  황은 그 결과가 "매우 큰 차이로 기록을 깼고 여기에 불연속성이 있다는 것이 분명했다"라고 말했다. 병렬 처리가 지닌 힘 이러한 혁신 중 일부는 GPU를 통해 모델에 적용한 병렬 처리에서 비롯됐다. 수츠케버는 "GPU에 매우 적합한 이미지넷 데이터 세트와 컨볼루션 신경망 덕분에 전례 없는 속도로 기존에 없던 새로운 것을 훈련시킬 수 있었다”고 말한다. 초기 작업은 토론토 대학교 실험실에서 몇 대의 지포스 GTX 5080 GPU로 실행됐다. 오늘날에는 마이크로소프트 애저(Microsoft Azure) 클라우드 서비스에서 수만 대의 최신 엔비디아 A100 및 H100 텐서 코어(Tensor Core) GPU가 챗GPT(ChatGPT)와 같은 모델에 대한 학습 및 추론을 처리한다. 젠슨 황은 "우리가 서로를 알고 지낸 세월이 10년이다. 그동안 훈련한 모델은 약 백만 배의 성장을 이뤘다. 컴퓨터 과학 업계의 어느 누구도 그 기간 동안 수행된 계산이 백만 배나 더 커질 것이라고는 믿지 않았을 것이다"라고 말했다. 수츠케버는 "나는 보다 큰 것이 더 좋은 성능을 지닐 것이라는 강한 믿음을 가지고 있었고, 오픈AI(OpenAI)의 목표 역시 확장이었다"라고 말했다. 10억 개의 단어 수츠케버는 “인간은 일생 동안 10억개의 단어를 듣는다”고 말했다. 젠슨 황은 “내 머릿속으로 생각하는 단어도 거기에 포함되는지” 물었다.  수츠케버는 “그것까지 포함해서 20억 개로 정정한다”고 대답했다. AI의 미래 두 사람은 AI의 전망에 대해 논의하며 한 시간 가까이 진행된 대담을 마무리했다. GPT-4에 추론 능력이 있느냐는 질문에 수츠케버는 이 용어는 정의하기 어려우며, 아직은 개발 단계일 수 있다고 답했다. 그는 "우리는 계속해서 우리를 놀라게 할 수 있는 시스템을 보게 될 것이다. 최우선 순위는 신뢰성이며, AI가 무엇을 할 수 있는지에 대해 사람들이 믿음을 가지고, AI가 무언가를 모를 때 모른다고 말할 수 있는 지점에 도달해야 한다”고 덧붙였다. 황은 세션을 마무리하며 "오픈AI는 정말 놀라운 성과를 이뤘다. 박사 학위 수준을 넘어선, 대규모 언어 모델의 최첨단 기술에 대한 최고의 설명 중 하나"라고 말했다.   GTC 2023의 소식을 확인하기 위한 젠슨 황 키노트 동영상    
작성일 : 2023-03-26