엔비디아, 에이전틱 AI 개발 위한 ‘네모트론 3’ 오픈 모델 제품군 공개
엔비디아가 오픈 모델, 데이터, 라이브러리로 구성된 엔비디아 네모트론 3(NVIDIA Nemotron 3) 제품군을 발표했다. 산업 전반에서 투명하고 효율적이며 목적에 맞게 특화된 에이전틱 AI 개발을 지원하기 위한 네모트론 3 모델은 하이브리드 잠재 전문가 혼합 방식(mixture-of-experts : MoE) 아키텍처를 도입했다. 엔비디아는 “개발자가 대규모 환경에서 신뢰할 수 있는 멀티 에이전트 시스템을 구축하고 배포할 수 있도록 돕는다”고 소개했다.
기업들이 단일 모델 기반 챗봇에서 협업형 멀티 에이전트 AI 시스템으로 전환함에 따라, 개발자들은 통신 과부하, 맥락 이탈, 높은 추론 비용 등 점점 더 많은 과제에 직면하고 있다. 또한 복잡한 워크플로를 자동화할 모델을 신뢰하기 위해 투명성에 대한 요구도 커지고 있다. 네모트론 3는 이러한 과제를 해결하며, 고객이 전문화된 에이전틱 AI를 구축하는 데 필요한 성능과 개방성을 제공한다.
네모트론 3 MoE 모델 제품군은 세 가지 규모로 구성된다. ▲네모트론 3 나노(Nano)는 300억 개의 파라미터를 갖춘 소형 모델로, 한 번에 최대 30억 개의 파라미터를 활성화해 목적에 맞는 고효율 작업을 수행한다. ▲네모트론 3 슈퍼(Super)는 약 1000억 개의 파라미터와 토큰당 최대 100억 개의 활성 파라미터를 갖춘 고정확도 추론 모델로, 멀티 에이전트 애플리케이션에 적합하다. ▲네모트론 3 울트라(Ultra)는 약 5000억 개의 파라미터와 토큰당 최대 500억 개의 활성 파라미터를 갖춘 대규모 추론 엔진으로, 복잡한 AI 애플리케이션을 지원한다.
현재 제공 중인 네모트론 3 나노는 컴퓨팅 비용 효율이 가장 뛰어난 모델로, 낮은 추론 비용으로 소프트웨어 디버깅, 콘텐츠 요약, AI 어시스턴트 워크플로, 정보 검색과 같은 작업에 최적화돼 있다. 이 모델은 고유한 하이브리드 MoE 아키텍처를 활용해 효율성과 확장성 측면에서 향상된 성능을 제공한다. 네모트론 3 나노는 네모트론 2 나노 대비 최대 4배 높은 토큰 처리량을 달성하며, 추론 토큰 생성량을 최대 60%까지 줄여 추론 비용을 절감한다. 또한 100만 토큰 컨텍스트 윈도우를 지원해 더 많은 정보를 기억할 수 있으며, 장시간에 걸친 다단계 작업에서도 정보 간 연결성을 높여 정확도를 향상시킨다.
네모트론 3 슈퍼는 낮은 지연 시간으로 다수의 협업 에이전트가 복잡한 작업을 수행해야 하는 애플리케이션에 강점을 보인다. 네모트론 3 울트라는 심층 연구와 전략적 계획 수립이 요구되는 AI 워크플로를 위한 고급 추론 엔진 역할을 수행한다. 네모트론 3 슈퍼와 울트라는 엔비디아 블랙웰(Blackwell) 아키텍처 기반의 초고효율 4비트 NVFP4 훈련 포맷을 사용해 메모리 요구 사항을 줄이고 훈련 속도를 가속화한다. 이러한 효율성 덕분에 기존 인프라에서도 높은 정밀도 포맷 대비 정확도를 유지한 채 더 대규모 모델 훈련이 가능하다.
네모트론 3 모델 제품군을 통해 개발자는 특정 워크로드에 적합한 규모의 오픈 모델을 선택할 수 있다. 또한, 수십 개에서 수백 개의 에이전트로 확장하는 동시에 복잡한 워크플로에서 더 빠르고 정확한 장기 추론 성능의 이점을 누릴 수 있다.
네모트론 3 나노는 현재 허깅 페이스에서 제공되며, 베이스텐(Baseten), 딥인프라(DeepInfra), 파이어웍스(Fireworks), 프렌들리에이아이(FriendliAI), 오픈라우터(OpenRouter), 투게더 AI(Together AI) 등 추론 서비스 제공업체를 통해서도 이용할 수 있다. 네모트론 3 나노는 엔비디아 가속 인프라 전반에서 안전하고 확장 가능한 배포를 위해 엔비디아 NIM 마이크로서비스 형태로도 제공된다. 퍼블릭 클라우드 고객의 경우, 네모트론 3 나노는 아마존웹서비스(AWS)에서 아마존 베드록(Amazon Bedrock, 서버리스 방식)을 통해 제공될 예정이며, 구글 클라우드, 코어위브, 크루소, 마이크로소프트 파운드리, 네비우스, 엔스케일, 요타에서도 곧 지원될 예정이다. 네모트론 3 슈퍼와 네모트론 3 울트라는 2026년 상반기에 제공될 예정이다.
또한, 엔비디아는 전문화된 AI 에이전트를 구축하기 위한 훈련 데이터세트와 최첨단 강화학습 라이브러리 컬렉션을 공개했다. 총 3조 개의 토큰으로 구성된 새로운 네모트론 사전 훈련, 사후 훈련, 강화학습 데이터세트는 고도화된 추론과 코딩, 다단계 워크플로 사례를 풍부하게 제공해 높은 역량을 갖춘 도메인 특화 에이전트 구축을 지원한다.
개발 속도를 높이기 위해 엔비디아는 네모트론 모델의 훈련 환경과 사후 훈련 기반을 제공하는 오픈소스 라이브러리인 네모 짐(NeMo Gym)과 네모 RL을 함께 공개했다. 또한 모델의 안전성과 성능을 검증할 수 있도록 네모 이밸류에이터(Evaluator)도 선보였다. 모든 도구와 데이터세트는 현재 깃허브(GitHub)와 허깅 페이스(Hugging Face)를 통해 제공되고 있다.
네모트론 3는 LM 스튜디오(LM Studio), 라마.cpp(lLAMa.cpp), SGLang, vLLM을 통해 지원된다. 이와 함께 프라임 인텔렉트(Prime Intellect)와 언슬로스(Unsloth)는 네모 짐의 즉시 사용 가능한 훈련 환경을 자사 워크플로에 직접 통합하고 있으며, 이를 통해 강력한 강화학습 훈련 환경에 보다 빠르고 손쉽게 접근할 수 있다.
엔비디아 네모트론은 엔비디아의 소버린 AI 전략을 지원한다. 유럽부터 대한민국에 이르는 다양한 조직들이 자체 데이터, 규제, 가치에 부합하는 AI 시스템을 구축할 수 있도록 개방적이고 투명하며 효율적인 모델 채택을 가능하게 한다.
네모트론 3의 초기 도입 기업으로는 액센츄어, 케이던스, 크라우드스트라이크, 커서, 딜로이트, EY, 오라클 클라우드 인프라스트럭처(OCI), 팔란티어, 퍼플렉시티, 서비스나우, 지멘스, 시놉시스, 줌 등이 있다. 이들은 제조, 사이버보안, 소프트웨어 개발, 미디어, 커뮤니케이션 등 다양한 산업 전반의 AI 워크플로를 구현하기 위해 네모트론 제품군의 모델을 통합하고 있다.
엔비디아의 젠슨 황(Jensen Huang) 창립자 겸 CEO는 “오픈 혁신은 AI 발전의 토대이다. 네모트론을 통해 우리는 첨단 AI를 개방형 플랫폼으로 전환해, 개발자들이 대규모 환경에서 에이전틱 시스템을 구축하는 데 필요한 투명성과 효율을 제공하고 있다”고 말했다.
서비스나우의 빌 맥더멋(Bill McDermott) 회장 겸 CEO는 “엔비디아와 서비스나우는 수년간 AI의 미래를 함께 만들어왔으며, 최고의 순간은 아직 오지 않았다. 오늘 우리는 모든 산업의 리더들이 에이전틱 AI 전략을 빠르게 추진할 수 있도록 지원하는 데 있어 중요한 진전을 이루고 있다. 서비스나우의 지능형 워크플로 자동화와 엔비디아 네모트론 3의 결합은 탁월한 효율, 속도, 정확성을 바탕으로 계속해서 업계 표준을 제시할 것”이라고 말했다.
작성일 : 2025-12-17