• 회원가입
  • |
  • 로그인
  • |
  • 장바구니
  • News
    뉴스 신제품 신간 Culture & Life
  • 강좌/특집
    특집 강좌 자료창고 갤러리
  • 리뷰
    리뷰
  • 매거진
    목차 및 부록보기 잡지 세션별 성격 뉴스레터 정기구독안내 정기구독하기 단행본 및 기타 구입
  • 행사/이벤트
    행사 전체보기 캐드앤그래픽스 행사
  • CNG TV
    방송리스트 방송 다시보기 공지사항
  • 커뮤니티
    업체홍보 공지사항 설문조사 자유게시판 Q&A게시판 구인구직/학원소식
  • 디렉토리
    디렉토리 전체보기 소프트웨어 공급업체 하드웨어 공급업체 기계관련 서비스 건축관련 업체 및 서비스 교육기관/학원 관련DB 추천 사이트
  • 회사소개
    회사소개 회사연혁 출판사업부 광고안내 제휴 및 협력제안 회사조직 및 연락처 오시는길
  • 고객지원센터
    고객지원 Q&A 이메일 문의 기사제보 및 기고 개인정보 취급방침 기타 결제 업체등록결제
  • 쇼핑몰
엔비디아, 클라우드부터 엣지까지 대화형 AI 구축 돕는 추론 소프트웨어 ‘텐서RT 8’ 출시
2021-07-21 471 26

 

엔비디아가 텐서RT(TensorRT) 8을 출시했다. 텐서RT 8은 엔비디아의 8세대 AI 소프트웨어로, 언어 쿼리에 대한 추론 시간을 절반으로 줄여 개발자들이 고성능의 검색 엔진, 광고 추천 플랫폼, 챗봇을 개발하도록 돕고, 이를 클라우드부터 엣지에서 제공하도록 지원한다.

텐서RT 8의 최적화 기능은 언어 애플리케이션을 위한 빠른 속도를 제공하여, 많이 사용되는 트랜스포머 기반 모델 중 하나인 BERT-라지(BERT-Large) 모델의 추론을 1.2밀리세컨드(ms) 만에 완료한다. 과거에는 기업들이 모델 크기를 줄이게 되면 결과의 정확성이 크게 떨어졌다. 텐서RT 8을 통해 이제 기업들은 모델 크기는 두 배 또는 세 배로 늘리면서 정확도를 개선할 수 있게 됐다.

트랜스포머 최적화 외에도 텐서RT 8은 두 가지의 주요 기능을 통해 AI 추론의 혁신을 추구한다. 희소성(sparsity)은 효율성을 높이는 엔비디아 암페어(Ampere) 아키텍처 GPU의 새로운 성능 기술로, 개발자가 컴퓨팅 작업을 줄여 신경망을 가속화할 수 있도록 지원한다. 또한, 양자화 인식(quantization aware) 훈련 기능을 통해 개발자는 훈련된 모델을 사용하여 정확도를 유지하면서 INT8 정밀도로 추론을 실행할 수 있는데, 이는 텐서 코어 상의 효율적인 추론을 위해 컴퓨팅 및 스토리지 오버헤드를 줄여준다.

 

 

엔비디아의 그레그 에스테스(Greg Estes) 개발자 프로그램 담당 부사장은 “AI 모델은 기하급수적으로 점점 더 복잡해지고 있으며, AI를 사용하는 실시간 애플리케이션에 대한 수요는 전 세계적으로 급증하고 있다. 따라서, 기업들은 최첨단 추론 솔루션을 반드시 구축해야 한다”면서, “최신 버전의 텐서RT는 기업들이 이전에는 불가능했던 수준의 품질과 응답성을 갖춘 대화형 AI 애플리케이션을 제공하도록 돕는 새로운 기능을 지원한다”고 설명했다.

엔비디아에 따르면, 지난 5년 간 헬스케어, 자동차, 금융, 소매를 포함한 다양한 분야의 2만 7500여 개 기업에서 35만 이상의 개발자가 텐서RT를 250만 번 가까이 다운로드했다. 텐서RT 애플리케이션은 하이퍼스케일 데이터센터, 임베디드 혹은 오토모티브 제품 플랫폼에서 활용할 수 있다.

정수진 sjeong@cadgraphics.co.kr


출처 : 캐드앤그래픽스 2021년 8월호

  • kakao

댓글 0

로그인 후 댓글을 달수있습니다
등록된 코멘트가 없습니다.