엔비디아, 차세대 GPU 아키텍처 '페르미' 발표
엔비디아는 차세대 쿠다(CUDA) GPU 아키텍처인 '페르미(Fermi)'를 새롭게 발표했다. 새로운 디자인의 페르미 아키텍처는 세계 최초의 연산형(computational) GPU로서, 그래픽과 GPU 컴퓨팅 분야의 성능 향상을 추구하였다. 미국 새너제이(San Jose)에서 열린 GPU 테크놀로지 컨퍼런스(GPU Technology Conference)에서 발표된 페르미는 다양한 애플리케이션에서 성능 가속을 제공한다. 컨퍼런스 기자회견에는 미국 오크리지 국립연구소(ORNL: Oak Ridge National Laboratory)가 참가하여 페르미 아키텍처에 기반한 엔비디아 GPU로 2011년 세계 최대의 수퍼컴퓨터를 구축한다는 계획을 발표하였으며, 블룸버그(Bloomberg), 크레이(Cray), 델(Dell), HP, IBM, 마이크로소프트(Microsoft) 등 기업의 지원도 소개되었다. 엔비디아 지포스(GeForce), 쿼드로(Quadro), 테슬라(Tesla)에서 차세대 GPU 적용이 가능한 페르미는 연산을 위해 다음과 같은 신기술을 포함한다. C++ 언어 지원 : C언어의 확장인 C++을 지원하여 C언어 이외에 C++, 포트란(Fortran), 자바(Java), 파이썬(Python) 등의 다양한 언어 환경에서 병렬 컴퓨팅이 가능하다. 또한, 오픈CL(OpenCL), 다이렉트컴퓨트(DirectCompute)를 지원한다. 에러정정코드(ECC) 지원 : 데이터의 완결성이 보장되어야 하는 과학 계산에 사용될 GPU를 이용한 수퍼컴퓨팅센터와 데이터 센터 구축에 필수적인 에러정정코드(ECC)를 지원한다. 쿠다 코어(CUDA Core) : 최신 실수연산 표준 규약인 IEEE 754-2008을 지원하는 512개의 쿠다 코어(CUDA Core)를 하나의 GPU에 내장하였다. FP64 성능 향상 : 선형대수학(linear algebra), 수치 시뮬레이션(numerical simulation), 양자화학(quantum chemistry)과 같은 고성능 컴퓨팅(HPC) 어플리케이션에 중요한 2배 정밀도 실수연산(double precision arithmetic) 성능에서 엔비디아의 이전 세대 GPU(GT200) 대비 최대 8배의 이론 성능이 향상되었다. 병렬 데이터캐시(NVIDIA Parallel DataCache) : GPU 캐쉬 계층구조(cache hierarchy)로 데이터 주소를 사전에 알 수 없는 피직스 솔버(physics solvers), 레이 트레이싱(ray tracing), 희소 행렬곱셈(sparse matrix multiplication) 등의 알고리즘을 가속시키는 엔비디아 병렬 데이터캐시(NVIDIA Parallel DataCache)를 제공한다. 기가쓰레드(GigaThread) 엔진 : 동일 애플리케이션 컨텍스트(context)에서 서로 다른 커널(예: 피직스(PhysX) 엔진의 유체 및 강체 가속 솔버)이 동시에 GPU에서 이행되도록 하는 엔비디아 기가쓰레드(GigaThread) 엔진 탑재 넥서스 디버거(Nexus Debugger) : 작동중인 GPU 하드웨어의 실시간 디버깅을 가능하게 하고, 마이크로소프트 비주얼 스튜디오(Microsoft Visual Studio)에 통합하여 사용 가능한 이기종 컴퓨팅(heterogeneous computing) 어플리케이션 개발환경인 넥서스(Nexus)를 제공한다. 페르미 관련 이미지, 기술백서, 프리젠테이션, 비디오 등은 http://kr.nvidia.com/fermi에서 확인할 수 있다.
작성일 : 2009-10-05