• 회원가입
  • |
  • 로그인
  • |
  • 장바구니
  • News
    뉴스 신제품 신간 Culture & Life
  • 강좌/특집
    특집 강좌 자료창고 갤러리
  • 리뷰
    리뷰
  • 매거진
    목차 및 부록보기 잡지 세션별 성격 뉴스레터 정기구독안내 정기구독하기 단행본 및 기타 구입
  • 행사/이벤트
    행사 전체보기 캐드앤그래픽스 행사
  • CNG TV
    방송리스트 방송 다시보기 공지사항
  • 커뮤니티
    업체홍보 공지사항 설문조사 자유게시판 Q&A게시판 구인구직/학원소식
  • 디렉토리
    디렉토리 전체보기 소프트웨어 공급업체 하드웨어 공급업체 기계관련 서비스 건축관련 업체 및 서비스 교육기관/학원 관련DB 추천 사이트
  • 회사소개
    회사소개 회사연혁 출판사업부 광고안내 제휴 및 협력제안 회사조직 및 연락처 오시는길
  • 고객지원센터
    고객지원 Q&A 이메일 문의 기사제보 및 기고 개인정보 취급방침 기타 결제 업체등록결제
  • 쇼핑몰
통합검색 "네오버스"에 대한 통합 검색 내용이 8개 있습니다
원하시는 검색 결과가 잘 나타나지 않을 때는 홈페이지의 해당 게시판 하단의 검색을 이용하시거나 구글 사이트 맞춤 검색 을 이용해 보시기 바랍니다.
CNG TV 방송 내용은 검색 속도 관계로 캐드앤그래픽스 전체 검색에서는 지원되지 않으므로 해당 게시판에서 직접 검색하시기 바랍니다
지멘스 벨로체 CS, Arm ‘네오버스 컴퓨팅 서브 시스템’ 검증 위해 채택
지멘스 디지털 인더스트리 소프트웨어, 지멘스 EDA 사업부는 Arm이 칩 설계 맞춤형 인프라 개발을 위한 에코시스템인 네오버스 컴퓨팅 서브 시스템(Neoverse Compute Subsystems : CSS)의 설계 플로의 일환으로, 자사의 반도체 설계 검증 설루션인 벨로체 스트라토 CS(Veloce Strato CS) 및 벨로체 프로FPGA CS(Veloce proFPGA CS)를 도입했다고 발표했다. 지멘스의 벨로체 CS 시스템은 현대 데이터센터의 요구사항에 부합하는 모듈형 블레이드 기반 구성으로 제공되며, 간편한 설치, 낮은 전력 소비, 높은 냉각 성능 그리고 컴팩트한 공간 효율성을 특징으로 한다. 벨로체 프로FPGA CS는 사용자의 유연성을 위해 데스크톱 실험실 버전으로도 제공된다.     벨로체 스트라토 CS는 높은 에뮬레이션 성능을 제공하면서 빠른 전체 가시성 디버그(fast full visibility debug)를 유지하며, 4000만 게이트(MG)에서 400억 게이트(BG)까지 확장 가능하다. 벨로체 프로FPGA PCIe 복합 장치(PCD) 기술은 Arm CSS 내에서 고객의 IP를 검증하기 위해 설계된 에뮬레이션 설루션 제품군이다. PCD 기술은 Arm Compliance Suite(ACS), PCIe 및 NVMe를 단일 통합 시스템 시각화 및 디버그 환경에 통합하며, 이는 벨로체 프로토콜 분석기(Veloce Protocol Analyzer)를 통해 제공된다. 벨로체 프로FPGA CS는 빠른 속도와 포괄적인 소프트웨어 프로토타이핑 설루션을 제공하며, 1개의 FPGA(VP 1902)에서 수백 개의 FPGA로 확장 가능하다. 지멘스 EDA는 “높은 성능과 함께 유연하고 모듈식 설계는 고객이 펌웨어, 운영 체제, 애플리케이션 개발 및 시스템 통합 작업을 크게 가속화하는 데 도움을 준다”고 설명했다. Arm의 카리마 드리디(Karima Dridi) PE총괄은 “시장 출시에 소요되는 시간은 우리의 파트너 생태계에 있어 점점 더 중요해지고 있으며, 이는 오늘날 컴퓨팅 시대에서 경쟁력을 유지하는 데 결정적인 요소”라면서, “네오버스 CSS의 핵심 구성 요소는 사전 검증(pre-validation) 및 검토(verification)이며, 이는 지멘스 벨로체 CS 시스템과 같은 혁신적인 신기술 도구의 채택을 통해 가능해졌다. 이로 인해 파트너들은 자체 실리콘 설루션을 보다 신속하게 시장에 출시할 수 있다”고 말했다. 지멘스의 장 마리 브루네(Jean Marie Brunet) 하드웨어 지원 검증 부문 부사장은 “Arm과의 협력을 벨로체 CS 시스템으로 확장하게 되어 매우 기쁘다. 벨로체 스트라토 CS는 벨로체 PCIe Composite Device와 함께 에뮬레이션 성능 향상을 제공하며, 고유하고 입증된 확장성을 갖추고 있다. 또한, AMD VP1902 어댑티브 SoC 기반의 벨로체 프로FPGA CS는 빠르고 확장 가능한 프로토타이핑 설루션을 제공한다”고 전했다. 또한 “벨로체 프로FPGA CS 시스템을 통해 우리는 하드웨어, 소프트웨어, 시스템 엔지니어가 직면한 다양한 과제를 해결하고 있다. Arm과의 오랜 관계는 시장 요구가 변화함에 따라 그들의 필요와 비즈니스 역학을 이해하는 데 있어 강력한 기반이 된다”라고 말했다.
작성일 : 2025-08-05
Arm, “네오버스 기반의 AWS 그래비톤4 프로세서로 클라우드 혁신 가속화 지원”
Arm은 AWS의 그래비톤4(Graviton4) 프로세서를 통해 개발자와 기업이 클라우드 워크로드의 잠재력을 발휘할 수 있도록 지원하면서, 특수 실리콘 및 컴퓨팅을 제공하고 보다 효율적이고 지속 가능하며 강력한 클라우드를 위한 기반을 마련하고자 AWS와 협력을 진행 중이라고 소개했다. 클라우드 컴퓨팅 환경은 AI의 폭발적인 성장에 힘입어 극적인 변화를 겪고 있다. AI 애플리케이션이 더욱 정교하고 복잡해짐에 따라 강력하며 효율적이고, 비용 효율적인 컴퓨팅 설루션에 대한 필요성이 그 어느 때보다 커지고 있다. 클라우드에 워크로드를 배포하는 고객들은 이러한 최신 워크로드의 요구사항을 충족하기 위해 어떤 인프라가 필요한지 재고하고 있다. 고객들의 요구사항은 성능 향상과 비용 절감부터, 규제 또는 지속 가능성 목표를 위한 에너지 효율성의 새로운 벤치마크 달성까지 다양하다. Arm의 네오버스 V2(Neoverse V2)에 기반한 AWS 그래비톤4 프로세서는 이전 세대인 그래비톤3 프로세서보다 최대 30% 향상된 컴퓨팅 성능, 50% 더 많은 코어, 75% 더 많은 메모리 대역폭을 제공한다. 이러한 장점 덕분에 현재 에코시스템과 고객들이 AWS 프로세서를 많이 채택하고 있다는 것이 Arm의 설명이다. Arm 네오버스 V2 플랫폼에는 고성능 부동 소수점 및 벡터 명령어 지원과 같은 Armv9 아키텍처의 새로운 기능이 포함되어 있으며, SVE/SVE2, Bfloat16 및 Int8 MatMul과 같은 기능은 AI/ML 및 HPC 워크로드에 강력한 성능을 제공한다. AI 워크로드 채택을 더욱 촉진하기 위해 Arm은 2024년 초 선도적인 AI 프레임워크 및 소프트웨어 에코시스템과 협력하여 전체 ML 스택이 Arm에서 즉시 사용 가능한 추론 성능 최적화의 이점을 누릴 수 있도록 Arm Kleidi를 출시했고, 이를 통해 개발자가 별도의 Arm 관련 전문 지식 없이도 워크로드를 구축할 수 있도록 했다. Arm은 파이토치(PyTorch)에서 이러한 최적화를 통해 초당 토큰 수(tokens/sec)와 첫 토큰 생성 시간(time-to-first-token) 지표를 개선하여, AWS 그래비톤4에서 라마(Llama) 3 70B 및 Llama 3.1 8B와 같은 LLM(대규모 언어 모델)을 실행할 수 있는 방법을 선보였다. HPC 워크로드의 경우, 그래비톤4는 코어당 16% 더 많은 메인 메모리 대역폭과 vCPU당 두 배의 L2 캐시를 제공하는 등 그래비톤3E에 비해 성능이 크게 향상되었다. 이는 주로 메모리 대역폭에 제한이 있는 HPC 애플리케이션의 성능에 매우 중요하다. EDA 워크로드의 경우, Arm의 엔지니어링 팀이 프로덕션 실행을 통해 측정한 결과, 그래비톤4는 RTL 시뮬레이션 워크로드에서 그래비톤3보다 최대 37% 더 높은 성능을 제공하는 것으로 나타났다. 한편, Arm은 지난 몇 년 동안 소프트웨어 에코시스템 전반에서 최종 고객이 AWS 그래비톤 프로세서에 다양한 클라우드 워크로드를 배포하면서 도입이 지속적으로 증가했다고 전했다. “고객들은 비용을 절감하고, 더 향상된 성능을 경험하며, 탄소 및 지속 가능성 발자국을 개선하고 있다”는 것이 Arm의 설명이다.
작성일 : 2024-12-23
엔비디아, 차세대 ‘GH200 그레이스 호퍼 슈퍼칩’ 공개
엔비디아가 가속 컴퓨팅과 생성형 AI를 위한 차세대 엔비디아 GH200 그레이스 호퍼 플랫폼(NVIDIA GH200 Grace Hopper platform)을 발표했다. 이 플랫폼은 세계 최초로 HBM3e 프로세서가 탑재된 새로운 그레이스 호퍼 슈퍼칩을 기반으로 한다. GH200 그레이스 호퍼 플랫폼은 대규모 언어 모델, 추천 시스템, 벡터 데이터베이스를 비롯해 전 세계적으로 가장 복합한 생성형 AI 워크로드를 처리할 수 있도록 개발됐으며, 다양한 구성으로 제공될 예정이다. 현 세대 제품보다 최대 3.5배 많은 메모리 용량과 3배 높은 대역폭을 제공하는 듀얼 구성은 144개의 Arm 네오버스 코어, 8페타플롭의 AI 성능, 282GB의 최신 HBM3e 메모리 기술을 갖춘 단일 서버로 구성된다. 엔비디아 창립자 겸 CEO인 젠슨 황(Jensen Huang)은 “급증하는 생성형 AI의 수요를 충족하기 위해 데이터센터에는 전문적인 요구 사항을 갖춘 가속화된 컴퓨팅 플랫폼이 필요하다. 새로운 GH200 그레이스 호퍼 슈퍼칩 플랫폼은 탁월한 메모리 기술과 대역폭을 통해 처리량을 개선하고, 성능의 저하 없이 GPU를 연결해 성능을 통합한다. 여기에 전체 데이터센터에 쉽게 배포할 수 있는 서버 설계를 통해 이를 실현할 수 있다"고 말했다. 새로운 플랫폼에 사용된 그레이스 호퍼 슈퍼칩은 엔비디아 NV링크(NVLink™)로 추가 슈퍼칩과 연결할 수 있으며, 이들이 함께 작동해 생성형 AI에 사용되는 거대한 모델을 배포할 수 있다. 이 일관된 고속 기술은 GPU가 CPU 메모리에 완전히 액세스할 수 있도록 지원해 듀얼 구성 시 총 1.2TB의 빠른 메모리를 제공한다. HBM3e 메모리는 기존 HBM3보다 데이터 전송 속도가 50% 빠르며, 초당 총 10TB의 대역폭을 제공한다. 이를 통해 새로운 플랫폼에서 이전 버전보다 3.5배 용량이 큰 모델을 실행할 수 있으며, 3배 빠른 메모리 대역폭으로 성능을 개선할 수 있다.
작성일 : 2023-08-10
Arm, 컴퓨팅 인프라를 재정의하는 차세대 네오버스 플랫폼 발표
Arm은 확장 가능한 효율성과 기술 리더십에 기반을 둔 'Arm 네오버스(Arm Neoverse)' 로드맵에 대한 새로운 업데이트를 소개하고, 파트너사가 빠른 속도로 혁신을 이어나갈 수 있도록 지원할 것이라고 밝혔다. Arm은 하이퍼스케일 및 HPC 고객의 요구사항에 대응하고 더 많은 전력과 공간을 필요로 하지 않으면서 클라우드 워크로드 성능을 더욱 강화하기 위해, 최신 V시리즈 코어와 널리 배포된 Arm CMN-700 메시 인터커넥트(mesh interconnect)를 특징으로 하는 Arm 네오버스 V2 플랫폼(디미터)을 공개했다. 네오버스 V2는 클라우드 및 HPC 워크로드에 대해 업계 최고 수준의 정수(integer) 성능을 제공하며, 몇 가지 Armv9 아키텍처의 보안 향상 기능들을 선보인다. 오늘날 다수의 파트너사는 네오버스 V2 기반 설계를 진행 중이며, 그 중 하나인 엔비디아는 그레이스(Grace) 데이터 센터 CPU의 컴퓨팅 기반으로 네오버스 V2를 활용하고 있다. 그레이스는 네오버스 V2의 전력 효율성과 LPDDR5X 메모리의 전력 효율성을 결합하여, 기존 아키텍처로 구동되는 서버에 비해 와트당 2배의 성능을 제공한다. 또한, 효율적인 성능 및 처리량에 대한 Arm의 지속적인 투자의 일환으로 차세대 N-시리즈 제품이 개발 중이며, 이는 2023년에 파트너사에게 제공될 예정이다. Arm은 "이 차세대 N-시리즈 CPU가 시장을 선도하는 N2의 효율성을 넘어 성능 및 효율성 측면 모두에서 세대를 뛰어넘는 향상된 기능을 제공할 것"이라고 밝혔다.     Arm의 네오버스 E-시리즈 CPU는 데이터 플레인(data plane) 처리, 5G RAN, 엣지 네트워킹 및 가속기 전반에 걸쳐 다용도로 활용이 가능하다. Arm은 이러한 다양성을 지원하기 위해 Arm Cortex-A510 CPU와 확장 가능한 네오버스 CMN-700 및 N2 시스템 백플레인(backplane)을 결합한 네오버스 E2 플랫폼을 제공하고 있다. 이를 통해 확장 가능한 범위의 코어 수, 시스템레디(SystemReady) 호환성, PCIe, CXL, IO 및 인터페이스 등과 같은 제한된 애플리케이션에서 클라우드 기술을 사용할 수 있다. 네오버스 플랫폼은 가속화된 인프라 솔루션의 전체 스펙트럼을 처리하기 위한 목적으로 특별히 제작되었다. 이와 같은 전문적인 처리는 워크로드 전력 소비를 줄이고 현대 워크로드의 증가하는 컴퓨팅 요구 사항을 충족하기 위한 해결책이다. 하지만 이는 코어 단독으로는 처리가 불가능하다. Arm은 Arm 기반 인스턴스(instance)를 제공하는 모든 주요 클라우드 제공업체와 함께 클라우드 파트너사와 협력하여 클라우드 네이티브 소프트웨어 인프라, 프레임워크 및 워크로드를 최적화하고 있다. 여기에는 쿠버네티스(Kubernetes), 이스티오(Istio) 및 Arm 아키텍처용 네이티브 빌드를 제공하기 위한 여러 CI/CD 툴과 같이 널리 채택된 프로젝트에 대한 지원이 포함된다. 또한, 텐서플로우(TensorFlow)와 같은 머신 러닝 프레임워크와 오픈 소스 데이터베이스, 빅데이터 및 분석, 미디어 처리와 같은 클라우드 소프트웨어 워크로드에 대한 개선도 포함된다. 이러한 작업은 Arm에서 구동되는 소프트웨어 풀 스택 솔루션을 최적화하는 데 있어 Arm이 오랜 기간 리더십을 제공해온 오픈 소스 커뮤니티에 기여하는 개발자와 협력하여 진행됨으로써, 모든 최종 사용자가 Arm에서 차세대 애플리케이션을 구축할 수 있도록 한다. 또한, Arm은 자사 소프트웨어 에코시스템의 강점으로 네오버스 플랫폼의 역량 및 AMBA CHI, UCIe 및 CXL과 같은 선도적인 고성능 패브릭이 결합되어 있다는 점을 꼽았다. 이로 인해 Arm은 파트너사가 클라우드 투 엣지(cloud-to-edge) 전반에 걸친 맞춤형 솔루션을 개발할 수 있도록 한다. 네오버스 기반 플랫폼은 업계 최고의 확장 가능한 효율성을 제공하고 자유도를 가진 Arm 에코시스템이 모든 인프라 영역에서 혁신을 이룰 수 있도록 지원함으로써 클라우드 컴퓨팅에서 가능한 것을 재정의하고 있다. 그 결과, 네오버스는 2018년 출시 이후 빠르게 도입되고 있으며, 오늘날 모든 주요 퍼블릭 클라우드가 네오버스를 기반으로 하는 인스턴스를 제공하고 있다. 5G RAN 및 무선 인프라에서 Arm은 감소된 전력, 더 큰 처리량으로 최고의 성능을 제공하여 중요한 총소유비용(TCO)의 이점을 제공하고 있다. 이를 통해 Arm의 파트너사는 소형 셀, 매크로 셀에서 프라이빗 네트워크에 이르는 애플리케이션 및 사용 사례에 맞게 제품을 커스터마이징 할 수 있다. Arm 5G 솔루션 랩(Arm 5G Solutions Lab)을 통해 Arm은 디쉬 와이어리스(Dish Wireless), 구글 클라우드(Google Cloud), 마벨(Marvell), NXP 및 보다폰(Vodafone)과 같은 5G 에코시스템의 리더들과 협력하여 Arm에서 엔드 투 엔드 5G 네트워크를 가속화하고 있다.  나아가, Arm은 암페어 알트라(Ampere Altra) 기반 HPE 프로라이언트(HPE Proliant) 11 세대 플랫폼의 출시는 물론 VM웨어(VMware)의 프로젝트 몬터레이(Project Monterey), OpenShift on Arm을 지원하는 레드햇(RedHat) 및 Arm 기반 AWS 그래비톤(AWS Graviton)으로 클라우드 인프라를 이동하는 SAP HANA 와 같은 이니셔티브와 함께 보다 전통적인 엔터프라이즈의 영역으로 이동하고 있다. Arm 인프라 사업부의 크리스 버기(Chris Bergey) 수석 부사장 겸 총괄 매니저는 "업계는 Arm 네오버스를 통해 전 세계 컴퓨팅 인프라를 재정의하고 혁신할 수 있도록 성능, 전력 효율성, 특수 처리 및 워크로드 가속화에 점점 더 많은 관심을 기울이고 있다”고 전했다. 또한, “Arm이 세계 최대의 컴퓨팅 풋프린트와 전체 컴퓨팅 스펙트럼에 대한 독보적인 이해도를 갖게 되면서, 인프라 기술의 다음 시대는 Arm의 성능 및 효율성 DNA에 의존하고 있다. 금일 네오버스 로드맵에 추가된 업데이트를 통해 Arm은 이를 제공할 준비가 되어 있으며 인프라의 미래는 Arm에 달려있다고 믿는다”고 말했다.
작성일 : 2022-09-15
Arm, 전자 설계 자동화를 AWS 클라우드로 구현
아마존웹서비스(AWS)는 Arm이 자사의 전자설계 자동화(EDA) 워크로드의 대부분을 포함한 클라우드 사용에 AWS를 활용할 것이라고 발표했다.  Arm은 Arm 네오버스(Neoverse) 코어를 사용한 그래비톤 2(Graviton 2) 기반 인스턴스를 활용해 EDA 워크로드를 AWS로 마이그레이션하고 있으며, 반도체 설계 검증의 연산 집약적인 작업에 온프레미스 데이터센터 대신 클라우드를 사용하게 되었다. 검증을 보다 효율적으로 수행하기 위해 Arm은 클라우드를 사용하여 실제 컴퓨팅 시나리오의 시뮬레이션을 실행하며, AWS의 사실상 무제한인 스토리지와 고성능 컴퓨팅 인프라를 활용해 동시 실행할 수 있는 시뮬레이션 수를 확장한다. AWS 클라우드로 마이그레이션을 시작한 이후 Arm은 AWS 클라우드에서 EDA 워크플로의 성능 시간을 6배 향상했다. 또한, AWS 클라우드에서 텔레미터링(원격 소스로부터 데이터 수집 및 통합)과 분석을 실행함으로써, Arm은 전사적으로 워크플로 효율성을 높이고 비용과 자원을 최적화하는데 도움이 되는 보다 강력한 엔지니어링, 비즈니스 및 운영 통찰력을 창출하고 있다. Arm은 AWS로 마이그레이션을 완료함에 따라 궁극적으로 글로벌 데이터 센터 풋프린트를 최소 45% 줄이고 온프레미스 컴퓨팅을 80% 줄일 계획이다. 고도로 특수화된 반도체 소자는 각 칩마다 최소 공간에서 최대 성능을 발휘하도록 고안된 한 자릿수 나노미터 수준(사람의 머리카락 너비보다 10만 배 더 작음)으로 설계된 수십억 개의 트랜지스터가 포함될 수 있다. EDA는 이러한 극한 엔지니어링을 가능하게 하는 핵심 기술 중 하나이다. EDA 워크플로는 복잡하며 프론트엔드 설계, 시뮬레이션 및 검증뿐 아니라 타이밍 및 전력 분석, 설계 규칙 검사, 칩 생산 준비를 위한 기타 애플리케이션을 포함하는 더 큰 규모의 백엔드 워크로드를 포함한다.  고도로 반복적인 워크플로로 인해, 보통 시스템 온 칩(SoC)과 같은 새로운 장치를 만드는 데에는 수개월 또는 심지어 수년이 걸리며 엄청난 컴퓨팅 파워를 수반한다. 이러한 워크로드를 온프레미스로 실행하는 반도체 기업은 여러 프로젝트를 동시에 진행하기 위해 끊임없이 비용, 일정 및 데이터 센터 리소스를 조정해야 한다. 결과적으로 이들 기업은 컴퓨팅 파워 부족으로 진행 속도를 늦추게 되거나, 유휴 컴퓨팅 용량 유지 비용을 부담하게 된다. Arm은 EDA 워크로드를 AWS로 마이그레이션함으로써 전통적 방식으로 관리되는 EDA 워크플로의 제약을 극복하고 대규모 확장 가능한 컴퓨팅 파워를 통해 탄력성을 확보하여, 동시 시뮬레이션 실행, 텔레미터링 및 분석 단순화, 반도체 설계에 필요한 반복 시간 단축, 납기 일정에 영향을 미치지 않고 테스트 주기 추가 등이 가능해졌다.  Arm은 아마존 엘라스틱 컴퓨트 클라우드(Amazon EC2)를 활용하여 다양한 종류의 특수 Amazon EC2 인스턴스 유형에서 EDA 워크플로를 최적화함으로써 비용과 일정을 간소화한다. 예를 들어 AWS 그래비톤2 기반 인스턴스로 고성능과 확장성을 확보함으로써, 수십만 대의 온프레미스 서버를 실행하는 것보다 비용 효율적인 운영이 가능하다. Arm은 머신러닝을 활용해 특정 워크로드에 최적의 Amazon EC2 인스턴스 유형을 추천하는 서비스인 AWS 컴퓨트 옵티마이저(AWS Compute Optimizer)를 통해 워크플로 간소화를 돕는다. 비용 이점 외에도 Arm은 AWS 그래비톤2 인스턴스의 고성능을 활용하여 엔지니어링 워크로드의 처리량을 증가시킴으로써, 이전 세대인 x86 프로세서 기반 M5 인스턴스 대비 달러당 처리량을 40% 이상 지속 향상시켰다. 또한 Arm은 AWS 파트너인 데이터브릭스(Databricks)의 서비스를 이용하여 클라우드에서 머신러닝 애플리케이션을 개발하고 실행한다. Amazon EC2에서 실행되는 데이터브릭스 플랫폼을 통해 Arm은 엔지니어링 워크플로의 모든 단계에서 데이터를 처리하여, 회사의 하드웨어 및 소프트웨어 그룹을 위한 실행 가능한 통찰력을 얻고 측정 가능한 엔지니어링 효율성 향상을 달성할 수 있다. Arm의 르네 하스(Rene Haas) IPG 대표는 "AWS와의 협력을 통해 우리는 엔지니어들이 귀중한 시간을 혁신에 집중할 수 있도록 효율성을 향상시키고 처리량을 최대화하는 데 초점을 맞추고 있다. 이제 Arm 네오버스 기반 프로세서가 장착된 AWS 그래비톤2 인스턴스를 사용해 Amazon EC2에서 실행할 수 있게 되어 엔지니어링 워크플로를 최적화하고 비용을 절감하며 프로젝트 일정을 단축하여, 그 어느 때보다 빠르고 비용 효율적으로 고객에게 강력한 결과를 제공하고 있다"고 말했다. AWS의 피터 드산티스(Peter DeSantis) 글로벌 인프라 및 고객 지원 부문 수석부사장은 "AWS는 차세대 EDA 워크로드에 필요한, 진정으로 탄력적인 고성능 컴퓨팅, 월등한 네트워크 성능 및 확장 가능한 스토리지를 제공하며, 이번 Arm과의 협력으로 고성능 Arm 기반 그래비톤2 프로세서를 실행하는 까다로운 EDA 워크로드를 지원할 수 있게 되어 매우 기쁘다. 그래비톤2 프로세서는 기존 세대인 x86 기반 인스턴스보다 최대 40% 높은 가격 대비 성능 우위를 제공할 수 있다"고 말했다.
작성일 : 2020-12-14
Arm, ETRI와 슈퍼컴퓨터 개발 협력 및 생태계 확장 계획 소개
Arm이 ETRI(한국전자통신연구원)가 설계하는 최초의 슈퍼컴퓨터인 K-AB21(K-Artificial Brain 21)에 네오버스 V1을 포함한 Arm의 기술을 지원할 예정이라고 발표했다.  특히, ETRI는 곧 출시될 Arm의 네오버스 V1을 자사 최초 슈퍼컴퓨터인 K-AB21 시스템에 도입할 계획이라고 밝혔다. 네오버스 V1은 Arm의 SVE(Scalable Vector Extensions)를 지원하는데, 이를 통해 ETRI은 AB21에서 CPU당 16테라플롭스, 랙당 1600테라플롭스를 달성하고 목표 대비 전력소모를 60% 감소를 실현할 계획이다. 한편 Arm은 ‘슈퍼컴퓨팅 컨퍼런스(ISC High Performance, 이하 ISC)’의 TOP500 경연대회에서 2회 연속 세계 1위에 오른 슈퍼컴퓨터 후가쿠(Fugaku)의 기술 기반을 제공한 바 있으며, 이외에도 다양한 기업에 Arm 기반 솔루션을 제공하면서 HPC 에코시스템을 지속적으로 확장하고 있다. 암페어 컴퓨팅(Ampere Computing), 샌디아(Sandia) 국립 연구소, 브리스톨 대학, AWS는 이달 초 열린 AHUG(Arm High-Performance Computing User Group) 회의에서 각 사의 Arm 기반 HPC에 대한 자세한 계획을 공유했다. 11월 초에 진행된 SC20 행사에서는 유럽 프로세서 이니셔티브(European Processor Initiative)가 설립한 기업인 SiPearl도 자사의 엑사스케일 컴퓨팅 프로젝트의 일환인 레아(Rhea) 프로세서에 네오버스 V1을 도입할 예정이라고 강조했다. 또한, 엔비디아도 연구자들이 엔비디아의 A100 GPU와 Arm 네오버스 기반 암페어 알트라(Altra) CPU를 이용한 Arm의 HPC에서 26배에 달하는 성능 향상을 구현했다고 발표했다. 리켄(RIKEN)과 후지쯔(Fujitsu)가 공동 개발한 Arm 기술 기반의 슈퍼컴퓨터인 후가쿠(Fugaku)는 두 번 연속으로 슈퍼컴퓨터 Top500 리스트에 1위를 차지했다. Arm은 "이러한 성과는 Arm의 기술만이 제공할 수 있는 HPC의 높은 성능에 대한 수요가 급격하게 증가하고 있다는 것을 증명한다. Arm은 전력 효율과 성능, 확장성의 완벽한 조합을 통한 독보적인 HPC 관련 기술을 제공한다"고 전했다. 후가쿠가 코로나19 연구에 미친 긍정적인 영향력은 Arm의 성과 중 하나다. 후가쿠는 첫 가동 몇 개월만에 5개의 다른 코로나19 연구 프로젝트에 활용되었는데, 그중 하나는 공기 중에서 바이러스가 어떻게 순환하는지를 조사하는 연구이며, 또 하나는 2000가지가 넘는 기존 약물들의 효능을 분석하는 연구이다. Arm은 궁극적으로 HPC에서 지속적으로 발생하는 과제 해결, 즉 합리적인 전력 및 예산 범위를 유지하면서 새로운 수준의 성능으로 확장 가능한 시스템을 구축하는 것을 목표로 한다. Arm 프로세서 아키텍처의 핵심 중 하나는 싱글 스레드(single-threaded) 멀티코어 프로세서가 상대적인 전력 증가 없이 성능을 향상시키는 방식으로서 슈퍼컴퓨터 CPU의 새로운 표준으로 자리잡는다는 것으로, 이러한 공동의 비전은 확장 중인 HPC 에코시스템 전반에 걸쳐 점점 더 널리 도입되고 있다. 하드웨어의 발전은 HPC에서 Arm에 대한 옵션을 확장하기 위한 소프트웨어 커뮤니티에서의 활동 급증과 병행된다. 엔비디아와 함께 Arm 기반 프로세서에 쿠다(CUDA)를 지원하고, HPC소프트웨어 패키지의 표준을 세우기 위한 오픈소스의 노력에 기여하는 등 다양한 방법들을 통해, Arm은 유연하고 확장 가능하며 효율적인 컴퓨팅의 이점을 제공하기 위해 노력하고 있다. 한편, SVE는 128비트에서 2048비트(128비트 단위로 증가)에 이르는 벡터를 수용할 수 있는 프로세서를 가능하게 한다는 점에서 그 중요성이 계속 커지고 있다. 이제 소프트웨어 개발자는 한번의 작성으로 여러 프로세서에서 해당 작업을 실행시킬 수 있게 된다. 마찬가지로 프로세서 개발자와 HPC 사용자들도 더 넓은 범위의 애플리케이션을 이용할 수 있다. Arm의 HPC 부문 시니어 디렉터인 브렌트 고르다(Brent Gorda)는 “2020년은 HPC에 있어 Arm의 분수령이 된 해였다. 약 10년전 서버 SoC 설계로 미미하게 시작하여, 세계 최고의 슈퍼컴퓨터 상을 두번이나 시상하기까지, Arm은 엄청난 여정을 거쳤고 앞으로도 속도를 늦추지 않을 것”이라고 말하며, “전 세계적으로 Arm의 에코시스템에 대한 지속적인 투자가 이루어지고 있으며, 더 많은 선택지와 커스텀화, 혁신에 대한 수요가 증가하고 있다. Arm은 이에 도전할 준비가 되어있으며, 세상을 진정으로 변화시킬 Arm의 기술을 통해 파트너사들을 지원해 나갈 앞으로의 10년도 매우 기대된다”고 말했다.
작성일 : 2020-11-30
Arm, 새로운 NPU로 인공지능 플랫폼의 성능, 적용성, 효율 강화
Arm은 인공지능(AI) 기능을 더한 디바이스의 범위가 지속적으로 확장됨에 따라, Ethos 제품에 새로운 Arm Ethos-U65 microNPU(Neural Processing Unit: 신경망처리장치)를 추가했다고 밝혔다.  AI 및 머신러닝(ML)을 위해 설계된 Arm Ethos-U65는 새로운 성능과 기능을 제공한다. 기존 Arm Ethos-U55와 동일한 수준의 전력 효율을 유지하면서 Arm Cortex-M에서 Cortex-A, 그리고 Arm 네오버스 기반 시스템을 아우르는 적용성을 갖췄으며, 2배 향상된 온 디바이스 머신러닝 성능을 제공한다. AI와 머신러닝이 엣지 및 엔드포인트 디바이스에 빠르게 적용되면서, 기능성이 높아지는 동시에 디바이스 및 시스템의 요구사항 또한 증가하고 있다. 이는 결국 시스템 공급자들이 더욱 높은 성능과 온디바이스 머신러닝 역량을 갖춘 시스템을 제공하면서 전력 효율은 유지하거나 향상시켜야 한다는 것을 의미한다. Arm의 AI 플랫폼은 유연하고 확장 가능한 기술들을 최대한 폭넓은 디바이스에 제공하도록 설계되었다. 올해 초 Arm은 새로운 머신러닝 IP인 Arm Cortex-M55 프로세서와 Arm-Ethos-U55를 발표한 바 있다. Arm Ethos-U55는 마이크로컨트롤러에 480배 향상된 머신러닝 성능을 제공하는 복합 솔루션이다. 이 솔루션은 가장 작은 엔드포인트 디바이스에서부터 스마트 홈 솔루션을 비롯해 다양한 곳에서 머신러닝 컴퓨팅이 구현될 수 있도록 한다. 5G 네트워크의 상용화로 수십억 개의 다양한 디바이스에 대한 연결성이 실현되고 강화됨에 따라, Arm은 Ethos-U65에 추가적인 성능 향상을 구현했다. 이는 Cortex-M, Cortex-A, 그리고 네오버스 프로세서 제품군 전반에서 복잡한 AI 워크로드를 처리하기 위한 추가적인 솔루션이 구동될 수 있도록 하며, 기존의 익숙한 툴을 갖춘 일관된 소프트웨어 스택에서 처리량 및 효율성을 증가시킨다.  또한, Ethos-U65는 다양한 임베디드 디바이스의 시스템 수준 성능을 높일 뿐만 아니라 네오버스 기반 시스템의 데이터 및 제어 영역과 같은 애플리케이션 내 서브시스템의 시스템 수준 성능도 향상시킨다. 이를 통해 개발자들이 높은 처리량과 전력 효율, 향상된 인텔리전스, 그리고 커넥티드 세상과 소통하는 더 많은 자연스러운 방법들을 실현할 수 있도록 한다. 한편, Ethos-U65는 온디바이스 AI를 폭넓게 구현하기 위한 알고리즘을 만들고 최적화하고 있는 Arm의 AI 에코시스템을 활용한다. Arm의 AI 플랫폼은 대부분의 최신 집적회로(IC)에 사용되는 Arm 기반의 이기종 프로세서(Heterogeneous Processor) 전반에 가장 보편적인 신경망 네트워크를 구현할 수 있도록 통일성 있는 소프트웨어 및 툴 인터페이스를 제공한다. 더불어, 이러한 복잡한 사용 사례를 구현하는데 필요한 유연성을 더하기 위해, Arm은 오픈 소스 소프트웨어에 대한 풍부한 지원을 제공한다. Arm 머신러닝 부문 마케팅 담당 부사장인 데니스 로딕(Dennis Laudick)은 “Arm Ethos 아키텍처의 영향력과 더불어 AI 디바이스에서 거둔 큰 성공을 기반으로, Arm은 Arm 에코시스템이 핵심 가치들을 구현할 수 있도록 돕고 있다”며, “Arm은 그동안 상상도 하지 못했던 새로운 가능성을 여는데 필요한 기반을 마련할 것”이라고 말했다.
작성일 : 2020-10-22
Arm, 차세대 클라우드 투 엣지 인프라를 가속화하는 플랫폼 로드맵 공개
Arm이 차세대 인프라의 혁신을 가속화하는 새로운 네오버스(Neoverse) 로드맵을 공개했다. Arm은 네오버스 V1 플랫폼과 네오버스 N2 플랫폼을 선보이며 네오버스가 나아갈 다음 단계의 방향성을 제시했다.  네오버스 V1 플랫폼은 V 시리즈의 첫 시작으로, SVE(Scalable Vector Extension)를 지원하여 고성능 클라우드, HPC, 머신러닝 등의 다양한 시장에 막대한 잠재력을 제공한다. 네오버스 N2는 더욱 높은 성능의 컴퓨팅 솔루션을 제공함으로써, 클라우드에서부터 SmartNIC, 엔터프라이즈 네트워킹, 그리고 제한된 전력의 엣지 디바이스에 이르는 다양한 사용 사례의 애플리케이션에서 요구되는 스케일아웃(scale-out) 성능을 충족시킨다. 10년전 Arm은 새로운 인프라 컴퓨팅 접근방법을 요구하는 시장의 변화에 대한 비전을 가지고, 데이터센터에 컴퓨팅 효율이 높은 기술을 제공하는 것을 목표로 세웠다. Arm은 보다 효율적인 인프라를 구축하기 위한 노력을 통해 2018년부터 2021년까지 연간 30%의 성능 향상을 제공하는 새로운 컴퓨팅 플랫폼인 Arm 네오버스를 발표했다. Arm이 최초로 선보인 플랫폼인 네오버스 N1은 Arm Cortex-A72 CPU에 비해 60% 더 높은 성능을 제공하면서 Arm의 성능 목표를 거의 2배에 가깝게 초과했다.     Arm은 네오버스의 다음 단계를 발표하면서 네오버스 로드맵에 새로운 네오버스 V1 플랫폼과 2세대 N시리즈 플랫폼인 네오버스 N2 플랫폼을 최초 공개했다. 네오버스 V1 플랫폼은 CPU 성능과 대역폭에 의존하는 애플리케이션을 위해 네오버스 N1 대비 50% 이상 향상된 단일 스레드 성능을 제공한다. 네오버스 V1 플랫폼은 SVE(Scalable Vector Extension)를 지원하여 고성능 클라우드, HPC, 머신러닝 등의 다양한 시장에 잠재력을 제공한다. SVE는 벡터 유닛 폭에 구애 받지 않는 소프트웨어 프로그래밍 모델을 사용하여 보다 넓은 벡터 유닛에 대해 SIMD(single-instruction multiple dispatch) 정수, bfloat16, 또는 부동 소수점 명령을 실행할 수 있다. SVE를 통해, Arm은 소프트웨어 코드의 이식성(portability) 및 수명(longevity)과 더불어 효율적인 실행을 보장한다. 네오버스 N2는 더욱 높은 성능의 컴퓨팅 솔루션을 제공함으로서, 클라우드에서부터 SmartNIC, 엔터프라이즈 네트워킹, 그리고 제한된 전력의 엣지 디바이스에 이르는 다양한 사용 사례의 애플리케이션에서 요구되는 스케일아웃(scale-out) 성능을 충족시킨다. 또한 네오버스 N2는 네오버스 N1보다 40% 향상된 싱글 스레드 성능을 제공하면서, 네오버스 N1과 동일한 수준의 전력 및 면적 효율을 유지한다.
작성일 : 2020-09-23