• 회원가입
  • |
  • 로그인
  • |
  • 장바구니
  • News
    뉴스 신제품 신간 Culture & Life
  • 강좌/특집
    특집 강좌 자료창고 갤러리
  • 리뷰
    리뷰
  • 매거진
    목차 및 부록보기 잡지 세션별 성격 뉴스레터 정기구독안내 정기구독하기 단행본 및 기타 구입
  • 행사/이벤트
    행사 전체보기 캐드앤그래픽스 행사
  • CNG TV
    방송리스트 방송 다시보기 공지사항
  • 커뮤니티
    업체홍보 공지사항 설문조사 자유게시판 Q&A게시판 구인구직/학원소식
  • 디렉토리
    디렉토리 전체보기 소프트웨어 공급업체 하드웨어 공급업체 기계관련 서비스 건축관련 업체 및 서비스 교육기관/학원 관련DB 추천 사이트
  • 회사소개
    회사소개 회사연혁 출판사업부 광고안내 제휴 및 협력제안 회사조직 및 연락처 오시는길
  • 고객지원센터
    고객지원 Q&A 이메일 문의 기사제보 및 기고 개인정보 취급방침 기타 결제 업체등록결제
  • 쇼핑몰
통합검색 "LLM"에 대한 통합 검색 내용이 335개 있습니다
원하시는 검색 결과가 잘 나타나지 않을 때는 홈페이지의 해당 게시판 하단의 검색을 이용하시거나 구글 사이트 맞춤 검색 을 이용해 보시기 바랍니다.
CNG TV 방송 내용은 검색 속도 관계로 캐드앤그래픽스 전체 검색에서는 지원되지 않으므로 해당 게시판에서 직접 검색하시기 바랍니다
한국레노버, 마더보드-냉각 설루션 통합한 ‘씽크패드 X9’ 시리즈 2종 국내 공식 출시
한국레노버가 달라진 디자인에 향상된 성능을 더한 ‘씽크패드 X9’ 시리즈 2종을 국내 출시했다. 씽크패드 X9-14 1세대 아우라 에디션과 씽크패드 X9-15 1세대 아우라 에디션은 혁신적 사고를 하는 이용자를 위해 설계된 프리미엄 비즈니스 노트북이다. 강력하고 효율적인 인텔 코어 울트라 프로세서를 탑재해 안정성과 생산성이 뛰어나며 개인화된 AI 경험을 선사한다. 씽크패드 X9 시리즈는 냉각과 성능을 최적화하는 주요 부품과 연결을 위한 간소화된 하우징인 ‘엔진 허브’ 디자인을 채택해, 슬림한 외관을 유지하면서도 생산성을 높인 것이 특징이다. 엔진 허브는 마더보드와 썬더볼트, HDMI 등의 모든 포트를 통합해 도크, 모니터, 기타 USB-C 포트 액세서리에 다양하게 연결할 수 있다. 주요 부품을 빠르고 쉽게 수리할 수 있어 서비스 편의성을 향상시켰다. 엔진 허브에 포함된 고효율 열 냉각 설루션은 강력한 성능을 안정적으로 유지한다.     프리미엄 온디바이스 AI 비서인 ‘레노버 AI 나우(Lenovo AI Now)’는 씽크패드 X9 시리즈의 AI 경험을 향상시킨다. 메타 라마 3.0의 로컬 LLM 기반으로 구축된 레노버 AI 나우는 모든 데이터를 로컬에 저장 및 처리함으로써 사용자 정보를 보호하고 강력한 실시간 AI 기능을 제공한다. 문서 정리, 디바이스 관리 작업을 자동화 및 간소화해 빠른 검색, 텍스트 요약 등의 작업을 지원한다. 레노버 AI 나우는 ▲장치와 관계없이 중요 문서에 빠르고 효율적으로 액세스할 수 있는 크로스 디바이스(cross-device) 검색 기능 ▲이미지, 문서의 선택 부분에서 정보를 검색하고 요약할 수 있는 기능 ▲독일어, 스페인어, 프랑스어 등 다국어 지원 기능 등이 추후 업데이트될 예정이다. 레노버 아우라(Aura) 에디션에 적용되는 레노버의 스마트 기능은 직관적인 AI 지원 도구로 전반적인 사용자 경험을 개선한다. ‘스마트 모드(Smart Mode)’는 보호, 협업, 주의, 파워, 웰니스의 5가지 맞춤형 설정을 사용자가 선택할 수 있도록 지원한다. 인텔과 협력해 개발한 ‘스마트 셰어(Smart Share)’는 안드로이드, iOS 디바이스와 씽크패드 X9 시리즈 간 사진을 빠르게 전송해 여러 장치에서 원활하고 통합된 경험을 제공한다. 어디서나 전문가의 도움을 실시간 받을 수 있는 ‘스마트 케어(Smart Care)’ 기능도 지원한다. 새롭게 디자인된 키보드는 씽크패드 특유의 키감에 대형 햅틱 터치패드를 결합했다. 키 트래블과 정밀한 촉각 피드백의 최신 기능을 더해 편의성을 강화했다. 씽크패드 X9-14 1세대 아우라 에디션은 55Whr, 씽크패드 X9-15 1세대 아우라 에디션은 80Whr 배터리로 언제 어디서나 고성능 작업을 수행할 수 있다. 레노버는 씽크패드 X9 시리즈가 베젤을 최대한 좁게 유지하면서도 8MP 고화질 MIPI 카메라와 듀얼 노이즈 캔슬링 마이크를 통합한 고급 커뮤니케이션 바를 포함해 하이브리드 작업에도 적합하다고 설명했다. 최대 2.8K 화질의 OLED 디스플레이는 100% DCI-P3, HDR 600 인증을 받아 고품질의 색감을 재현하며, 필요 시 디스플레이 터치 기능을 추가할 수 있다. 씽크패드 X9 시리즈 2종 모두 50% 재활용된 프리미엄 알루미늄 소재로 제작되고, 100% 재활용된 코발트 셀 배터리는 이용자가 쉽게 교체할 수 있다. 대나무와 사탕수수 섬유를 활용한 상자, FSC 인증 재료로 만든 종이 손잡이, 위조 방지 크래프트 종이 상자 실 등 패키징에도 지속 가능한 소재를 적극 활용했다. 한국레노버의 신규식 대표는 “전문가와 중소기업, 대기업까지 혁신적인 비즈니스 이용자를 위해 설계된 씽크패드 X9 시리즈는 레노버 AI 나우를 비롯해 레노버의 고급 AI 기반 컴퓨팅을 제공한다”면서, “엔진 허브 디자인을 채택한 씽크패드 X9을 활용해 사용자는 다양한 환경에서 더욱 스마트한 작업과 높은 성과를 거둘 수 있을 것”이라고 전했다.
작성일 : 2025-01-24
팔로알토 네트웍스, 사이버 보안의 미래... 자동화와 AI로 진화
팔로알토 네트웍스는 1월 14일 서울 강남구 조선팰리스에서 연례 최대 사이버보안 컨퍼런스인 ‘이그나이트 온 투어 서울’을 개최했다. 이번 행사는 일본, 중국, 인도 등 아시아 주요 국가를 거쳐 서울에서 열렸으며, 이후 호주, 태국, 싱가포르 등지로 이어지는 글로벌 로드쇼의 일환으로 진행되었다. 이번 컨퍼런스에서는 AI의 부상과 함께 진화하는 사이버보안 문제를 조명하며, 새로운 보안 트렌드와 전략에 대해 논의했다. 또한, 다양한 산업군의 국내 파트너 기업들이 보안 성공 사례를 공유하는 장으로 마련되었다. 한편, 팔로알토 네트웍스는 ‘AI 시대를 맞이하는 2025년 최신 사이버보안 트렌드와 팔로알토 네트웍스의 전략’을 주제로 기자간담회를 열었다. 간담회에는 팔로알토 네트웍스 아태지역(JAPAC) 사이먼 그린(Simon Green) 총괄 사장과 팔로알토 네트웍스 코리아 박상규 대표가 참석해 브리핑과 질의응답을 진행했다. 팔로알토 네트웍스는 간략한 브리핑에서 최신 사이버보안 트렌드와 함께 AI 및 자동화를 활용해 보안 관제의 효율성을 극대화하고, 기업 규모와 산업에 맞는 보안 솔루션을 제공하기 위한 노력을 강조했다. ▲ 팔로알토 네트웍스 아태지역(JAPAC) 사이먼 그린(Simon Green) 총괄 사장 사이먼 그린 총괄 사장은 AI 기반 보안 솔루션의 오탐 문제와 개선 방안에 대해 설명하며, "대부분의 AI 기반 보안 솔루션이 오탐 문제를 겪는 이유는 가시성이 부족하기 때문"이라고 말했다. 그는 이어, "팔로알토 네트웍스는 ‘XSIAM’ 플랫폼을 통해 보안 관제의 자동화 및 표준화를 달성해 오탐률을 대폭 감소시키고 비용 절감과 성능 향상을 동시에 이뤄냈다”고 강조했다. ▲ 팔로알토 네트웍스 코리아 박상규 대표 박상규 대표는 AI 보안 솔루션의 주요 타겟 및 위협 대응 방안에 대해 설명하며, “팔로알토 네트웍스는 대규모 기관과의 협력을 통해 프리시전 AI를 더 많은 기관이 활용할 수 있도록 확장할 계획”이라고 밝혔다. 또한, “AI 및 LLM(대규모 언어 모델) 관련 보안 위협(프롬프트 인젝션, 데이터 포이즈닝 등)을 예방하기 위한 솔루션을 제공하고 있으며, 생성형 AI의 등장으로 증가한 해킹 위협에 대응하기 위해 레이어4 이상의 방화벽 필요성을 강조하고 있다”고 말했다. 팔로알토 네트웍스는 기업들이 다수의 보안 솔루션을 개별적으로 관리하며 발생하는 비효율성을 지적하며, 통합 플랫폼을 통한 효율성 극대화와 AI 기반 실시간 보안을 통해 복잡성을 해소하는 방안을 제시했다. ▲ 이그나이트 온 투어 서울에서 기조연설을 하고 있는 팔로알토 네트웍스 아태지역(JAPAC) 사이먼 그린(Simon Green) 총괄 사장 한편, 총 18개의 세션으로 구성된 ‘이그나이트 온 투어 서울’ 컨퍼런스에서는 다양한 산업군의 파트너사들이 팔로알토 네트웍스를 활용한 사이버보안 성공 사례와 노하우를 공유했다. 박상규 대표는 ‘AI 시대를 위한 사이버보안의 자동화, 통합 및 간소화’를 주제로 발표했고, 사이먼 그린 총괄사장은 ‘사이버보안과 AI의 미래’를 주제로 연설했다.
작성일 : 2025-01-14
HP, CES 2025에서 신규 AI PC 및 설루션 공개
HP가 CES 2025에서 차세대 AI PC 및 설루션을 공개했다. 이번 신제품을 통해 HP는 전문가들이 혁신적이고 효율적인 협업을 통해 리더십을 발휘할 수 있도록 지원하겠다는 전략이다. 업무 환경의 변화로 PC 사용자들이 기술에 갖는 기대 역시 달라지고 있다. HP는 이러한 트렌드를 반영해, 개인의 업무 스타일에 맞춰 사용할 수 있는 차세대 기업용 AI PC 라인업을 공개했다. HP가 이번 CES에서 발표한 최신 엘리트북(EliteBook) 라인업 제품은 한 번의 클릭으로 발표 자료 준비와 개인 맞춤형 이메일 작성이 가능하다. 뿐만 아니라 스튜디오급 녹음 기능과 HP의 보안 설루션 울프 시큐리티(Wolf Security)가 제공하는 보안 및 인텔리전스 기능까지 내장돼 있다.   ▲ HP 엘리트북 울트라 G1i 14인치   HP의 차세대 기업용 AI 노트북인 HP 엘리트북 울트라 G1i 14인치(HP EliteBook Ultra G1)는 사용자가 빠르게 의사 결정을 내릴 수 있도록 지원하는 동시에 AI를 활용해 협업 경험을 향상시킨다. 최대 48 TOPS의 NPU를 지원하는 인텔 코어 울트라 5/7 프로세서를 통해 로컬 AI 성능을 개선하고 생산성을 높인다. 이를 통해 고성능을 요구하는 애플리케이션에서 멀티태스킹을 원활히 수행할 수 있으며, 웨비나와 팟캐스트를 두 배 이상 빠르게 맞춤 제작하고, 이메일 작성 속도 역시 두 배 가까이 향상시킬 수 있다. 또한 전문가 수준의 동영상을 제작할 수 있는 스튜디오급 녹음 기능, 9MP 카메라, 듀얼 마이크, 쿼드 스피커, AI 기반 폴리 카메라 프로(Poly Camera Pro) 등을 내장했다. 120Hz 3K OLED 디스플레이와 큰 크기의 햅틱 트랙패드도 탑재됐다. HP는 이동이 잦은 사용자들을 위해 높은 성능과 신뢰성을 제공하는 HP 엘리트북 X G1i 14인치(HP EliteBook X G1i)와 HP 엘리트북 X 플립 G1i 14인치(HP EliteBook X Flip G1i)를 선보였다. 이들 제푸은 인텔 코어 울트라 5/7 프로세서를 통해 비디오 데모 녹화와 발표 자료 준비를 두 배 가까이 빠르게 처리할 수 있으며, 개인 맞춤형 이메일도 1.3배 빨라진다. 두 개의 고밀도 터보팬을 이용한 열 조절 설계로 까다로운 작업 중에도 소음을 10% 줄인다. 가벼운 무게와 유연한 디자인을 갖춘 HP 엘리트북 X 플립 G1i 14인치는 노트북, 태블릿, 텐트 모드로 손쉽게 전환돼 다양한 작업 스타일에 맞춰 사용 가능하다. 애트모스피릭 블루(Atmospheric Blue)와 글레이셔 실버(Glacier Silver)의 두 색상으로 출시되며, HP 충전식 액티브 펜(HP Rechargeable Active Pen)과 함께 사용 시 정교한 필기 작업도 용이하다. HP의 차세대 기업용 AI PC 라인업은 CES 2025 혁신상을 수상한 자체 AI 설루션인 HP AI 컴페니언(HP AI Companion)을 탑재했다. 이를 통해 사용자는 개인화된 PC 설정 환경에서 문서를 요약하고, 이를 바탕으로 빠른 의사 결정이 가능하다. 동시에, HP 울프 시큐리티의 인텔리전스 기능을 활용해 고도화되는 사이버 위협으로부터 엔드포인트 전반의 보안을 쉽게 유지할 수 있다.   ▲ HP Z2 미니 G1 미니 워크스테이션   이외에도 HP는 AMD와 협력해 HP Z2 미니 G1a(HP Z2 Mini G1a)와 HP ZBook 울트라 G1a(HP ZBook Ultra G1a)를 개발했다. 두 제품은 AMD 라이젠 AI 맥스 프로(Ryzen AI Max PRO) 프로세서를 탑재한 모바일 워크스테이션으로, 콤팩트한 디자인과 향상된 성능을 제공한다. 이들 제품은 사용자가 3D 설계, 고사양 그래픽 작업이 필요한 프로젝트 렌더링, 로컬 대규모 언어 모델(LLM) 작업을 동시에 수행할 수 있도록 지원한다. 이와 함께 HP는 새로운 18인치 ZBook을 선보이면서 더욱 광범위한 모바일 워크스테이션 포트폴리오를 갖추게 됐다. HP ZBook 울트라 G1a는 14인치 모바일 워크스테이션으로 콤팩트한 디자인 덕분에 이동 중에도 성능에 제약 없이 다양한 작업을 수행할 수 있다. 이 제품은 AMD 라이젠 AI 맥스 프로 프로세서를 탑재해 이전에는 노트북에서 불가능했던 워크플로를 지원한다. 또한, 초박형 및 초경량 디자인, 오래 지속되는 배터리, 차세대 AI PC 기능, AI 강화 프라이버시 기능이 탑재돼 사무실 등 고정된 업무 환경에서의 워크플로를 어디서나 구현할 수 있다. 하드웨어는 여러 애플리케이션 간의 멀티태스킹이 매끄럽게 진행될 수 있도록 구성됐다. 16개의 데스크톱급 CPU 코어, 독립형 그래픽 수준의 성능을 제공하는 통합형 그래픽, 최대 128GB의 통합 메모리 아키텍처를 제공하고, 최대 96GB의 RAM을 GPU에 할당할 수 있도록 설계됐다. 미니 워크스테이션인 HP Z2 미니 G1a는 전문가용 워크스테이션에 일반적으로 요구되는 수준을 뛰어넘는 성능을 제공한다. AMD 라이젠 AI 맥스 프로 프로세서와 128GB까지 확장 가능한 통합 메모리 아키텍처를 탑재해, 최대 96GB를 GPU 전용으로 할당할 수 있다. 내부 전원 공급 장치를 갖춘 이 제품은 책상 위, 모니터 뒤, 책상 아래 어디든 깔끔하게 배치할 수 있는 작은 크기를 갖고 있으며 성능, 관리 용이성, 보안을 갖춘 고밀도 랙 마운트 설루션에도 적합하다. 어도비와 함께 개발한 HP Z 캡티스(HP Z Captis)는 최대 8K의 해상도로 어떠한 소재도 디지털화할 수 있는 폼팩터로, CES 2025 최고 혁신상을 수상했다. 사용자들의 창의성을 극대화하겠다는 신념을 가진 HP는 이러한 비전을 제품에 반영하며, 업계 선도 기업과의 협력을 통해 크리에이티브 워크플로를 향상시키겠다는 의지를 강조했다. HP는 2025년 봄 자사 최초의 18인치 모바일 워크스테이션을 출시할 예정이다. 17인치 워크스테이션과 비슷한 크기지만, 더 많은 전력과 높은 전문가급 그래픽 성능, 대용량 메모리, 저장 공간을 제공한다. 이 제품은 3배 빠른 속도의 터보팬과 HP 베이퍼포스 서멀(HP Vaporforce Thermals) 설루션, 차세대 독립형 그래픽을 탑재해 최대 200와트(W) 열설계전력(TDP)을 지원하도록 세밀하게 설계됐다. 또한 휴대성과 성능의 혁신을 통해 요구 사항이 많은 새로운 워크플로를 가능하게 할 전망이다.
작성일 : 2025-01-09
델, PC 제품군의 브랜드를 세 가지로 통합
델 테크놀로지스는 AI PC 시장의 빠른 진화에 따라 사용자가 최적의 AI PC를 손쉽게 선택할 수 있도록 PC, 디스플레이, 서비스, 액세서리 전반에서 새로운 통합 브랜드를 선보였다. 새 브랜드는 ▲엔터테인먼트·학습·업무용 제품군인 ‘델(Dell)’ ▲전문가급 생산성을 위한 제품군인 ‘델 프로(Dell Pro)’ ▲최고 수준의 성능을 위한 제품군인 ‘델 프로 맥스(Dell Pro Max)’ 의 3가지 제품군으로 구성된다. 그리고 각각의 제품군에서 ‘엔트리급 티어’부터 다양한 수준의 성능을 제공하는 메인스트림급 ‘플러스(Plus) 티어’, 높은 우수한 휴대성 및 디자인을 겸비한 고급형의 ‘프리미엄(Premium) 티어’ 등 세 가지 등급을 제공한다.     델은 기존의 ‘래티튜드’ 비즈니스 노트북과 ‘옵티플렉스’ 데스크톱의 브랜딩을 각각 ‘델 프로 노트북’과 ‘델 프로 데스크톱’으로 재편했다. 비즈니스 전문가를 위한 델 프로 노트북 포트폴리오는 유행을 타지 않는 깔끔한 디자인에 작고 가벼운 폼 팩터로 휴대성과 성능을 높인 것이 특징이다. 또한, 내구성이 우수한 소재를 적용해 외부 충격에 강하다는 점을 내세운다. 고성능 CPU, GPU, NPU를 탑재한 이 AI PC 제품군은 인텔 코어 울트라 시리즈 2 프로세서를 탑재했으며, 향후 AMD 라이젠 프로세서를 탑재한 제품도 제공될 예정이다. 향상된 배터리 수명 및 코파일럿과 같은 온-디바이스 AI 기능을 통해 하이브리드 업무 환경에서 높은 생산성을 안정적으로 구현하도록 했다. ‘델 프로 플러스’ 제품군은 다양한 사양을 제공하는 메인스트림 기업용 노트북으로, 사용자의 니즈에 따라 다양한 스펙, 폼 팩터(클램셸 및 투인원), 디스플레이 크기(13/14/16인치)를 선택할 수 있다. 이 제품군은 모두 동일한 시스템 BIOS를 사용해 IT 부서의 관리 업무 절차를 간소화시켜 준다. USB, HDMI, 썬더볼트 포트 옵션과 5G 및 Wi-Fi 7을 지원하며, 미국 국방성 내구성 표준 테스트(MIL-STD)를 통과했다. 기존 ‘프리시전’ 제품군은 ‘델 프로 맥스’ 포트폴리오로 변경됐다. 델 프로 맥스 제품군은 전체적으로 델 프로의 디자인을 적용해 통일감 있고 프로페셔널한 외관을 구현했다. 워크스테이션은 새롭게 특허 받은 방열 설계 방식을 채택해 이전 세대 대비 더욱 뛰어난 성능을 제공하며, 인텔 코어 울트라 시리즈 2 및 AMD 프로세서 옵션과 전문가용 그래픽을 제공한다. 이 제품군은 보안 유지 및 비용 관리를 원활히 지원하면서 애니메이션부터 비디오 렌더링까지 데이터 집약적인 워크로드를 효율적으로 처리하고, AI 추론을 실행하며, 대규모 언어 모델(LLM)을 미세 조정할 수 있다. 한편, 델은 ‘CES 2025’의 개막에 맞춰 AI 시대에 맞춰 창의성과 생산성을 향상시키는 온-디바이스 AI 기반의 새로운 PC 포트폴리오를 공개했다. 이번에 발표한 신제품은 델, 델 프로, 델 프로 맥스 브랜드의 AI PC를 비롯해, ‘델 울트라샤프(Dell UltraSharp)’와 ‘델 플러스(Dell Plus)’ 모니터를 포함한다. 한국 델 테크놀로지스의 김경진 총괄사장은 “PC는 일상생활에서 가장 중요한 개인용 생산성 디바이스로, AI로 인해 변화의 시기를 맞이하고 있다”면서, “델 테크놀로지스는 지난 40년간 PC 분야에서 목적 지향적인 혁신을 주도해 왔으며, AI 시대에 완벽하게 부합하는 간소화되고 새로운 AI PC 포트폴리오를 통해 컴퓨팅의 미래를 이끌어 나갈 것”이라고 밝혔다.
작성일 : 2025-01-07
생성형 AI 기반 BIM 전문가 시스템 개발해 보기
BIM 칼럼니스트 강태욱의 이슈 & 토크   이번 호에서는 지난 연재를 통해 설명한 생성형 AI 기술을 바탕으로 BIM(건설 정보 모델링) 전문가 시스템을 개발하는 방법을 간단히 알아보도록 한다.    ■ 강태욱 건설환경 공학을 전공하였고 소프트웨어 공학을 융합하여 세상이 돌아가는 원리를 분석하거나 성찰하기를 좋아한다. 건설과 소프트웨어 공학의 조화로운 융합을 추구하고 있다. 팟캐스트 방송을 통해 이와 관련된 작은 메시지를 만들어 나가고 있다. 현재 한국건설기술연구원에서 BIM/ GIS/FM/BEMS/역설계 등과 관련해 연구를 하고 있으며, 연구위원으로 근무하고 있다. 페이스북 | www.facebook.com/laputa999 블로그 | http://daddynkidsmakers.blogspot.com 홈페이지 | https://dxbim.blogspot.com 팟캐스트 | www.facebook.com/groups/digestpodcast   이 글에서는 LLM(대규모 언어 모델)과 RAG(검색 증강 생성) 기술을 적용하여 BIM IFC(Industry Foundation Classes) 데이터의 정보를 검색하고, 이를 바탕으로 BIM 지식 전문가 에이전트를 개발하는 방법을 소개한다. 이런 에이전트는 자연어 기반의 사용자 쿼리를 통해 필요한 정보를 신속하고 정확하게 제공하며, 건설 프로젝트의 전반적인 효율성을 높일 수 있다. 이 글에서 소개하는 방법은 RAG를 이용해 전문가 시스템을 개발하는 여러 가지 대안 중 하나임을 미리 밝힌다. IFC와 같은 포맷을 이용한 RAG와 LLM 사용 기법은 목적에 따라 구현 방법의 차이가 다양하다.    LLM RAG 기반 BIM 전문가 시스템 프로세스 현재 대중적인 목적으로 개발된 LLM 기술인 ChatGPT(오픈AI), Gemini(구글), Llama(메타), Phi(마이크로소프트)는 BIM의 일반적인 지식, 예를 들어 BIM 관련 웹사이트에서 공개된 일반적인 개념 설명, PDF에 포함된 텍스트를 학습한 모델을 제공하고 있다. 다만, 이들 LLM 도구는 BIM 모델링 정보를 담고 있는 IFC와 같은 특수한 데이터셋 파일은 인식하지 않는다. 현재는 PDF같은 일반적인 파일 형식만 검색 증강 생성을 지원하는 RAG 기술을 이용해, 도메인에 특화된 지식 생성을 지원한다. 이는 특정 도메인 지식을 훈련하기 위해 필요한 비용이 너무 과대하며, 도메인 지식을 모델 학습에 맞게 데이터베이스화하는 방법도 쉽지 않기 때문이다. 예를 들어, ChatGPT-4 모델을 훈련할 때 필요한 GPU 수는 엔비디아 A100×25,000개로 알려져 있으며, 학습에 100일이 걸렸다. A100 가격이 수천 만원 수준인 것을 감안하면, 사용된 GPU 비용만 천문학적인 금액이 소모된 것을 알 수 있다.  이런 이유로, LLM 모델을 전체 학습하지 않고 모델 중 작은 일부 가중치만 갱신하는 파인튜닝(fine-tuning), 범용 LLM는 운영체제처럼 사용하여 정보 생성에 필요한 내용을 미리 검색한 후 컨텍스트 프롬프트 정보로서 LLM에 입력해 정보를 생성하는 검색 증강 생성 기술인 RAG이 주목받고 있다. RAG는 <그림 1>과 같은 순서로 사용자 질문에 대한 답변을 생성한다.   그림 1. RAG 기반 BIM 전문가 시스템 작업 흐름(한국BIM학회, 2024)   RAG는 LLM에 입력하는 템플릿에 답변과 관련된 참고 콘텐츠를 프롬프트에 추가하여 원하는 답을 생성하는 기술이다. 이런 이유로, 답변에 포함된 콘텐츠를 처리하고, 검색하는 것이 매우 중요하다. LLM은 입력 프롬프트에 생성에 참고할 콘텐츠를 추가하지 못하면 환각 문제가 발생되는 단점이 있다. 각 RAG 단계는 검색이 가능하도록 데이터셋을 청크(chunk) 단위로 분할(split)하고, 데이터는 임베딩(embedding)을 통해 검색 연산이 가능한 벡터 형식으로 변환된다. 이 벡터는 저장 및 검색 기능을 가진 벡터 데이터베이스(vector database)에 저장된다. 사용자의 질문은 검색 알고리즘을 통해 벡터 데이터베이스에서 가장 근사한 정보를 포함하는 콘텐츠를 얻고, 프롬프트에 추가된 후 LLM에 입력된다. 그 결과 LLM은 원하는 답변을 출력한다. 이를 통해 학습하지 않은 전문 분야의 토큰을 인식하지 못하는 LLM이 원하는 결과를 생성할 수 있도록 한다.   BIM IFC 콘텐츠 데이터 구조 분석 앞서 살펴본 바와 같이 RAG 성능은 입력되는 데이터셋의 특징과 검색 알고리즘에 큰 영향을 받는다. 그러므로, 개방형 BIM 데이터 형식으로 사용되는 IFC의 특징을 분석하여 BIM RAG를 위한 데이터 처리 시 이를 고려한다. IFC 파일 구조는 STEP(ISO 10303), XML 스키마 형식을 준용한다. IFC는 객체지향 모델링과 그래프 모델 구조의 영향을 많이 받았다. 확장성을 고려해 BIM을 구성하고 있는 건축 객체의 부재들, 관계, 속성집합에 Instance ID 및 GUID(Globally 2025/1 Unique IDentifier)와 같은 해시값(hash)을 할당하고, 이들 간의 관계를 해시번호로 참조하여, 거대한 온톨로지 그래프 구조를 정의한다. <그림 2~3>은 이를 보여준다.   그림 2. IFC 객체 그래프 구조(Wall instance)   그림 3. IFC 그래프 구조 표현(강태욱, 2022)     ■ 자세한 기사 내용은 PDF로 제공됩니다.
작성일 : 2025-01-06
[포커스] 델, 새롭게 진화할 2025년 AI 기술 전망 소개
AI는 독립된 기술에서 벗어나 IT 기술 전반을 재정의하며 상호 융합되고 있다. 델 테크놀로지스는 진화하는 AI 기술이 기업의 비즈니스와 정부의 역할을 변화시키며, 새로운 디지털 스킬과 일자리를 창출하는 동력이 될 것으로 보았다. 그리고 이를 위한 전략적 접근법과 자사의 포트폴리오를 소개했다. ■ 정수진 편집장   글로벌 산업의 변화를 주도하는 AI 기술 아시아태평양 지역을 포함한 전 세계에서 혁신을 위한 움직임이 더욱 빨라지고 있다. 이에 따라 AI 관련 모멘텀이 활발해지고, AI에 대한 투자와 도입 또한 늘어나는 추세이다. IDC에 따르면, 오는 2028년까지 5년간 AI 투자 규모는 연평균 24%씩 성장해 1100억 달러(약 159조 원)에 이를 전망이다. 또한 많은 기업이 AI 전략을 총괄하는 최고 AI 책임자(CAIO) 직책을 만들거나 AI 위원회 조직을 운영하고 있는 것도 눈에 띄는 흐름이다. 델 테크놀로지스의 피터 마스(Peter Marrs) 아시아태평양·일본·중국 총괄 사장은 “많은 엔터프라이즈 고객들은 좋은 데이터에서 좋은 인사이트를 얻을 수 있음을 알고 있으며, 이를 위한 데이터 관련 전략을 중시하고 있다. 이와 관련한 사례는 다양한 산업에서 등장하고 있다”고 소개했다. AI 채택이 가장 활발한 금융 산업에서는 불법 사용이나 사기 탐지, 리스크 관리, 고객 서비스 등에 AI를 활용한다. 헬스케어 산업에서는 예측 진단 및 환자 기록 관리를 위해 AI를 도입하고 있다. 제조 산업에서는 AI를 디지털 트윈과 스마트 제조에 활용하고 있으며, 공공 부문에서는 대국민 서비스를 향상시키거나 다언어 국가에서 LLM(대규모 언어 모델) 이니셔티브를 추진하는 등에 AI가 쓰인다. 이런 흐름에서 AI의 효과를 충분히 얻을 수 있는 기술에 대한 요구 또한 높다. 델 테크놀로지스는 디바이스, 데이터센터, 클라우드에 걸친 엔드 투 엔드 AI 포트폴리오인 ‘델 AI 팩토리(Dell AI factory)’를 내세운다. 마스 사장은 “델 AI 팩토리는 버튼을 한 번 누르는 것처럼 손쉽게 AI를 도입하고 활용할 수 있도록 지원하는 데에 초점을 맞추고 있다. 인프라, 서비스, 데이터 준비, AI 구축, 파트너와의 개방형 생태계 등을 제공해 쉽게 AI를 활용할 수 있도록 하는 것이 델 AI 팩토리의 비전”이라고 전했다.   ▲ 델 AI 팩토리는 손쉬운 AI 도입/활용을 위한 포괄적 포트폴리오이다.(이미지 출처 : 델 테크놀로지스)   기술 융합과 산업 변혁 이끄는 AI 트렌드 델 테크놀로지스에서 최고 AI 책임자를 겸하고 있는 존 로즈(John Roese) CTO는 “AI는 전 세계 산업의 모든 측면에 영향을 주고 있다. 생산성을 높이는 것뿐 아니라 우리가 기술과 상호작용하는 방식에도 영향을 미치며, 이런 추세는 2025년에 더욱 가속화될 것”이라고 짚었다. 그러면서 2025년의 AI 기술 트렌드에 관한 전망으로 ▲역동적이고 자율적이면서 상호작용 가능한 에이전틱 AI(agentic AI) 툴의 등장 ▲개념 단계가 아닌 실제 기업의 프로세스에 AI 적용 확대 ▲소버린 AI(sovereign AI)의 확대 및 정부의 역할 강화 ▲AI와 첨단 기술의 융합 ▲AI의 필수 스킬화 및 일자리에 주는 영향 확대 등을 꼽았다. 에이전틱 AI는 사람이 입력한 프롬프트에 반응하는 생성형 AI에서 나아가, 자율성을 갖고 사람의 개입 없이 더 많은 일을 할 수 있는 AI를 뜻한다. 맥락을 기억하고 복잡하면서 구체적인 작업을 할 수 있는 AI, 사람 및 AI간의 협업을 할 수 있는 AI는 데이터센터의 바깥으로 나가 실생활에서 더 적극적으로 쓰일 전망이다. 로즈 CTO는 “2023년 이후 기업의 AI 사용은 조금씩 효과를 보이고 있는데, 2025년에는 더 많은 기업이 AI를 실제 프로세스에 적용하면서 비용 절감이나 마진 향상 등 영향력 있는 결과를 얻을 것”이라고 보았다. 또한 “많은 AI 툴이 표준화되어 턴키로 제공되고, 다양한 생태계 요소를 결합해 더 쉽게 AI를 도입할 수 있게 될 것”이라고 짚었다. 소버린 AI와 관련한 정부의 역할 시나리오로는 정부의 자체적인 데이터센터 및 AI 모델 구축, 기업 사용자를 위한 AI 기술 투자 지원, AI 산업 기반 구축 등이 꼽힌다. 로즈 CTO는 “2025년에는 모든 정부가 자신의 역할을 명확히 정의하고 산업 파트너의 역할을 함으로써 AI 가속화를 뒷받침할 것”이라고 보았다. 몇 년 전만 해도 AI는 독립된 기술로 여겨졌지만, 최근 들어 AI가 다른 기술의 역할을 재정의하는 흐름이 뚜렷해지고 있다. 이는 AI를 통해 더욱 가속화할 수 있는 기술 영역이 늘어난다는 뜻이기도 하다. 로즈 CTO는 “컴퓨터 비전이나 애널리틱스 등 거의 모든 에지 워크로드에서 AI를 운영하게 될 것으로 보인다. 또한, 디지털 트윈은 이미 AI의 일부로 포함되어 더욱 강화되고 있다. AI PC는 설계부터 AI를 고려한 플랫폼으로 개발되어 AI 생태계에 연결되는 역할을 할 것이다. 이외에도 모든 기술이 AI를 가능하게 하거나 AI로 인해 가능해지는 형태로 연결될 것”이라고 전했다. 이렇게 AI가 성장하면서, 디지털 스킬의 중요성도 꾸준히 강조된다. AI가 대체할 수 있는 단순 반복 업무나 기초적인 일자리는 사라지겠지만, 한편으로 ‘소프트웨어 컴포저’처럼 새로운 일자리가 등장하기도 할 것이다. 소프트웨어 컴포저는 AI가 어떤 프로그램을 코딩하고 어떤 문제를 해결해야 하는지를 기획/감독하는 총괄 역할을 한다. 로즈 CTO는 “기업에서는 AI의 전략적 역할과 비즈니스에 미치는 영향을 잘 이해하면서, 비즈니스 가치를 만들 수 있도록 장기 비전을 갖고 조직의 AI 성숙도를 높이기 위한 노력을 기울여야 한다”면서, “큰 규모의 기업일 수록 전략적인 선택을 하지 않으면 큰 효과를 보기 어려울 수 있다. 델은 내부에서 AI를 도입한 경험을 바탕으로 기업 조직의 복잡성 해소와 AI 작업의 우선순위 선정 등에서 고객에게 도움을 줄 수 있도록 노력할 것”이라고 밝혔다.   ▲ 자율성을 앞세운 에이전틱 AI가 2025년 본격화될 전망이다.     ■ 기사 내용은 PDF로도 제공됩니다.
작성일 : 2025-01-06
[온에어] 인공지능 시대, 건축 기술의 혁신과 도전 과제
캐드앤그래픽스 CNG TV 지식방송 지상 중계   2024년 12월 16일, CNG TV는 ‘인공지능 시대의 건축 기술 - 건축 설계 자동화, 건설 로봇, AI 데이터’를 주제로 웨비나를 진행했다. 이번 웨비나에서는 건축과 건설 현장에서 실제로 적용되고 있는 AI 기술과 디지털화된 건축 기술의 현황을 살펴보고, 이러한 기술이 가져올 혁신과 도전 과제를 집중적으로 소개했다. 보다 자세한 내용은 다시보기를 통해 확인할 수 있다. ■ 박경수 기자   ▲ 캐드앤그래픽스 최경화 국장, 엔제이스튜디오 이남주 소장, 경희대학교 김동일 교수(왼쪽부터)   이날 웨비나는 캐드앤그래픽스 최경화 국장이 사회를 맡았으며, 엔제이스튜디오 이남주 소장과 경희대학교 김동일 교수가 발표자로 참여했다. 이번 웨비나에서는 건축 실무에서 AI(인공지능)가 어떻게 사용되고 있는지, 이를 통해 어떤 미래를 기대할 수 있는지를 조망했다. 동시에 AI 시대의 건축과 디자인 방향성을 제시하며, 디자이너와 기술자에게 준비와 혁신의 중요성을 강조했다. 이남주 소장은 ‘인공지능 시대의 디자인 도구’를 주제로 발표했다. 그는 데이터와 AI를 결합한 새로운 디자인 접근법과 함께 귀납적, 연역적 프로그래밍 활용 및 데이터 가공 프로세스의 자동화에 대해 설명했다. 이남주 소장은 “AI를 학습의 대상으로만 보기보다는 도구로 적극 활용하는 것이 디자이너의 중요한 역할이며, 창의적 문제 해결이 핵심 과제”라고 강조했다. 이어서 “BIM, 스마트 시티, 디지털 트윈 등 차세대 디자인 플랫폼과 머신러닝, LLM, 에지 컴퓨팅 등 4차 산업혁명의 기술 도구가 활용되고 있다”라고 소개했다.   ▲ 엔제이스튜디오 이남주 소장   경희대학교 김동일 교수는 ‘인공지능 시대의 건축과 건축 기술’을 주제로 발표했다. 그는 AI와 빅데이터를 활용한 건축 설계와 기술 혁신에 대해 소개하며, 프리캐스트된 3D 프린팅 기둥(ETH)과 디지털 실험적 구조물(ICD/ITKE Pavilion) 등을 기술 적용 사례로 제시했다. 김동일 교수는 “디자인 의사결정 과정에서 머신러닝을 활용한 효율적인 설계 탐색이 필요하며, 건축 기술과 AI의 융합을 통해 새로운 디자인 가능성을 모색하고 있다”고 설명했다.    ▲ 경희대학교 김동일 교수   이번 웨비나를 통해 AI와 머신러닝은 건축 및 디자인 분야에서 데이터 기반의 효율적이고 창의적인 결과를 만들어내고 있다는 점이 강조됐다. 이제 AI를 적극적으로 활용하고 도구화하는 능력을 갖추는 것이 설계 디자이너에게 필수인 시대가 되었다. 또한 디지털 트윈, 스마트 시티, 데이터 시각화 등 실제 사례를 통해 기술의 구체적 활용성과 혁신 가능성이 확인되었다.   ■ 기사 내용은 PDF로도 볼 수 있습니다.
작성일 : 2024-12-30
Arm, “네오버스 기반의 AWS 그래비톤4 프로세서로 클라우드 혁신 가속화 지원”
Arm은 AWS의 그래비톤4(Graviton4) 프로세서를 통해 개발자와 기업이 클라우드 워크로드의 잠재력을 발휘할 수 있도록 지원하면서, 특수 실리콘 및 컴퓨팅을 제공하고 보다 효율적이고 지속 가능하며 강력한 클라우드를 위한 기반을 마련하고자 AWS와 협력을 진행 중이라고 소개했다. 클라우드 컴퓨팅 환경은 AI의 폭발적인 성장에 힘입어 극적인 변화를 겪고 있다. AI 애플리케이션이 더욱 정교하고 복잡해짐에 따라 강력하며 효율적이고, 비용 효율적인 컴퓨팅 설루션에 대한 필요성이 그 어느 때보다 커지고 있다. 클라우드에 워크로드를 배포하는 고객들은 이러한 최신 워크로드의 요구사항을 충족하기 위해 어떤 인프라가 필요한지 재고하고 있다. 고객들의 요구사항은 성능 향상과 비용 절감부터, 규제 또는 지속 가능성 목표를 위한 에너지 효율성의 새로운 벤치마크 달성까지 다양하다. Arm의 네오버스 V2(Neoverse V2)에 기반한 AWS 그래비톤4 프로세서는 이전 세대인 그래비톤3 프로세서보다 최대 30% 향상된 컴퓨팅 성능, 50% 더 많은 코어, 75% 더 많은 메모리 대역폭을 제공한다. 이러한 장점 덕분에 현재 에코시스템과 고객들이 AWS 프로세서를 많이 채택하고 있다는 것이 Arm의 설명이다. Arm 네오버스 V2 플랫폼에는 고성능 부동 소수점 및 벡터 명령어 지원과 같은 Armv9 아키텍처의 새로운 기능이 포함되어 있으며, SVE/SVE2, Bfloat16 및 Int8 MatMul과 같은 기능은 AI/ML 및 HPC 워크로드에 강력한 성능을 제공한다. AI 워크로드 채택을 더욱 촉진하기 위해 Arm은 2024년 초 선도적인 AI 프레임워크 및 소프트웨어 에코시스템과 협력하여 전체 ML 스택이 Arm에서 즉시 사용 가능한 추론 성능 최적화의 이점을 누릴 수 있도록 Arm Kleidi를 출시했고, 이를 통해 개발자가 별도의 Arm 관련 전문 지식 없이도 워크로드를 구축할 수 있도록 했다. Arm은 파이토치(PyTorch)에서 이러한 최적화를 통해 초당 토큰 수(tokens/sec)와 첫 토큰 생성 시간(time-to-first-token) 지표를 개선하여, AWS 그래비톤4에서 라마(Llama) 3 70B 및 Llama 3.1 8B와 같은 LLM(대규모 언어 모델)을 실행할 수 있는 방법을 선보였다. HPC 워크로드의 경우, 그래비톤4는 코어당 16% 더 많은 메인 메모리 대역폭과 vCPU당 두 배의 L2 캐시를 제공하는 등 그래비톤3E에 비해 성능이 크게 향상되었다. 이는 주로 메모리 대역폭에 제한이 있는 HPC 애플리케이션의 성능에 매우 중요하다. EDA 워크로드의 경우, Arm의 엔지니어링 팀이 프로덕션 실행을 통해 측정한 결과, 그래비톤4는 RTL 시뮬레이션 워크로드에서 그래비톤3보다 최대 37% 더 높은 성능을 제공하는 것으로 나타났다. 한편, Arm은 지난 몇 년 동안 소프트웨어 에코시스템 전반에서 최종 고객이 AWS 그래비톤 프로세서에 다양한 클라우드 워크로드를 배포하면서 도입이 지속적으로 증가했다고 전했다. “고객들은 비용을 절감하고, 더 향상된 성능을 경험하며, 탄소 및 지속 가능성 발자국을 개선하고 있다”는 것이 Arm의 설명이다.
작성일 : 2024-12-23
엔비디아, 생성형 AI의 활용 범위 넓히는 슈퍼컴퓨터 ‘젯슨 오린 나노 슈퍼’ 출시
엔비디아가 소형 생성형 AI 슈퍼컴퓨터 신제품인 ‘젯슨 오린 나노 슈퍼 개발자 키트(Jetson Orin Nano Super Developer Kit)’를 공개했다. 엔비디아는 소프트웨어 업그레이드를 통해 이전 모델에 비해 성능을 높이고 가격은 낮췄다고 밝혔다. 손바닥만한 크기의 새로운 엔비디아 젯슨 오린 나노 슈퍼 개발자 키트는 상업용 AI 개발자부터 취미로 AI를 다루는 사람, 학생에 이르기까지 다양한 사람들에게 생성형 AI 기능과 성능을 제공한다. 가격은 기존의 499달러에서 249달러로 인하됐다. 이 제품은 이전 모델에 비해 생성형 AI 추론 성능이 1.7배 향상됐고, 성능은 67 INT8 TOPS로 70% 증가했으며, 메모리 대역폭은 102GB/s로 50% 증가했다. 젯슨 오린 나노 슈퍼는 검색 증강 생성(RAG) 기반의 대규모 언어 모델(LLM) 챗봇 생성, 시각적 AI 에이전트(AI agent) 구축, AI 기반 로봇 배포 등에 적합한 설루션을 제공한다. 젯슨 오린 나노 슈퍼는 생성형 AI, 로보틱스, 컴퓨터 비전 기술 개발에 관심이 있는 사람들에게 적합하다. AI 세계가 작업별 모델에서 파운데이션 모델로 이동함에 따라 아이디어를 현실로 전환할 수 있는 접근 가능한 플랫폼도 제공한다. 젯슨 오린 나노 슈퍼의 향상된 성능은 모든 인기 있는 생성형 AI 모델과 트랜스포머 기반 컴퓨터 비전을 위한 이점을 제공한다.     개발자 키트는 젯슨 오린 나노 8GB 시스템 온 모듈(SoM)과 레퍼런스 캐리어 보드로 구성돼 에지 AI 애플리케이션 프로토타입에 적합한 플랫폼을 제공한다. 이 SoM은 텐서 코어가 포함된 엔비디아 암페어(Ampere) 아키텍처 GPU와 6코어 Arm CPU를 갖추고 있어, 여러 개의 동시 AI 애플리케이션 파이프라인과 고성능 추론을 용이하게 한다. 또한, 최대 4개의 카메라를 지원할 수 있으며 이전 버전보다 더 높은 해상도와 프레임 속도를 제공한다. 젯슨은 로보틱스를 위한 엔비디아 아이작(Isaac), 비전 AI를 위한 엔비디아 메트로폴리스(Metropolis), 센서 처리를 위한 엔비디아 홀로스캔(Holoscan)을 비롯한 엔비디아 AI 소프트웨어를 실행한다. 합성 데이터 생성을 위한 엔비디아 옴니버스 리플리케이터(Omniverse Replicator)와 NGC 카탈로그에서 사전 훈련된 AI 모델을 미세 조정하기 위한 엔비디아 타오 툴킷(TAO Toolkit)을 사용하면 개발 시간을 단축할 수 있다. 한편, 엔비디아는 새로운 젯슨 오린 나노 슈퍼에 제공되는 소프트웨어 업데이트가 이미 젯슨 오린 나노 개발자 키트를 보유하고 있는 사용자의 생성형 AI 성능도 향상시킨다고 밝혔다. 1.7배의 생성형 AI 성능을 향상시키는 소프트웨어 업데이트는 젯슨 오린 NX와 오린 나노 시리즈 시스템 모듈에서도 사용할 수 있다. 기존 젯슨 오린 나노 개발자 키트 소유자는 지금 바로 젯팩 SDK(JetPack SDK)를 업그레이드해 향상된 성능을 활용할 수 있다. 엔비디아는 “젯슨 생태계 파트너는 추가적인 AI와 시스템 소프트웨어, 개발자 도구, 맞춤형 소프트웨어 개발을 제공한다. 또한, 카메라와 기타 센서, 캐리어 보드, 제품 설루션을 위한 설계 서비스도 지원 가능하다”고 덧붙였다.
작성일 : 2024-12-19
IBM, 생성형 AI 시대를 위한 새로운 광학 기술 발표
IBM은 데이터센터에서 생성형 AI 모델의 학습 및 실행 방식을 획기적으로 개선할 수 있는 차세대 광학 기술을 발표했다. 이는 기존의 전선 기반 단거리 통신을 보완하는 새로운 공동 패키지형 광학(co-packaged optics : CPO) 기술로, 데이터센터 내부 연결 속도를 대폭 향상시킬 수 있는 새로운 공정이다. 특히 IBM은 이 기술을 구동할 수 있는 폴리머 광학 도파관(Polymer Optical Waveguide : PWG)을 성공적으로 설계, 조립해 최초로 공개했다. IBM 연구진은 CPO 기술이 칩, 회로 기판, 서버 간 고대역폭 데이터를 전송하는 컴퓨팅 방식에 가져올 변화를 시연했다.  광섬유 기술은 전기 대신 빛으로 장거리 데이터 전송을 빠르게 처리하기 때문에, 현재 전 세계 상업 및 통신 트래픽 대부분에 사용되고 있다. 그러나 데이터센터의 경우, 외부 통신 네트워크에는 광섬유를 사용하는데 반해, 내부 통신 네트워크의 대부분에는 여전히 구리선을 사용하고 있다. 이 전선은 대규모 분산 학습 과정에서 다른 장치의 데이터를 기다리느라 절반 이상의 시간을 유휴 상태로 보내는 GPU 가속기들을 연결하고 있는데 이로 인해 상당한 비용과 에너지가 소모된다. IBM 연구진은 광학 속도와 처리 능력을 데이터센터 내부로 도입할 방법을 제시했다. IBM은 새롭게 발표된 논문을 통해, 고속 광학 연결을 가능하게 하는 새로운 CPO 모듈의 시제품을 소개했다. 이 기술은 데이터센터 통신의 대역폭을 확장하고, GPU의 유휴 시간을 줄이며, AI 처리 속도를 향상시킬 수 있다.   ▲ IBM 리서치의 광학 모듈 시제품   IBM은 이번 연구 혁신을 통해 중급 전기 배선(interconnect) 대비 전력 소비를 5배 이상 줄임으로써 생성형 AI 확장 비용을 낮추고, 데이터센터 간 케이블 연결 길이를 기존 1미터에서 수백 미터로 확장할 수 있을 것으로 보고 있다. 또한, CPO 기술을 통해 기존 전기 배선(wiring)을 사용할 때보다 대규모 언어 모델(LLM)의 학습 속도를 최대 5배까지 높일 수 있다고 보았다. 이를 통해 일반적인 LLM 학습 시간이 3개월에서 3주로 단축될 수 있으며, 더 큰 모델과 더 많은 GPU를 활용할 경우 성능 향상의 폭이 더욱 커진다는 것이다. 이외에도 IBM은 AI 모델 학습 시 모델 당 미국 가정 약 5000가구의 연간 전력 소비량에 해당하는 에너지를 절감함으로써, 데이터센터 에너지 효율을 높일 수 있을 것으로 전망했다.   IBM 리서치 연구 개발 총책임자인 다리오 길(Dario Gil) 수석 부회장은 “생성형 AI가 점점 더 많은 에너지와 처리 능력을 요구함에 따라 데이터센터는 진화해야 한다. 공동 패키지형 광학(CPO) 기술은 데이터센터를 미래에 대비하도록 만들 수 있다”면서, “이 획기적인 기술을 통해 미래의 칩은 광섬유 케이블이 데이터 센터 안팎으로 데이터를 전달하는 방식으로 통신하게 될 것이며, 미래의 AI 워크로드를 처리할 수 있는 더 빠르고 지속 가능한 새로운 통신 시대를 열 것”이라고 말했다.
작성일 : 2024-12-10