• 회원가입
  • |
  • 로그인
  • |
  • 장바구니
  • News
    뉴스 신제품 신간 Culture & Life
  • 강좌/특집
    특집 강좌 자료창고 갤러리
  • 리뷰
    리뷰
  • 매거진
    목차 및 부록보기 잡지 세션별 성격 뉴스레터 정기구독안내 정기구독하기 단행본 및 기타 구입
  • 행사/이벤트
    행사 전체보기 캐드앤그래픽스 행사
  • CNG TV
    방송리스트 방송 다시보기 공지사항
  • 커뮤니티
    업체홍보 공지사항 설문조사 자유게시판 Q&A게시판 구인구직/학원소식
  • 디렉토리
    디렉토리 전체보기 소프트웨어 공급업체 하드웨어 공급업체 기계관련 서비스 건축관련 업체 및 서비스 교육기관/학원 관련DB 추천 사이트
  • 회사소개
    회사소개 회사연혁 출판사업부 광고안내 제휴 및 협력제안 회사조직 및 연락처 오시는길
  • 고객지원센터
    고객지원 Q&A 이메일 문의 기사제보 및 기고 개인정보 취급방침 기타 결제 업체등록결제
  • 쇼핑몰
통합검색 "컴퓨터 비전"에 대한 통합 검색 내용이 2,453개 있습니다
원하시는 검색 결과가 잘 나타나지 않을 때는 홈페이지의 해당 게시판 하단의 검색을 이용하시거나 구글 사이트 맞춤 검색 을 이용해 보시기 바랍니다.
CNG TV 방송 내용은 검색 속도 관계로 캐드앤그래픽스 전체 검색에서는 지원되지 않으므로 해당 게시판에서 직접 검색하시기 바랍니다
코리아 그래픽스 2025, 9월 11~12일 온라인 개최...“AI로 혁신하는 3D 시각화와 산업의 미래” 집중 조명
국내 대표 컴퓨터 그래픽 컨퍼런스인 ‘코리아 그래픽스 2025’가 오는 9월 11일(목)부터 12일(금)까지 온라인으로 개최된다. 올해로 13회째를 맞이하는 이번 행사는 ‘AI로 혁신하는 3D 시각화와 산업의 미래’를 주제로, 제조·건축·엔터테인먼트 등 산업 현장에서 적용 가능한 AI·XR·디지털 트윈 최신 기술과 활용 사례를 심도 있게 다룰 예정이다. 9월 11일, 행사 첫째 날은 ‘디지털 트윈과 3D 시각화’를 주제로 진행된다. 한양대학교 현경훈 교수는 생성형 AI를 활용한 디자인·제조 혁신 방안을 발표한다. 에픽게임즈 코리아 권오찬 시니어 에반젤리스트는 언리얼 엔진 리얼타임 기술 기반의 디지털 트랜스포메이션 사례를 소개한다. HP코리아 차성호 이사는 AI 워크스테이션을 통한 생산성 향상 사례를 공유한다. 에스엘즈 정재헌 대표는 AEC 산업의 공간지능 및 증강휴먼 기술 발전을 다룬다. 유니티코리아 김현민 엔지니어는 Unity Asset Manager를 통한 CAD 데이터 관리 및 실시간 협업 혁신을 제시한다. 메가존클라우드 홍동희 그룹장은 CAD와 Unity 결합을 통한 신규 비즈니스 모델과 기회를 설명한다. 캐디안 한명기 상무는 AI-CAD 기반 3D 도면 생성 기술 및 적용 솔루션을 소개한다. 이노시뮬레이션 이지선 CTO는 모빌리티 XR과 AI 융합 사례를 발표한다. 9월 12일, 둘째 날은 'AI 비주얼 트렌드와 응용 사례'를 주제로 AI 기반 비주얼 트렌드와 응용 사례가 집중적으로 다뤄진다. 서울미디어대학원대학교 유훈식 교수는 AI 시대 그래픽 디자인 패러다임 변화와 혁신 사례를 발표한다. 현대자동차 신종호 매니저는 언리얼 엔진 기반 제조 소프트웨어 개발과 스마트팩토리 사례를 소개한다. LG CNS 이희재 팀장은 생성형 AI 플랫폼 ‘COP’을 통한 업무 생산성 향상 방안을 공유한다. 아이스케이프 조세희 대표는 생성형 AI 영상 제작 노하우를 공개한다. AI팩토리 김태영 CEO는 노코드 AI 에이전트와 바이브 코딩을 활용한 자동화 및 생산성 향상 방안을 제시한다. 이윰 스페이스 이윰 대표는 세계관 디자인을 중심으로 한 생성 AI 기반 아트워크 사례를 발표한다. 고려대학교 박진호 교수는 XR과 AI 융합을 통한 초연결 콘텐츠의 가능성을 제시한다. 한편 이번 행사에는 에픽게임즈코리아, 유니티코리아, 메가존클라우드, HP코리아, 현대자동차, LG CNS 등 국내외 주요 기업과 연구진이 참여한다. 산업별 AI·3D 시각화 기술의 미래 방향성을 제시하며, 실무 적용 가능한 인사이트를 공유할 예정이다. 이번 행사를 주관하는 캐드앤그래픽스 최경화 국장은 “산학연 전문가가 함께 모여 AI와 3D 시각화 기술의 융합 가능성을 논의하는 자리가 될 것”이라며, “급변하는 산업 환경 속에서 혁신을 이끌어갈 유익한 기회가 될 것”이라고 밝혔다. 현재 코리아 그래픽스 2025 사전등록 이벤트가 진행 중이다. 
작성일 : 2025-08-30
DJI, 성능과 확장성 갖춘 미니 무선 마이크 DJI Mic 3 출시
DJI가 강력한 성능과 유연한 확장성을 갖춘 초경량 무선 마이크 DJI Mic 3(DJI 마이크 3)를 출시한다고 밝혔다. 이번 제품은 최대 4개의 송신기(TX)와 8개의 수신기(RX)를 지원해 멀티 카메라 제작 환경이나 그룹 녹음 시에도 안정적인 성능을 제공한다. 또한 DJI Mic 시리즈 최초로 자동 게인 조절(Adaptive Gain Control) 기능이 탑재돼 자동으로 클리핑을 방지하거나 음량을 조정할 수 있으며, 세 가지 음성 톤 프리셋(Voice Tone Presets)과 2단계 노이즈 캔슬링 기능도 제공된다. 또한 32GB 저장 공간의 듀얼 파일 32-bit Float 내부 레코딩(Dual-File 32-bit Float Internal Recording) 기능도 처음 적용되었다.     16g 무게의 DJI Mic 3 송신기는 가볍고 컴팩트한 디자인이 특징이다. 탈착식 회전 클립을 이용해 마이크 각도를 자유롭게 조정할 수 있어, 어떤 방식으로 부착하더라도 최적의 오디오를 확보할 수 있다. 자석 또는 클립 방식으로 착용 가능하며, 윈드스크린은 촬영 환경이나 의상에 맞춰 선택할 수 있도록 5가지 색상으로 별도 구매가 가능하다. 크리에이터는 멀티 신(multi-scene) 촬영 시 장소를 이동하는 중에도 Mic 3를 충전하며 간편하게 휴대할 수 있다. 함께 제공되는 올인원 충전 케이스는 송신기 2개와 수신기 1개를 수납할 수 있으며, 윈드스크린이나 자석 클립을 부착한 상태로도 보관이 가능하다. 케이스 내부에는 자석과 잠금 오디오 어댑터 케이블을 함께 수납할 공간도 마련되어 있다. DJI Mic 3는 인텔리전트 기능을 통해 역동적인 고품질의 사운드를 구현하며, DJI 마이크 중 최초로 두 가지 자동 게인 조절 모드를 갖췄다. 야외 스포츠 경기처럼 음량 변화가 큰 환경에서는 ‘자동(Auto)’ 모드가 갑작스러운 볼륨 피크를 억제해 클리핑을 방지하고, 실내 스튜디오처럼 정적인 환경에서는 ‘다이내믹(Dynamic)’ 모드가 음량 변화에 따라 자동으로 게인을 조정해 일관된 음량을 유지한다. DJI Mic 3는 DJI 마이크 가운데 최초로 세 가지 음성 톤 프리셋(레귤러, 리치, 브라이트)을 지원한다. 이 기능은 다양한 음색을 가진 여러 화자가 참여하는 인터뷰에 적합하며, 음성을 전문적으로 조정해 저음을 강화하여 울림을 줄이고, 고음을 강조함으로써 명료도를 높인다. 동시에, 2단계 능동형 노이즈 캔슬링 기능이 에어컨과 같은 배경 소음을 억제해 선명하고 또렷한 음질을 구현한다. 윈드스크린을 장착하면 바람 소리까지 추가로 줄일 수 있다. 마지막으로, 무손실 오디오(Lossless Audio) 기능을 통해 송신기에서 수신기로 압축되지 않은 48kHz/24-bit 오디오를 직접 전송해 정밀한 고음질을 담아낸다. Mic 3는 최대 4개의 송신기와 8개의 수신기를 동시에 연결할 수 있으며(추가 송신기와 수신기는 별도 판매), 그룹 인터뷰나 멀티 카메라 촬영에서도 모든 기기에서 선명한 오디오를 확보해 후반 작업을 한층 수월하게 한다. 쿼드라포닉(Quadraphonic) 모드에서는 DJI Mic 3 리시버를 특정 소니 카메라나 컴퓨터 소프트웨어와 연동해 네 개의 오디오 트랙을 독립적으로 출력할 수 있어, 정밀한 트랙 분리와 유연한 믹싱을 가능하게 하며 후반 제작에서 더욱 넓은 창작의 자유를 제공한다. Mic 3는 대규모 박람회나 스포츠 경기장과 같은 복잡한 환경에서도 최대 400m에 이르는 송신 범위와 간섭 저항 전송 성능을 제공한다. 또한 2.4GHz와 5GHz 대역 간 자동 주파수 전환을 통해 안정적인 전송을 지원한다. 내장형 녹음 기능은 무선 장애나 장비 이슈로 인한 오디오 손실을 방지한다. DJI Mic 3는 오리지널 트랙과 알고리즘 보정 트랙을 동시에 저장하는 듀얼 파일 내부 레코딩(Dual-file internal recording)을 지원해 창작의 유연성을 제공하고 후반 작업을 간소화한다. 또한 24-bit 또는 32-bit Float 포맷을 지원해 폭넓은 다이내믹 레인지를 구현하며, 복잡한 음향 환경에서도 속삭임부터 고함까지 모든 음성의 뉘앙스를 정밀하게 포착할 수 있다. 송신기에 탑재된 고정밀 타임코드 기능은 내장 녹음 시 타임코드 데이터를 함께 기록하며, 24시간 동안 1프레임 이내의 오차 범위를 유지해 멀티 카메라 환경에서도 영상과 오디오를 정확히 동기화하고 후반 제작에서 손쉬운 편집을 지원한다. DJI Mic 3는 완충 시 송신기는 최대 8시간, 수신기는 최대 10시간까지 사용할 수 있으며, 충전 케이스를 이용하면 2.4회 완충으로 총 28시간까지 연장된다. 5분 고속 충전으로 2시간 사용이 가능하고, 50분이면 완전 충전이 완료된다. 또한 다양한 절전 기능을 갖춰 재충전 빈도를 줄여준다. 예를 들어 ‘자동 절전(Auto Power-Savings)’ 기능은 사용하지 않을 때 송신기와 수신기를 절전 모드로 전환하고, ‘자동 전원 차단(Auto Power-Off)’ 기능은 일정 시간 미사용 시 전원을 꺼 배터리 소모를 최소화한다. DJI Mic 3는 DJI 오즈모오디오(OsmoAudio) 생태계에 직접 연결되어 오즈모 360(Osmo 360), 오즈모 액션 5 프로(Osmo Action 5 Pro), 오즈모 액션 4(Osmo Action 4), 오즈모 포켓 3(Osmo Pocket 3) 등 DJI 주요 제품에 수신기 없이 바로 연결할 수 있으며, 프리미엄 오디오를 제공하는 동시에 장비 구성을 최소화하고 크리에이터의 워크플로를 단순화한다. 또한 락킹 3.5mm TRS 출력 포트, 3.5mm TRRS 모니터링 포트, USB-C 포트를 갖춰 다양한 외부 장비와 유선 연결이 가능하며, 스마트폰에는 블루투스를 통해 수신기 없이 바로 연결할 수 있다. DJI Mic3는 DJI 스토어 및 공인 판매처로부터 주문할 수 있다. 송신기 2개 + 수신기 1개 + 충전 케이스 구성은 46만 9000원, 송신기 1개 + 수신기 1개 구성은 26만 5000원이다. DJI Mic 3 수신기와 송신기는 각각 16만 3000원과 14만 2000원에 별도 구매할 수 있으며, DJI Mic 3 충전 케이스는 10만 7000원에 판매된다. DJI의 크리스티나 장(Christina Zhang) 기업 전략 부문 수석 이사는 “DJI Mic 3는 지금까지 볼 수 없었던 컴팩트한 외형에 프리미엄 오디오 품질과 스마트 기능을 결합한 제품”이라면서, “다양한 환경, 여러 피사체, 다양한 장비를 이용하는 환경에 맞춰 오디오를 자유롭게 담을 수 있도록 다재다능한 디자인을 갖췄다. 또, 인텔리전트 기능들을 이용해 누구나 간편하게 선명하고 풍부한 사운드를 담아내어 창작의 과정을 한층 매끄럽게 해주는 것이 특징”이라고 밝혔다.
작성일 : 2025-08-29
IBM-AMD, 양자·AI·HPC 융합한 차세대 컴퓨팅 개발 협력
IBM과 AMD는 양자 컴퓨터와 HPC(고성능 컴퓨팅)를 결합한 차세대 컴퓨팅 아키텍처인 양자 중심 슈퍼컴퓨팅(quantum-centric supercomputing) 개발 계획을 발표했다. IBM은 고성능의 양자 컴퓨터 및 소프트웨어 개발에서의 리더십을, AMD는 HPC 및 AI 가속기 분야의 리더십을 바탕으로 확장 가능하고 오픈소스 기반의 플랫폼을 공동 개발해 컴퓨팅의 미래를 재정의하고자 한다. 양자 컴퓨팅은 정보를 표현하고 처리하는 방식에서 기존 컴퓨터와 완전히 다르다. 기존 컴퓨터는 0과 1의 비트로 정보를 처리하지만, 양자 컴퓨터는 양자역학의 법칙에 따라 정보를 표현하는 큐비트(qubit)를 사용한다. 이러한 특성은 신약 개발, 소재 탐색, 최적화, 물류 등 기존 컴퓨팅으로는 해결이 어려운 복잡한 문제에 대한 해결책을 탐색할 수 있는 연산 능력을 제공한다. 양자 중심 슈퍼컴퓨팅 아키텍처에서는 양자 컴퓨터가 CPU, GPU, 기타 컴퓨팅 엔진으로 구성된 HPC 및 AI 인프라와 함께 작동한다. 이 하이브리드 접근 방식에서는 문제의 각 요소를 가장 적합한 컴퓨팅 방식으로 해결한다. 예를 들어, 미래에는 양자 컴퓨터가 원자와 분자의 행동을 시뮬레이션하고, AI 기반의 슈퍼컴퓨터가 방대한 데이터 분석을 수행할 수도 있다. 이런 기술이 결합되면 현실 세계의 문제를 더욱 빠른 속도와 큰 규모로 해결할 수 있을 것으로 기대된다. IBM과 AMD는 AMD의 CPU, GPU, FPGA(프로그래밍이 가능한 반도체)를 IBM의 양자 컴퓨터와 통합해 기존 컴퓨팅 방식으로는 해결할 수 없는 새로운 알고리즘을 효율적으로 가속화하는 방안을 모색하고 있다. 이는 IBM이 2030년까지 실현하고자 하는 오류 내성 양자 컴퓨터(fault-tolerant quantum computing) 로드맵에도 기여할 수 있다. AMD의 기술은 오류 내성 양자 컴퓨팅의 핵심 요소인 실시간 오류 수정 기능을 제공할 수 있는 가능성을 지니고 있다. 양사는 올해 말 IBM의 양자 컴퓨터와 AMD 기술이 함께 작동하는 하이브리드 양자-클래식 연계 프로젝트 시연을 계획하고 있으며, IBM 키스킷(Qiskit)과 같은 오픈소스 생태계를 활용해 새로운 알고리즘 개발과 채택을 촉진하는 방안도 함께 검토 중이다. IBM의 아빈드 크리슈나(Arvind Krishna) 회장 겸 CEO는 “양자 컴퓨팅은 자연 세계를 시뮬레이션하고 정보를 완전히 새로운 방식으로 표현할 수 있다. IBM의 양자 컴퓨터와 AMD의 고성능 컴퓨팅 기술을 결합함으로써 기존 컴퓨팅의 한계를 뛰어넘는 강력한 하이브리드 모델을 구축할 수 있을 것”이라고 말했다. AMD의 리사 수(Lisa Su) CEO는 “HPC는 세계의 주요 과제를 해결하는 기반이 된다. IBM과의 협력을 통해 고성능 컴퓨팅과 양자 기술의 융합을 모색함으로써, 우리는 혁신과 발견을 가속화할 수 있는 엄청난 기회를 마주하고 있다”고 밝혔다.
작성일 : 2025-08-27
엔비디아, "AI와 디지털 트윈으로 물리적 프로토타입 없는 제조 혁신 이끈다"
엔비디아는 글로벌 컴퓨터 그래픽 콘퍼런스인 ‘시그라프(SIGGRAPH) 2025’에서, 아마존 디바이스 앤 서비스(Amazon Devices & Services)가 엔비디아 디지털 트윈 기술을 활용해 제조 분야의 혁신을 이끌고 있다고 밝혔다. 아마존 디바이스 생산 시설에 이달 도입된 이 설루션은 시뮬레이션 우선 접근 방식을 적용한 ‘제로 터치(zero-touch)’ 제조 방식을 구현했다. 제로 터치의 핵심은 로봇 팔이 다양한 장비의 제품 품질을 자율적으로 검사하고, 새로운 제품을 생산 라인에 통합하도록 훈련하는 과정 전체를 하드웨어 변경 없이 합성 데이터를 기반으로 수행하는 것이다. 이를 위해 아마존 디바이스가 자체 개발한 조립 라인 공정 시뮬레이션 소프트웨어와 엔비디아 기술 기반의 디지털 트윈을 결합했다. 모듈형 AI 기반 워크플로를 통해 기존보다 더 빠르고 효율적인 검사를 진행하며, 제조업체의 워크플로를 간소화해 신제품을 소비자에게 전달하는 시간을 줄일 수 있다는 것이 엔비디아의 설명이다.     또한, 이 설루션은 공장 작업대와 장비의 사실적인 물리 기반 표현에 기반한 합성 데이터를 생성해 로봇 운영을 위한 ‘제로샷(zero-shot)’ 제조를 가능하게 한다. 공장에 특화된 데이터는 시뮬레이션과 실제 작업 환경에서 AI 모델의 성능을 높이는 데에 쓰이며, 시뮬레이션과 실제 작업 환경에서의 AI 모델 성능 격차를 최소화할 수 있다. 엔비디아는 “제로샷 제조를 통해 물리적 프로토타입 없이도 다양한 제품과 생산 공정을 유연하게 처리할 수 있는 범용 제조 시대를 향한 중요한 도약을 이뤄냈다”고 평가했다. 아마존 디바이스 앤 서비스는 디지털 트윈 환경에서 로봇을 훈련시켜 새로운 장비를 인식하고 다루도록 한다. 이를 통해 소프트웨어 변경만으로 한 제품의 감사 작업에서 다른 제품으로 손쉽게 전환할 수 있으며, 더 빠르고 제어가 용이한 모듈화 제조 파이프라인을 구축했다. 이를 위해 엔비디아의 아이작(Isaac) 기술 제품군을 활용한다. 아마존은 신규 장치가 도입되면 CAD 모델을 엔비디아 옴니버스(Omniverse) 플랫폼 기반의 오픈소스 로보틱스 시뮬레이션 애플리케이션인 엔비디아 아이작 심(Sim)에 적용한다. 아이작 심은 각 장치의 CAD 모델을 통해 물체 및 결함 탐지 모델 훈련에 필수인 5만 개 이상의 합성 이미지를 생성한다. 이후 엔비디아 아이작 ROS를 활용해 제품 취급을 위한 로봇 팔 궤적을 생성하고 조립부터 테스트, 포장, 검사까지 모든 과정을 구성한다. 로봇이 작업 환경을 이해하고 충돌 없는 궤적을 생성하는 데에는 엔비디아 젯슨 AGX 오린(Jetson AGX Orin) 모듈에서 실행되는 쿠다(CUDA) 가속 동작 계획 라이브러리 엔비디아 cu모션(cuMotion)이 사용된다. 또한, 500만 개의 합성 이미지로 훈련된 엔비디아의 파운데이션 모델 파운데이션포즈(FoundationPose)는 로봇이 장비의 정확한 위치와 방향을 파악하도록 돕는다. 파운데이션포즈는 사전 노출 없이도 새로운 물체에 맞춰 일반화할 수 있어, 모델 재훈련 없이 다양한 제품 간의 원활한 전환을 가능하게 한다. 한편, 이 기술을 더욱 빠르게 개발하기 위해 아마존 디바이스 앤 서비스는 AWS 배치(Batch)와 아마존 EC2 G6 인스턴스를 통해 분산 AI 모델 훈련을 수행했으며, 생성형 AI 서비스인 아마존 베드록(Bedrock)으로 제품 사양 문서를 분석해 공장 내 고수준 작업과 특정 검사 테스트 사례를 계획했다. 아마존 베드록 에이전트코어(Bedrock AgentCore)는 생산 라인 내 다중 공장 작업대를 위한 자율 워크플로 계획에 사용되며, 3D 설계와 표면 특성 등 멀티모달 제품 사양 입력을 처리할 수 있다.
작성일 : 2025-08-18
오라클, OCI 생성형 AI 서비스에 구글 제미나이 모델 제공
오라클과 구글 클라우드는 구글의 최신 AI 모델인 제미나이(Gemini) 2.5부터 오라클 클라우드 인프라스트럭처(OCI) 생성형 AI 서비스를 통해 제공한다고 발표했다. 이를 통해 오라클 고객은 멀티모달 이해, 고급 코딩 및 소프트웨어 개발, 생산성과 업무 프로세스 자동화, 연구 및 지식 검색 등 다양한 활용 사례에서 AI 에이전트를 구축할 수 있게 됐다. 또한, 오라클과 구글 클라우드는 AI 관련 분야에서 협력을 강화할 계획이다. 오라클은 구글 클라우드의 버텍스 AI(Vertex AI)와의 새로운 통합을 통해 비디오 및 이미지, 음성,·음악 생성용 최첨단 모델과 MedLM 같은 산업 특화 모델을 포함한 제미나이 전체 모델 제품군을 OCI 생성형 AI 서비스에서 제공할 계획이다. 또한, 오라클 퓨전 클라우드 애플리케이션(Fusion Cloud Applications) 내에서도 버텍스 AI 기반 제미나이 모델을 선택 옵션으로 제공해, 금융 및 인사, 공급망, 영업, 서비스, 마케팅 등 주요 업무 프로세스에 AI 기능을 강화할 수 있도록 더 폭넓은 선택지를 제공할 예정이다. 오라클 고객은 보유 중인 오라클 유니버설 크레딧(Oracle Universal Credits)으로 제미나이 모델을 바로 사용할 수 있다. 구글 제미나이 모델은 최신성을 위해 구글 검색 데이터를 기반으로 응답을 보강하는 기능과 대규모 맥락 창(context windows), 강력한 암호화와 데이터 프라이버시 정책, 그리고 우수한 추론 능력을 앞세워 엔터프라이즈 환경에서 높은 성능을 발휘할 수 있게 했다. 오라클은 기업 데이터와 가까운 곳에서 최신 AI 기술을 제공하며, 보안 및 유연성, 확장성을 우선시한다. 이를 통해 산업 전반의 기업 고객이 생성형 AI와 에이전틱 AI를 적합한 비즈니스 시나리오에 즉시 적용할 수 있도록 돕는다. 또 전 세계 수천 명의 AI 개발자와 기업이 OCI의 경제적이고 특화된 AI 인프라를 활용해 대규모 및 고난도 AI 워크로드를 더 빠르게 실행하고 있다. OCI 베어메탈 GPU 인스턴스는 생성형 AI, 자연어 처리(NLP), 컴퓨터 비전, 추천 시스템 같은 애플리케이션을 구동할 수 있다. 구글 클라우드의 토마스 쿠리안(Thomas Kurian) CEO는 “선도적인 기업들은 이미 제미나이를 활용해 다양한 산업과 업무에서 AI 에이전트를 구동하고 있다”면서, “이제 오라클의 기업 고객은 오라클 환경에서 구글 클라우드의 대표 모델에 접근할 수 있어, 개발자 지원과 데이터 통합 작업 간소화, 그 외 다양한 기능을 수행하는 강력한 AI 에이전트를 배포하는 일을 훨씬 쉽게 시작할 수 있다”고 말했다. 오라클 클라우드 인프라스트럭처의 클레이 마고요크 사장은 “오라클은 기업 고객을 위해 엄선한 다양한 AI모델 선택지를 전략적으로 제공해 왔으며, 여기에는 공개 모델과 독점 모델이 모두 포함된다”라며, “OCI 생성형 AI 서비스에서 제미나이를 제공하는 것은 고객이 혁신을 추진하고 비즈니스 목표를 달성할 수 있도록 강력하고 안전하며 비용 효율적인 AI 설루션을 제공하겠다는 오라클의 의지를 반영하는 것”이라고 전했다.
작성일 : 2025-08-18
오픈소스 LLM 모델 젬마 3 기반 AI 에이전트 개발해 보기
BIM 칼럼니스트 강태욱의 이슈 & 토크   이번 호에서는 최근 이슈인 AI 에이전트(agent) 개발 시 필수적인 함수 호출(function call) 방법을 오픈소스를 이용해 구현해 본다. 이를 위해 구글에서 공개한 젬마 3(Gemma 3) LLM(대규모 언어 모델)과 역시 오픈소스인 LLM 관리도구 올라마(Ollama)를 활용하여 간단한 AI 에이전트를 로컬 PC에서 개발해본다. 아울러, 이런 함수 호출 방식의 한계점을 개선하기 위한 설루션을 나눔한다.   ■  강태욱 건설환경 공학을 전공하였고 소프트웨어 공학을 융합하여 세상이 돌아가는 원리를 분석하거나 성찰하기를 좋아한다. 건설과 소프트웨어 공학의 조화로운 융합을 추구하고 있다. 팟캐스트 방송을 통해 이와 관련된 작은 메시지를 만들어 나가고 있다. 현재 한국건설기술연구원에서 BIM/ GIS/FM/BEMS/역설계 등과 관련해 연구를 하고 있으며, 연구위원으로 근무하고 있다. 페이스북 | www.facebook.com/laputa999 블로그 | http://daddynkidsmakers.blogspot.com 홈페이지 | https://dxbim.blogspot.com 팟캐스트 | www.facebook.com/groups/digestpodcast   이번 호의 글은 다음 내용을 포함한다. AI 에이전트 구현을 위한 사용자 도구 함수 호출 방법 올라마를 통한 젬마 3 사용법 채팅 형식의 프롬프트 및 메모리 사용법 그라디오(Gradio) 기반 웹 앱 개발   그림 1. AI 에이전트 내부의 함수 호출 메커니즘(Akriti, 2025)   이 글의 구현 코드는 다음 링크에서 확인할 수 있다. AI_agent_simple_function_call   젬마 3 모델의 특징 젬마 3는 구글이 개발해 2025년 3월 10일에 출시한 LLM이다. 차세대 경량 오픈 멀티모달 AI 모델로, 텍스트와 이미지를 동시에 처리할 수 있는 기능을 갖추고 있다. 이 모델은 다양한 크기와 사양으로 제공되어 단일 GPU 또는 TPU 환경에서도 실행 가능하다. 젬마 3는 1B, 4B, 12B, 27B의 네 가지 모델 크기로 제공되며, 각각 10억, 40억, 120억, 270억 개의 파라미터를 갖추고 있다. 1B 모델은 텍스트 전용으로 32K 토큰의 입력 컨텍스트를 지원하고, 4B/12B/27B 모델은 멀티모달 기능을 지원하며 128K 토큰의 입력 컨텍스트를 처리할 수 있다. 이는 이전 젬마 모델보다 16배 확장된 크기로, 훨씬 더 많은 양의 정보를 한 번에 처리할 수 있게 해 준다. 이 모델은 텍스트와 이미지 데이터를 동시에 처리하고 이해하는 멀티모달 기능을 제공한다. 이미지 해석, 객체 인식, 시각적 질의응답 등 다양한 작업을 수행할 수 있으며, 텍스트 기반 작업에 시각적 정보를 효과적으로 활용할 수 있도록 지원한다.   그림 2. 출처 : ‘Welcome Gemma 3 : Google's all new multimodal, multilingual, long context open LLM(Hugging Face)’   그림 3. 출처 : ‘Welcome Gemma 3 : Google's all new multimodal, multilingual, long context open LLM(Hugging Face)’   젬마 3는 140개 이상의 언어를 지원하여 전 세계 다양한 언어 사용자를 대상으로 하는 AI 애플리케이션 개발에 매우 유리하다. 사용자는 자신의 모국어로 젬마 3와 상호작용할 수 있으며, 다국어 기반의 텍스트 분석 및 생성 작업도 효율적으로 수행할 수 있다. 이 모델은 다양한 작업 수행 능력을 갖추고 있다. 질문–답변, 텍스트 요약, 논리적 추론, 창의적인 텍스트 형식 생성(시, 스크립트, 코드, 마케팅 문구, 이메일 초안 등), 이미지 데이터 분석 및 추출 등 광범위한 자연어 처리 및 컴퓨터 비전 관련 작업을 수행할 수 있다. 또한, 함수 호출 및 구조화된 출력을 지원하여 개발자가 특정 작업을 자동화하고 에이전트 기반의 경험을 구축하는 데 도움을 준다. 젬마 3는 다양한 도구 및 프레임워크와 원활하게 통합된다. Hugging Face Transformers, Ollama, JAX, Keras, PyTorch, Google AI Edge, UnSloth, vLLM, Gemma. cpp 등 다양한 개발 도구 및 프레임워크와 호환되어 개발자들이 자신이 익숙한 환경에서 젬마 3를 쉽게 활용하고 실험할 수 있다. 이 모델은 다양한 벤치마크 테스트에서 동급 모델 대비 최첨단 성능을 입증했다. 특히, Chatbot Arena Elo Score에서 1338점을 기록하며, 여러 오픈 소스 및 상용 모델보다 높은 성능을 보였다.  젬마 3는 오픈 모델로, 개방형 가중치를 제공하여 사용자가 자유롭게 조정하고 배포할 수 있다. 캐글(Kaggle)과 허깅 페이스(Hugging Face)에서 다운로드 가능하며, Creative Commons 및 Apache 2.0 라이선스를 따름으로써 개발자와 연구자에게 VLM 기술에 대한 접근성을 높여준다.   개발 환경 개발 환경은 다음과 같다. 미리 설치 및 가입한다. 오픈 LLM 관리 도구 올라마 : https://ollama.com/download/ windows LLM 모델 젬마 3 : https://ollama.com/search dashboard 웹 검색 도구 Serper 서비스 가입 : https://serper.dev/ 설치되어 있다면 다음 명령을 터미널(윈도우에서는 도스 명령창)에서 실행한다. ollama pull gemma3:4b     ■ 자세한 기사 내용은 PDF로 제공됩니다.
작성일 : 2025-08-04
한국컴퓨터그래픽스학회, 2025 학술대회 및 여름학교 통해 최신 컴퓨터 그래픽스 연구 성과 공유
한국컴퓨터그래픽스학회는 7월 8일부터 11일까지 강원도 고성 델피노 리조트에서 2025 학술대회 및 여름학교를 진행했다고 전했다. ‘Generating Worlds, Rendering Reality’를 주제로 열린 이번 행사에는 학계, 산업계, 학생 등 약 410여 명이 참석해 컴퓨터 그래픽스 및 관련 분야의 최신 연구 성과와 기술을 공유하며 교류의 장을 펼쳤다.     이번 학술대회에서는 국내외 저명 연사들의 초청강연을 비롯해 다양한 논문 및 포스터 발표 세션, 산업체 특별세션, 대학 및 산업체 전시, 여름학교 프로그램 등이 함께 진행되며 참가자들로부터 호응을 얻었다. 첫 번째 초청강연에서는 정보통신기획평가원(IITP) 홍진배 원장이 ‘AX 2.0 시대, 우리의 준비’를 주제로 물리 AI(physical AI)를 포함한 국가 인공지능 전략기술의 발전 방향을 제시했다. 이어 오스템임플란트 최규옥 회장은 ‘의료 IT가 여는 스마트 병원의 미래’를 주제로 AI 기반 진료 시스템의 실제 도입 사례를 소개하고 의료 산업의 디지털 전환 가능성을 조망했다. 아시아그래픽스협회와의 연계로 초청된 중국 베이징대학교 왕펑솨이(Peng-Shuai Wang) 교수는 ‘통합형 3D 표현 및 학습’에 관한 최신 연구 성과를 발표했다. 아시아그래픽스협회는 2015년 창립된 이래 아시아 지역 컴퓨터 그래픽스 및 상호작용 기술 분야 연구자 간 교류와 협력을 촉진해온 전문 기관이다. 한국컴퓨터그래픽스학회는 “이번 초청은 한국컴퓨터그래픽스학술대회에서 처음으로 이루어진 아시아그래픽스협회와의 공식 연계 프로그램으로, 한·중 젊은 연구자 간 활발한 학술 교류와 협력의 가능성을 여는 계기가 되었다”고 설명했다. 또한 KAIST 박용근 교수는 라벨이 없는 3D 이미지와 AI 기반 조직 분석 기법을 활용한 다양한 응용 가능성을 제시했으며, GengenAI 조호진 대표는 합성 데이터 기반 산업용 AI 적용 사례를 발표했다. 이외에 이번 행사에서는 우수논문상 시상과 함께 공로패 수여식도 진행되었으며, 학회의 산학 협력 활성화와 발전에 기여해 온 서울대학교 신영길 교수가 공로패를 수상했다. 한국컴퓨터그래픽스학회의 최수미 학회장은 “이번 행사는 차세대 컴퓨터 그래픽스 및 인터랙션 기술을 선도할 인재 양성과 산학연관의 연구 협력 촉진에 있어 매우 뜻깊은 자리였다”면서, “앞으로도 국내외 학술 교류의 장을 지속적으로 확대해 나갈 계획”이라고 전했다.
작성일 : 2025-07-14
3D 시뮬레이션 소프트웨어, FlexSim
주요 디지털 트윈 소프트웨어   3D 시뮬레이션 소프트웨어, FlexSim   개발 : 오토데스크, www.autodesk.com, www.flexsim.com 자료제공 : 오토데스크코리아, www.autodesk.co.kr 오토데스크(Autodesk)는 건축, 엔지니어링, 제조, 미디어 및 엔터테인먼트 산업을 위한 설계 및 엔지니어링 소프트웨어를 제공하는 글로벌 선도 기업으로, 1982년에 설립되었다. 오토캐드(AutoCAD)와 같은 혁신적인 CAD(컴퓨터 지원 설계) 소프트웨어로 시작해, 현재는 3D 설계, 시뮬레이션, 시각화, BIM(빌딩 정보 모델링) 및 클라우드 기반 협업 도구까지 폭넓은 솔루션을 제공 중이며, 창의성과 효율성을 향상시키는 기술로 고객의 설계 및 제작 방식을 혁신하며 지속 가능한 미래를 지원하는 데 중점을 두고 있다.  1. FlexSim AutoCAD(오토캐드), Inventor(인벤터), Fusion(퓨전)과 같은 오토데스크 설계 도구는 이미 업계에서 널리 알려져 있으나 더 나아가 최근에는 오토데스크가 새롭게 출시한 소프트웨어 FlexSim(플렉심)이 주목받고 있다. FlexSim은 오토데스크에 인수합병된 이후 산업계에서 큰 관심을 끌고 있으며, 3D 시뮬레이션 소프트웨어로, 제조, 물류, 헬스케어 등 다양한 산업에서 시스템 성능을 분석하고 최적화하는데 사용되고 있다.   2. 주요 특징 ■ 3D 비주얼 시뮬레이션  플렉스심(FlexSim)은 실제 시스템을 시각적으로 표현하여 복잡한 공정이나 프로세스를 쉽게 이해할 수 있게 한다. 직관적인 3D 모델은 비전문가도 공정의 흐름과 병목 현상을 쉽게 파악할 수 있다. ■ 사용자 친화적인 인터페이스  드래그 앤 드롭 방식의 모델링 기능을 제공하며, 프로그래밍 지식 없이도 사용할 수 있다. 이는 초보자부터 전문가까지 모두가 쉽게 접근할 수 있는 환경을 제공해서 편리하다. ■ 강력한 분석 기능  FlexSim은 다양한 데이터와 통계 분석 도구를 통해 병목 현상을 식별하고 생산성을 최적화할 수 있도록 지원한다. 예측 모델링과 성능 평가를 통해 운영상의 문제를 사전에 해결할 수 있다. ■ 유연한 확장성  맞춤형 스크립트와 플러그인을 통해 필요한 기능을 추가할 수 있다. 이는 기업이 자신의 특화된 요구에 맞게 소프트웨어를 최적화할 수 있음을 의미한다. ■ 다양한 산업 적용  FlexSim은 제조 라인, 창고 운영, 병원 프로세스 등 다양한 분야에서 활용되고 있다. 이를 통해 기업은 운영 효율성을 높이고 비용을 절감할 수 있다.  3. 향후 전망 FlexSim은 단순히 시스템을 시뮬레이션하는 도구를 넘어 시스템의 효율성을 높이고 개선점을 찾는데 필수적인 솔루션으로 자리 잡고 있다. 실제 데이터를 기반으로 한 시뮬레이션은 더 나은 의사결정을 가능하게 하고, 산업의 경쟁력을 강화한다.  오토데스크의 FlexSim은 혁신적인 기술과 실용성을 겸비하여 다양한 산업에서 필수적인 도구이다. 복잡한 시스템의 이해와 최적화를 원하는 기업이라면, FlexSim을 통해 새로운 가능성을 탐색해 보기 바란다.     상세 내용은 <디지털 트윈 가이드>에서 확인할 수 있습니다. 상세 내용 보러가기
작성일 : 2025-07-13
파이썬 버전 라이브러리 p5 기반 3D 데이터 시각화
BIM 칼럼니스트 강태욱의 이슈 & 토크   이번 호에서는 컴퓨터 그래픽스 분야에서 유명한 프로세싱(processing) 도구를 파이썬(Python)으로 포팅한 p5를 알아보고, 이를 이용한 데이터셋 3D 가시화 방법을 확인해 본다. 또한 관련된 개발 프로세스를 이해하는 데 도움이 되는 간단한 예제를 설치, 코딩 및 실행하는 방법을 다룬다.   ■ 강태욱 건설환경 공학을 전공하였고 소프트웨어 공학을 융합하여 세상이 돌아가는 원리를 분석하거나 성찰하기를 좋아한다. 건설과 소프트웨어 공학의 조화로운 융합을 추구하고 있다. 팟캐스트 방송을 통해 이와 관련된 작은 메시지를 만들어 나가고 있다. 현재 한국건설기술연구원에서 BIM/ GIS/FM/BEMS/역설계 등과 관련해 연구를 하고 있으며, 연구위원으로 근무하고 있다. 페이스북 | www.facebook.com/laputa999 블로그 | http://daddynkidsmakers.blogspot.com 홈페이지 | https://dxbim.blogspot.com 팟캐스트 | www.facebook.com/groups/digestpodcast   그림 1. p5 데모   실행 가능한 소스 코드는 다음 링크에서 다운로드할 수 있다. 깃허브 : https://github.com/mac999/llm-media-art-demo   p5 소개 p5 Python은 JavaScript 라이브러리 p5.js와 컴퓨터 그래픽 미디어아트에서 자주 사용되는 processing.org에서 영감을 받아 창의적인 코딩을 위해 설계된 라이브러리이다. 2D 및 3D 모두에서 그래픽, 애니메이션 및 대화형 프로그램을 구축하기 위한 간단한 API를 제공한다. p5는 파이썬을 지원하므로 pandas, numpy, 딥러닝 관련 라이브러리를 함께 사용해 가시화하기 편리하다.   그림 2   기본적으로 `p5py`는 `setup()`과 `draw()` 함수를 중심으로 프로그램의 구조를 구성한다. `setup()` 함수는 초기 설정을 담당하며, `draw()` 함수는 프레임마다 반복 호출되어 애니메이션이나 실시간 그래픽 표현을 가능하게 한다. 이를 통해 반복적이거나 시간 기반의 시각적 표현이 용이하게 된다. 그래픽 요소의 생성 및 조작이 매우 직관적이다. 예를 들어, `circle()`, `rect()`, `line()` 등의 함수는 간단한 인자 전달만으로 기본 도형을 화면에 출력할 수 있게 하며, `fill()`, `stroke()`, `background()` 등은 색상과 스타일 설정을 손쉽게 조절할 수 있게 한다. 마우스와 키보드 입력을 처리하기 위한 이벤트 함수도 포함되어 있다. `mousePressed()`, `keyPressed()` 등은 사용자와의 인터랙션을 가능하게 하며, 이를 통해 인터랙티브 아트, 시각적 피드백, 교육용 시뮬레이션 등을 손쉽게 개발할 수 있다. 이미지, 사운드, 텍스트 등 다양한 멀티미디어 요소도 지원한다. 이미지 로딩 및 출력은 `loadImage()`와 `image()`로, 텍스트 출력은 `text()`로 구현되며 각각의 요소는 다양한 좌표 기반 조정이 가능하다. 또한, NumPy와 같은 파이썬 과학계산 생태계와도 호환이 가능하여, 복잡한 수학적 계산이나 데이터 시각화 작업에 활용할 수 있는 확장성이 있다. 전반적으로 p5py는 예술가, 디자이너, 교육자, 프로그래밍 입문자를 위한 시각 중심의 프로그래밍 도구로서, 단순한 문법과 풍부한 기능을 통해 창의적 프로토타이핑을 효율적으로 지원하는 라이브러리이다. 상세한 내용은 다음 링크를 참고한다. https://github.com/p5py/p5 https://p5.readthedocs.io/en/latest/install.html   p5 Python 설치 시작하려면 컴퓨터에 파이썬이 설치되어 있어야 한다. 다음 단계에 따라 필요한 라이브러리를 설정한다.   1단계 : 파이썬 설치 파이썬 3.11이 설치되어 있는지 확인한다. 없다면 python.org에서 다운로드한다.   2단계 : p5 설치 pip를 사용하여 p5를 설치한다. pip install p5   3단계 : pandas 설치 CSV 파일을 처리하려면 라이브러리를 설치한다. pip install pandas   4단계 : 설치 라이브러리 검사 터미널에서 다음의 명령을 입력해 제대로 설치되었는지 확인한다. python -c "import p5" python -c "import pandas"     ■ 자세한 기사 내용은 PDF로 제공됩니다.
작성일 : 2025-07-01