• 회원가입
  • |
  • 로그인
  • |
  • 장바구니
  • News
    뉴스 신제품 신간 Culture & Life
  • 강좌/특집
    특집 강좌 자료창고 갤러리
  • 리뷰
    리뷰
  • 매거진
    목차 및 부록보기 잡지 세션별 성격 뉴스레터 정기구독안내 정기구독하기 단행본 및 기타 구입
  • 행사/이벤트
    행사 전체보기 캐드앤그래픽스 행사
  • CNG TV
    방송리스트 방송 다시보기 공지사항
  • 커뮤니티
    업체홍보 공지사항 설문조사 자유게시판 Q&A게시판 구인구직/학원소식
  • 디렉토리
    디렉토리 전체보기 소프트웨어 공급업체 하드웨어 공급업체 기계관련 서비스 건축관련 업체 및 서비스 교육기관/학원 관련DB 추천 사이트
  • 회사소개
    회사소개 회사연혁 출판사업부 광고안내 제휴 및 협력제안 회사조직 및 연락처 오시는길
  • 고객지원센터
    고객지원 Q&A 이메일 문의 기사제보 및 기고 개인정보 취급방침 기타 결제 업체등록결제
  • 쇼핑몰
통합검색 "음성"에 대한 통합 검색 내용이 742개 있습니다
원하시는 검색 결과가 잘 나타나지 않을 때는 홈페이지의 해당 게시판 하단의 검색을 이용하시거나 구글 사이트 맞춤 검색 을 이용해 보시기 바랍니다.
CNG TV 방송 내용은 검색 속도 관계로 캐드앤그래픽스 전체 검색에서는 지원되지 않으므로 해당 게시판에서 직접 검색하시기 바랍니다
엔비디아, 한국 AI 인프라·생태계 구축 협력… “GPU 26만 개 이상 추가 도입”
엔비디아가 대한민국 정부 및 기업들과 협력해 클라우드와 AI 팩토리를 중심으로 25만 개 이상의 GPU를 포함하는 전국 규모의 AI 인프라 확장 계획을 발표했다. 이번 인프라는 공공과 민간 부문이 함께 구축하며, 자동차, 제조, 통신 등 한국 주요 산업 전반의 AI 기반 혁신과 경제 성장을 견인할 핵심 토대가 될 예정이다. 이번 계획은 세계 각국 정상이 APEC 정상회의 참석을 위해 한국에 모인 가운데 발표됐다.  과학기술정보통신부는 기업과 산업 전반의 독자 AI 개발을 가속화하기 위해 최신 엔비디아 GPU 5만 개 도입을 추진 중이라고 밝혔다. AI 인프라 구축은 엔비디아 클라우드 파트너인 네이버 클라우드와 NHN클라우드, 카카오가 국가 독자 클라우드 내 컴퓨팅 인프라를 확장하기 위해 엔비디아 블랙웰(Blackwell) 등 GPU 1만 3000 개를 초기 도입하는 것을 시작으로, 향후 국가 AI컴퓨팅센터 구축 등을 통해 수년간 점진적으로 확대될 예정이다. 이 AI 인프라는 연구기관, 스타트업, AI 기업이 모델과 애플리케이션을 개발할 수 있도록 개방되며, 이는 대한민국의 AI 역량 강화와 인프라 확충을 위한 국가 전략을 뒷받침하게 된다. 또한, 엔비디아는 한국의 산업계, 학계, 연구기관과 AI-RAN과 6G 인프라 개발에도 함께하고 있다. 엔비디아는 최근 삼성(Samsung), SK텔레콤(SK Telecom), 한국전자통신연구원(ETRI), KT, LG유플러스(LG U+), 연세대학교와 협력해 지능형·저전력 AI-RAN 네트워크 기술을 공동 개발 중이다. 이 기술은 GPU 연산 작업을 디바이스에서 네트워크 기지국으로 오프로딩함으로써 컴퓨팅 비용을 절감하고 배터리 수명을 연장할 수 있도록 설계됐다.     한국의 자동차, 제조, 통신 분야 선도 기업들은 엔터프라이즈와 피지컬 AI 개발을 가속화하기 위해 대규모 AI 인프라 투자와 확장을 추진하고 있다. 삼성은 GPU 5만 개 이상을 탑재한 엔비디아 AI 팩토리를 구축해 지능형 제조를 발전시키고 제품과 서비스 전반에 AI를 적용한다. 삼성은 엔비디아 네모트론(Nemotron) 사후 훈련 데이터세트, 엔비디아 쿠다-X(CUDA-X), 엔비디아 cu리소(cuLitho) 라이브러리, 엔비디아 옴니버스(Omniverse) 등 엔비디아 기술을 활용해 정교한 반도체 제조 공정의 속도와 수율을 개선하는 디지털 트윈을 구축한다. 또한 엔비디아 코스모스(Cosmos), 엔비디아 아이작 심(Isaac Sim), 엔비디아 아이작 랩(Isaac Lab)을 활용해해 가정용 로봇 개발 포트폴리오를 강화하고 있다. SK그룹은 반도체 연구·개발·생산을 고도화하고, 디지털 트윈과 AI 에이전트 개발을 지원하는 클라우드 인프라 구축을 위해 5만 개 이상의 GPU를 탑재할 수 있는 AI 팩토리를 설계하고 있다. SK텔레콤은 엔비디아 RTX PRO 6000 블랙웰 서버 에디션 GPU를 기반으로 한 소버린 인프라를 제공해, 국내 제조 기업들이 엔비디아 옴니버스를 활용할 수 있도록 지원할 계획이다. SK 텔레콤은 스타트업, 기업, 정부 기관을 대상으로 디지털 트윈과 로보틱스 프로젝트 가속화를 위한 산업용 클라우드 인프라를 제공할 예정이다. 현대자동차그룹과 엔비디아는 한층 심화된 협력 단계로 나아가며, 모빌리티, 스마트 공장, 온디바이스 반도체 전반에 걸쳐 AI 역량을 공동 개발할 예정이다. 양사는 AI 모델 훈련과 배포를 위해 5만 개의 블랙웰 GPU를 기반으로 협력을 추진한다. 또한 한국 정부의 국가 피지컬 AI 클러스터 구축 이니셔티브를 지원하기 위해, 현대자동차그룹과 엔비디아는 정부 관계자들과 긴밀히 협력해 생태계 조성을 가속화할 계획이다. 이를 통해 약 30억 달러 규모의 투자가 이루어져 한국의 피지컬 AI 산업 발전을 한층 앞당길 전망이다. 주요 이니셔티브로는 엔비디아 AI 기술 센터, 현대자동차그룹 피지컬 AI 애플리케이션 센터, 지역 AI 데이터센터 설립 등이 포함된다. 네이버 클라우드는 소버린 AI와 피지컬 AI용 인프라를 구축하기 위해 엔비디아 AI 인프라를 확장하고 있다. 이에 따라 엔비디아 RTX PRO 6000 블랙웰과 기타 엔비디아 블랙웰 GPU를 포함해 최대 6만 개의 GPU를 도입할 예정이다. 네이버 클라우드는 엔비디아 AI 인프라에서 구동되는 엔비디아 네모트론 오픈 모델을 기반으로 차세대 소버린 AI 개발의 다음 단계를 준비 중이다. 또한 네이버 클라우드는 조선, 보안 등 산업 특화 AI 모델을 개발하고, 대한민국 국민 모두를 위한 포용적 AI 구현에 주력할 계획이다. 과학기술정보통신부는 엔비디아와의 협력을 기반으로 주권 언어 모델 개발을 위한 독자 AI 파운데이션 모델(Sovereign AI Foundation Models) 프로젝트를 추진한다. 본 프로젝트는 엔비디아 네모와 오픈 엔비디아 네모트론 데이터세트를 활용해 로컬 데이터를 기반으로 추론(reasoning) 모델을 개발하고 디스틸(distilling)할 예정이다. 또한 LG AI연구원, 네이버 클라우드, NC AI, SK텔레콤, 업스테이지가 독자 모델 개발을 지원하는 프로젝트에 협력한다. 기업, 연구진, 스타트업은 이 모델 개발에 기여하고 이를 활용해 음성, 추론 등 다양한 기능을 갖춘 AI 에이전트를 개발할 수 있다. LG는 피지컬 AI 기술 개발을 촉진하고, 피지컬 AI 생태계를 지원하기 위해 엔비디아와 협력하고 있다. 양사는 LG 엑사원(EXAONE) 모델을 활용해 스타트업과 학계를 지원한다. 일례로, 암 진단을 지원하는 모나이(MONAI) 프레임워크 기반의 엑사원 패스(EXAONE Path) 의료 모델이 있다. 한국과학기술정보연구원(KISTI)은 엔비디아와 협력해 한국의 슈퍼컴퓨터 6호기 ‘한강’을 활용한 연구 협력을 촉진하기 위한 공동연구센터 설립을 추진 중이다. KISTI는 또한 양자 프로세서와 GPU 슈퍼컴퓨팅을 연결하는 엔비디아의 새로운 개방형 아키텍처 NVQ링크(NVQLink) 지원을 발표했다. 엔비디아 쿠다-Q(CUDA-Q) 플랫폼과 연동되는 NVQ링크는 KISTI가 양자 오류 정정과 하이브리드 애플리케이션 개발 등 분야의 연구를 심화해 차세대 양자-GPU 슈퍼컴퓨터 개발을 가속화할 수 있도록 지원한다. KISTI는 또한 과학 연구 개발을 위한 파운데이션 모델을 구축하고, 오픈소스 엔비디아 피직스네모(PhysicsNeMo) 프레임워크를 활용한 물리 기반 AI 모델 개발을 연구자들에게 지원할 예정이다. 엔비디아와 파트너들은 한국의 경제 발전과 기회 창출을 위해 엔비디아 인셉션(NVIDIA Inception) 프로그램으로 스타트업을 육성하는 얼라이언스를 설립한다. 얼라이언스 회원사는 SK텔레콤을 포함한 엔비디아 클라우드 파트너가 제공하는 가속 컴퓨팅 인프라를 활용할 수 있다. 또한, IMM인베스트먼트, 한국투자파트너스, SBVA 등 벤처캐피털 얼라이언스와 엔비디아 인셉션의 지원을 받게 된다. 아울러 스타트업은 엔비디아의 소프트웨어와 전문 기술 역량도 활용할 수 있게 돼, 차세대 기업들의 성장을 더욱 신속하게 추진할 수 있게 된다. 엔비디아는 스타트업을 위한 엔비디아 인셉션 프로그램의 성과를 바탕으로, 차세대 기업 지원을 위해 한국 정부와도 협력할 계획이다. 또한 중소기업벤처부에서 운영하는 ‘엔업(N-Up)’ AI 스타트업 육성 프로그램에도 참여할 예정이다. 엔비디아의 젠슨 황 CEO는 “대한민국은 기술과 제조 분야에서 선도적 입지를 갖추고 있으며, 이는 대한민국이 AI 산업 혁명의 중심에 서 있음을 보여준다. 이 산업혁명에서 가속 컴퓨팅 인프라는 전력망과 광대역만큼 중요한 기반이 되고 있다. 한국의 물리적 공장이 정교한 선박, 자동차, 반도체, 전자제품으로 세계에 영감을 주었듯, 이제는 인텔리전스라는 새로운 수출품을 생산하며 글로벌 변화를 이끌 수 있다”고 말했다. 배경훈 부총리 겸 과학기술정보통신부 장관은 “AI가 단순히 혁신을 넘어 미래 산업의 기반이 된 지금, 대한민국은 변혁의 문턱에 서 있다. 엔비디아와 함께 국가 AI 인프라를 확충하고 기술을 개발하는 것은 제조업 역량 등 한국이 보유한 강점을 더욱 강화할 수 있는 투자이며, 이는 글로벌 AI 3대 강국을 향한 대한민국의 번영을 뒷받침할 것”이라고 말했다.
작성일 : 2025-10-31
어도비, ‘파이어플라이’로 AI 창작 혁신 가속화
어도비(Adobe)가 AI 기반 창작 환경의 새로운 지평을 여는 올인원 크리에이티브 AI 스튜디오 ‘어도비 파이어플라이(Adobe Firefly)’의 대규모 업데이트를 발표했다. 이번 업데이트는 영상, 오디오, 이미지, 디자인 등 전 영역에서 아이디어 구상부터 최종 제작까지 전 과정을 지원하는 통합형 AI 창작 생태계를 구축하는 데 초점을 맞췄다. 파이어플라이는 최고의 AI 모델과 크리에이티브 툴을 단일 플랫폼·단일 가격으로 제공하는 ‘올인원 AI 크리에이티브 스튜디오’로, 복잡한 제작 과정을 단순화하고 창작 효율을 극대화하는 것이 특징이다.  이번 업데이트의 핵심 중 하나는 영상과 오디오 제작 도구의 강화다. 사운드트랙 생성(Generate Soundtrack) 기능은 상업적으로 안전한 라이선스 기반의 오리지널 AI 음악을 자동으로 영상에 동기화해 제작할 수 있도록 지원한다. 음성 생성(Generate Speech) 기능은 텍스트를 자연스러운 음성으로 변환하며, 일레븐랩스(ElevenLabs)와 협력해 다양한 언어와 감정 조절을 구현했다. 파이어플라이 비디오 에디터(Firefly Video Editor)는 웹 기반 멀티트랙 타임라인 편집기로, 영상 클립 생성, 편집, 사운드 및 자막 추가를 직관적으로 수행할 수 있다. 이미지 제작과 편집 분야에서는 더욱 정교하고 사실적인 결과물을 제공한다. 파이어플라이 이미지 모델 5(Image Model 5)는 4MP 해상도의 초고해상도 이미지 생성이 가능하며, 세밀한 질감과 디테일을 구현한다. 프롬프트로 편집(Prompt to Edit) 기능은 사용자가 일상 언어로 편집 내용을 설명하면 AI가 자동으로 수정하는 대화형 편집 기능을 지원한다. 어도비는 파이어플라이의 AI 생태계를 확장하며 크리에이터 맞춤형 모델(Custom Models)을 비공개 베타로 선보였다. 사용자는 자신이 보유한 이미지를 학습시켜 고유한 스타일의 에셋을 생성할 수 있다. 또한 구글, 루마 AI, 오픈AI, 일레븐랩스 등 주요 AI 기업의 모델과 협업해 파이어플라이 내에서 다양한 AI 엔진을 직접 활용할 수 있도록 했다. 이번 업데이트에서는 ‘프로젝트 문라이트(Project Moonlight)’도 함께 공개됐다. 이는 어도비의 앱과 크리에이터 소셜 채널 전반에서 작동하는 에이전틱 AI 기반 대화형 크리에이티브 어시스턴트로, 아이디어 발상부터 콘텐츠 인사이트 제공, 제작 가속화까지 전 과정을 지원한다. 어도비의 CTO 일라이 그린필드(Ely Greenfield)는 “파이어플라이는 아이디어 구상부터 최종 작품 완성까지 크리에이티브의 모든 여정을 지원하는 단일 공간”이라며 “최고의 AI 모델과 크리에이티브 툴을 결합해 창작자들이 더욱 빠르고 유연하게 작업할 수 있는 환경을 구축했다”고 밝혔다. 이번 업데이트를 통해 어도비는 AI 중심의 크리에이티브 워크플로우 혁신을 가속화하며, 글로벌 크리에이터 생태계 전반에 새로운 생산성과 영감을 제공할 것으로 기대된다.
작성일 : 2025-10-29
어도비, B2B 기업용 AI 에이전트로 마케팅 및 고객 경험 혁신 지원
어도비가 B2B 업계의 고객 경험 혁신을 지원하는 AI 에이전트를 발표했다. 이번 발표는 B2B 업계의 길고 복잡한 구매 사이클을 단순화해 비즈니스를 지원하는 데 초점을 맞추고 있다. 어도비의 B2B 전용 AI 에이전트 제품군은 마케팅 및 영업 팀이 보다 신속하고 효과적으로 의사결정권자를 공략할 수 있도록 지원한다. 어도비는 “시스코를 비롯한 주요 B2B 브랜드가 이미 어도비의 B2B 에이전트를 도입해 영업 및 마케팅 조직 전반의 워크플로를 고도화하고 있다”고 소개했다. 어도비 익스피리언스 플랫폼 에이전트 오케스트레이터(Adobe Experience Platform Agent Orchestrator)를 기반으로 하는 어도비의 AI 에이전트는 추론과 다중 에이전트 간 협업을 통해 고객 경험 조율을 돕는다. 어도비의 특화 에이전트는 어도비 저니 옵티마이저 B2B 에디션(Adobe Journey Optimizer B2B Edition), 어도비 커스터머 저니 애널리틱스 B2B 에디션(Adobe Customer Journey Analytics B2B Edition) 등 업계를 선도하는 엔터프라이즈 애플리케이션 내에서 직접 사용할 수 있다. 이러한 애플리케이션을 통해 마케팅 및 영업 팀은 대규모 개인화 경험을 제공할 수 있다.     어도비는 현재 사용 가능한 B2B 워크플로용 어도비 AI 에이전트도 소개했다. 저니 옵티마이저 B2B 에디션의 ‘오디언스 에이전트(Audience Agent)’는 CRM 프로필, 마케팅 활동, 웹 콘텐츠와 같은 정형, 비정형 및 자사 데이터를 분석해 마케터가 목표에 적합한 타깃 고객을 파악할 수 있도록 인사이트를 제공한다. 또한 구매 그룹 페르소나를 파악하고 자사 데이터를 기반으로 구매 그룹 구성원을 추천할 수 있다. 이렇게 도출된 인사이트를 바탕으로 에이전트는 특정 제품군에 대한 고가치 구매 그룹을 설정하며, 이를 옴니채널 여정 전반에 활용해 수요 창출을 보다 효과적으로 지원한다. 저니 옵티마이저 B2B 에디션의 ‘저니 에이전트(Journey Agent)’는 이메일, 웹, 모바일 등 다양한 채널에 걸쳐 고객 여정과 캠페인의 생성 및 조율을 간소화한다. 이 에이전트는 목표에 맞춰 여정을 생성한다. 이후 고객 이탈률 등 다양한 요소를 분석해 고객 접점을 최적화하고, 이를 통해 인사이트를 도출해 고객과의 상호작용을 개선한다. 커스터머 저니 애널리틱스 B2B 에디션의 ‘데이터 인사이트 에이전트(Data Insights Agent)’는 크로스채널 데이터를 기반으로 기업 고객 및 구매 그룹에 대한 인사이트 도출 과정을 단순화하고 확장한다. 이 에이전트는 대화형 경험을 통해 제공되며 마케팅, 영업, 제품 팀 등 보다 넓은 범위의 구성원이 고객 경험 이니셔티브를 시각화하고, 예측하며, 개선할 수 있도록 돕는다. 또한 ‘어카운트 퀄리피케이션 에이전트(Account Qualification Agent)’도 어도비 저니 옵티마이저 B2B 에디션(Adobe Journey Optimizer B2B Edition)에서 조만간 선보일 예정이다. 이를 통해 비즈니스 개발 담당자는 고객 참여 및 자격 검증을 대폭 가속화할 수 있다. 이 에이전트는 잠재 고객의 니즈, 예산, 권한, 일정 등을 평가해 유효한 영업 기회인지 판단하는 동시에, 해당 기업 고객에 대한 인사이트 요약을 담당자에게 제공한다. 조사, 문의, 분석에 걸친 프로세스 자동화를 통해 더 빠르고 매끄러운 워크플로를 생성할 수 있다. 한편, 어도비는 고객의 일상적인 검색 경험을 고도로 개인화된 맞춤형 대화 경험으로 전환할 수 있는 AI 퍼스트 애플리케이션 브랜드 컨시어지(Brand Concierge)도 곧 출시한다. 브랜드 컨시어지는 고객 참여를 지원하고 제품 탐색을 통해 고객 여정을 가속화함으로써 개인별 선호에 맞춘 상호작용을 제공하는 프로덕트 어드바이저 에이전트(Product Advisor Agent)가 포함되어 있다. 이 에이전트는 텍스트, 음성, 이미지 등 멀티 모달을 지원하며, AI 기반의 추천과 비교도 제공한다.
작성일 : 2025-10-23
삼성전자, 헤드셋 형태의 확장현실 기기 ‘갤럭시 XR’ 출시
삼성전자가 새로운 AI 경험을 제공하는 헤드셋 형태의 확장현실(XR) 기기 ‘갤럭시 XR(Galaxy XR)’을 국내 출시한다고 밝혔다. 갤럭시 XR은 삼성전자와 구글, 퀄컴이 공동 개발한 ‘안드로이드 XR(Android XR)’ 플랫폼을 탑재한 첫 번째 제품이다. 사용자는 갤럭시 XR을 통해 물리적 제한없이 확장된 3차원의 공간에서 음성, 시선, 제스처 등으로 콘텐츠와 자연스럽고 직관적인 상호작용을 할 수 있다. 삼성전자는 “‘멀티모달 AI’에 최적화된 새로운 폼팩터인 갤럭시 XR은 사용자에게 더욱 깊이 있는 몰입형 경험을 선사하고, 정보를 탐색하거나 엔터테인먼트를 감상하는데 있어 새로운 방식을 제안한다”고 소개했다.     삼성전자는 갤럭시 XR을 통해 멀티모달 AI의 가능성을 확장할 수 있을 것으로 보고 있다. 멀티모달 AI는 텍스트, 이미지뿐만 아니라 음성, 영상 등 다양한 유형의 정보를 동시에 이해하고 처리하는 기술로 사용자와 기기간에 자연스러운 소통을 가능하게 한다. 갤럭시 XR은 제품 개발 단계부터 멀티모달 AI에 최적화된 플랫폼으로 설계됐다. 사용자는 음성·시선·제스처 기반의 자연스럽고 직관적인 상호작용을 통해 멀티모달 AI가 제공하는 새로운 차원의 혁신을 경험할 수 있다. 구글 제미나이(Gemini)와 대화에 특화된 제미나이 라이브(Gemini Live)가 탑재돼 사용자가 보는 것과 듣는 것을 같이 인식하며, 주변 환경을 이해하고 맥락을 파악해 매끄러운 작업 수행을 지원한다. 예를 들어, 사용자는 제미나이에게 음성으로 유튜브에서 원하는 영상 콘텐츠를 찾아 달라고 한 후, 시선을 움직여 검색된 결과물을 선택하고 손가락을 맞닿게 하는 제스처로 실행할 수 있다. 스포츠를 시청할 때는 마치 경기장에서 보는것과 같은 생생한 현장감과 함께 여러 경기를 동시에 시청할 수도 있다. 삼성전자는 B2B 분야에서도 다른 업종과 기업용 XR 협업을 통해 멀티모달 AI의 가능성을 확장해 나갈 계획이다. 대표 사례로, 삼성전자는 삼성중공업과 갤럭시 XR을 활용한 가상 조선 훈련 설루션 구축을 위한 MOU를 체결했다. 이 솔루션으로 신입 엔지니어가 갤럭시 XR을 통해 가상의 공간에서 선박 엔진 검사 등을 충분히 훈련한 후 실전에 투입될 수 있도록 도움을 줄 수 있다. 삼성전자, 구글, 퀄컴이 공동 개발한 안드로이드 XR은 AI를 기반으로 헤드셋부터 AR 글라스 등 다양한 폼팩터로 확장 가능한 개방형 플랫폼이다. 안드로이드 XR은 안드로이드 기반의 앱을 지원해, 구글 지도·포토·유튜브 XR 등 구글의 기본 서비스는 물론 기존 스마트폰에서 사용하던 기능들도 갤럭시 XR에서 구현된다. 현실과 가상을 오갈 수 있는 헤드셋 형태의 기기 갤럭시 XR은 균형 잡힌 인체공학적 디자인과 545g의 무게로 설계돼 사용자에게 한층 더 편안한 사용 경험을 선사한다. 헤드셋 프레임은 이마와 머리 뒤쪽의 압력을 고르게 분산시켜 장시간 사용에 따른 피로감을 최소화하고 안정적인 착용감을 제공한다. 탈부착에 따라 외부 빛을 차단할 수 있는 외부광 차단 패드는 사용자의 편의에 맞춰 몰입 경험을 제공한다. 저시력 사용자는 도수형 인서트 렌즈를 맞춤 제작해 갤럭시 XR에 자석처럼 부착해 사용할 수 있다. 전국 다비치 안경 매장에서 자신에게 적합한 도수 검사를 진행하고 주문을 하면, 글로벌 안경렌즈 전문 기업 에실로(Essilor)가 제작한 렌즈를 수령할 수 있다. 가격은 도수에 관계 없이 14만원이다. 갤럭시 XR은 정밀한 센서·카메라·마이크와 퀄컴 스냅드래곤 XR2+ Gen 2 플랫폼 칩셋 등 고성능 하드웨어가 탑재돼 사용자의 머리, 손, 눈의 움직임과 음성을 정확히 인식해 사용자와 기기의 자연스러운 상호작용을 구현한다. 구글 지도에서는 제미나이와 함께 원하는 장소로 순간 이동하는 경험이 가능하고, 몰입형 3D 지도를 통해 실제 해당 위치에 있는 듯한 생생한 공간감을 경험할 수 있다. 구글 포토 앱으로는 기존 2D 사진과 영상을 입체감 있는 3D로 즐길 수 있다. 또, 눈 앞의 현실 장면이 그대로 보이는 ‘패스 스루(Pass Through)’ 상태에서는 서클 투 서치를 활용해 눈 앞에 있는 사물에 대한 정보를 즉시 검색할 수 있다. XR 전용 게임과 안드로이드 기반 게임을 제미나이에게 실시간 코칭을 받으며 즐길 수 있고, 어도비 펄사(Adobe Pulsar) 프로그램을 활용해 3D 영상 제작도 가능하다. 삼성전자는 더 많은 소비자들이 XR의 가치를 느낄 수 있도록 다양한 파트너사와 협력을 강화해 어도비, MLB, NBA, 캄(Calm), 어메이즈 VR(Amaze VR) 등 글로벌 서비스와 연계한 XR 콘텐츠를 제공한다. 국내에서는 네이버 스트리밍 플랫폼 치지직에서도 XR 전용 콘텐츠를 선보일 계획이다. 갤럭시 XR은 10월 22일 한국과 미국에 출시되며, 삼성닷컴에서 구매 후 2~3일 뒤 전국 3개 삼성스토어 매장(강남, 홍대, 상무)에서 수령할 수 있다. 백화점 내 위치한 삼성스토어 4개 매장(더현대서울, 신세계 대전, 신세계 대구, 신세계 센텀시티)에서는 현장 주문 후 2~3일 후 재방문해 수령할 수 있다. 가격은 269만원이다. 삼성전자는 22일부터 전국 7개 삼성스토어(강남, 홍대, 더현대서울, 신세계 대전, 신세계 대구, 신세계 센텀시티, 상무)에서 체험존을 운영한다. 체험존 사전 예약은 삼성닷컴에서 신청할 수 있다. 삼성전자는 갤럭시 XR 구매 고객에게 ▲제미나이 AI 프로 ▲유튜브 프리미엄 ▲구글 플레이 패스 ▲쿠팡 플레이 스포츠패스 ▲티빙 프리미엄 이용권 등 XR 콘텐츠와 OTT 구독 혜택 10종을 증정한다. 한편, 삼성전자는 갤럭시 XR을 시작으로 향후 다양한 폼팩터를 통해 안드로이드 XR 생태계를 확장해 나갈 계획이라고 전했다. 삼성전자는 구글과 협력해 차세대 스마트 글라스를 개발하고 있으며, 아이웨어 브랜드 젠틀몬스터, 와비 파커와의 파트너십을 통해 스타일과 실용성을 모두 갖춘 제품을 선보일 예정이다. 삼성전자 MX사업부의 COO인 최원준 사장은 “갤럭시 XR은 새로운 모바일 생태계를 구축할 것”이라며, “안드로이드 XR을 기반으로 갤럭시 XR은 모바일 AI 비전을 무한한 가능성의 영역으로 한층 끌어올리며, 업계와 사용자 모두에게 일상의 기기로 거듭날 것”이라고 포부를 밝혔다.
작성일 : 2025-10-22
마이크로소프트, 윈도우 11에 코파일럿 기반 AI 기능 강화하는 업데이트 발표
마이크로소프트가 코파일럿을 통해 윈도우 11 PC에 강력한 AI 경험을 제공하는 대규모 업데이트를 발표하면서, 모든 윈도우 11 PC를 AI PC로 전환하기 위한 노력을 이어갈 것이라고 전했다. 이번 업데이트는 AI 기능을 윈도우 사용 환경에 통합해, 윈도우 11 사용자가 보다 쉽고 직관적으로 AI를 활용할 수 있도록 설계됐다. 마이크로소프트는 AI PC에 필요한 요소를 ▲자연어 문자 및 음성을 기반으로 상호작용하고 사용자를 이해 ▲사용자가 보는 시각적 정보를 같이 인식하고 도움을 추천 ▲사용자 승인 하에 능동적으로 작업 수행 등 세 가지로 제시하고 있다. 윈도우 11은 코파일럿과의 음성 기반 상호작용을 지원한다. 마이크로소프트는 음성 사용 시 코파일럿과의 상호작용 빈도가 문자보다 두 배 이상 높다는 점에 주목하면서, 간편한 음성 기반 접근으로 사용자가 코파일럿과 더욱 깊은 상호작용을 할 수 있도록 지원한다. 윈도우 11 PC의 코파일럿 앱 설정에서 이 기능을 활성화시키면 호출어인 ‘헤이 코파일럿(Hey, Copilot)’으로 코파일럿 보이스(Copilot Voice)를 실행할 수 있다. 사용자가 호출어를 말하면 화면에 마이크 아이콘이 표시되고 인식 신호음이 울리며 대화가 시작된다. 대화 종료는 ‘굿바이(Goodbye)’라는 음성 명령 또는 종료 버튼으로 실행되며, 몇 초간 상호작용이 없는 경우에도 신호음과 함께 자동으로 코파일럿이 대화를 종료한다. 코파일럿 비전(Copilot Vision)도 코파일럿이 제공되는 전 세계 윈도우 11에서 정식 지원된다. 이 기능은 사용자가 데스크톱 화면이나 앱을 공유하면 코파일럿이 화면 콘텐츠를 인식해 관련 인사이트를 제공하고, 질문에 응답하거나 음성으로 가이드를 제공하는 방식으로 작동한다. 게임 탐색, 이력서 작성, 창작 프로젝트 개선 등 다양한 작업에 활용할 수 있다.     또한, 사용자는 ‘쇼 미 하우(Show me how)’라는 음성 명령어를 통해 특정 작업의 수행 절차를 보여주도록 요청할 수 있다. 코파일럿은 앱 내 클릭 위치와 절차를 시각적으로 안내하며, 게임 플레이, 사진 보정, 여행지와 일정에 따른 준비물 검토 등 다양한 작업 환경에서 조언을 제공한다. 코파일럿 비전과의 문자 기반 대화도 가능해진다. 기존에는 음성 기반의 상호작용만 가능했으나, 마이크로소프트는 윈도우 인사이더 프로그램(Windows Insider Program)을 통해 코파일럿 비전과 텍스트 입력 방식으로도 상호작용할 수 있는 기능을 공개할 예정이다. 윈도우 11의 작업 표시줄에는 새로운 ‘애스크 코파일럿(Ask Copilot)’ 기능이 추가된다. 애스크 코파일럿 활성화를 통해 사용자는 코파일럿 비전과 코파일럿 보이스를 한 번의 클릭으로 손쉽게 이용하고, 코파일럿을 PC 사용 경험에 자연스럽게 통합해 지원, 안내, 협업 등 필요한 기능을 언제든지 활용할 수 있다. 새로운 작업 표시줄은 사용자가 더 적은 노력으로 더 많은 것을 성취하도록 돕고, 한층 생산적이고 재미있는 작업 경험을 제공하는 허브로서 기능한다. 사용자는 앱, 파일, 설정 등에 더욱 빠르게 접근함으로써 검색어를 입력하는 즉시 결과를 확인할 수 있다. 지난 5월 웹 기반 작업 수행 기능으로 공개된 코파일럿 액션(Copilot Actions on the web)은 윈도우 내 로컬 파일에서도 직접 작업을 수행할 수 있도록 기능이 확장된다. 이 기능은 윈도우 인사이더의 코파일럿 랩스(Copilot Labs)에서 프리뷰 형태로 제공될 예정이다. 범용 에이전트로서 코파일럿은 PC에 있는 맥락을 기반으로 데스크톱과 웹 애플리케이션과 상호작용하며 사진 정리, PDF 정보 추출 등 작업을 대신 수행한다. 사용자는 자연어로 작업을 지시한 후 다른 업무에 집중하며 작업 진행 상황을 실시간으로 확인하고 어떤 작업이 수행되었는지 검토할 수 있다. 코파일럿은 외부 서비스와의 연동도 지원한다. 사용자가 연결을 승인하면, 원드라이브(OneDrive), 아웃룩(Outlook), 지메일(Gmail) 등 이메일, 연락처, 일정 기반의 주요 플랫폼 서비스를 코파일럿 온 윈도우(Copilot on Windows)에 직접 연동해 활용할 수 있다. 사용자는 “치과 예약 세부 정보 찾아줘”, “이메일 주소 알려줘” 등의 명령어를 통해 캘린더나 이메일에서 필요한 정보를 빠르게 검색할 수 있으며, 원드라이브에 저장된 문서도 함께 확인할 수 있다. 검색 결과는 워드(Word), 엑셀(Excel), 파워포인트(PowerPoint) 등 다양한 형식으로 내보내는 것도 가능하다. 윈도우 설정과도 연동된다. 사용자가 윈도우 PC 설정에 대해 “화면을 더 읽기 쉽게 만들어줘”, “집중을 위해 방해 요소 줄여줘” 등 자연어 명령으로 요청하면, 코파일럿이 관련 설정 페이지로 자동 안내한다. 더 간편하게 작업을 완료할 수 있는 AI 액션 기능도 추가됐다. 매너스(Manus)는 다양한 작업을 수행할 수 있는 범용 AI 에이전트로, 파일 탐색기(File Explorer) 내에서 한 번의 클릭으로 로컬 폴더의 문서를 활용한 웹사이트를 자동 생성할 수 있다. 문서를 선택한 뒤 마우스 오른쪽 버튼을 눌러 ‘매너스로 웹사이트 만들기’를 실행하면, 별도의 업로드나 코딩 없이 몇 분 만에 웹사이트가 제작된다. 이 기능은 현재 비공개 프리뷰 단계에 있으며, 향후 파일 탐색기에서 필모라(Filmora)를 실행해 쉽고 간편하게 영상을 편집할 수 있는 새로운 AI 액션도 공개될 예정이다. 마이크로소프트는 코파일럿+ PC를 대상으로, 클릭 투 두(Click to Do)와 줌(Zoom) 연동 기능을 윈도우 인사이더 프로그램을 통해 도입할 예정이다. 이 기능을 통해 사용자는 화면에 표시된 이메일 주소 위에 마우스를 올리기만 해도, 별도의 앱 전환 없이 줌 미팅을 즉시 예약할 수 있다. 한편, 마이크로소프트는 “윈도우 11은 마이크로소프트의 시큐어 퓨처 이니셔티브(Secure Future Initiative)에 따라 역대 운영체제들 중 가장 안전하다. 특히 윈도우에 에이전트 기능이 도입되면서, 개인정보와 시스템 보호를 위한 방어 체계가 한층 강화됐다”고 소개했다. 코파일럿 액션은 사용자가 모든 실행 권한을 직접 제어할 수 있도록 설계됐다. 이 기능은 기본적으로 비활성화된 상태로 제공되며, 사용자가 직접 활성화 여부를 선택할 수 있다. 모든 실행 과정은 사용자에게 투명하게 공유되며, 민감한 작업 단계에서는 특정 작업을 위해 사용자에게 별도의 승인을 요청할 수 있다. 마이크로소프트는 프리뷰 테스트를 통해 사용자 피드백을 반영하고, 기능의 안전성과 개인정보 보호 수준을 지속적으로 개선해 나갈 계획이다. 마이크로소프트의 유수프 메흐디(Yusuf Mehdi) 최고 소비자 마케팅 책임자는 “이번 업데이트를 통해 마이크로소프트는 모든 윈도우 11 PC를 코파일럿 중심의 AI PC로 전환하는 데 한 걸음 더 나아갔다”며, “매일 사용하는 윈도우 환경에 AI를 통합함으로써 사용자들이 가장 강력한 AI 기술을 보다 쉽게 활용할 수 있도록 했다”고 말했다.
작성일 : 2025-10-17
어도비, 아이폰용 프리미어 모바일 앱 출시
어도비가 자사의 영상 편집 도구인 어도비 프리미어(Adobe Premiere)를 신규 아이폰 앱을 통해 모바일 환경에서 선보인다고 발표했다. 어도비 프리미어 모바일 앱은 초고속 멀티트랙 타임라인에서 정밀한 편집, 깨끗한 음성 녹음과 완벽한 타이밍의 AI 기반 음향 효과, 스튜디오급 오디오 제작이 가능하다. 독창적인 콘텐츠를 생성하고 수백만 개의 무료 멀티미디어 애셋을 활용할 수 있으며, 모바일에서 제작한 작업물을 프리미어 데스크톱으로 전송해 더 큰 화면에서 세부 조정도 가능하다. 새 모바일 앱은 영상 편집에 필요한 기본 기능을 무료로 제공하며, 추가 저장 공간이나 생성 크레딧이 필요한 경우 업그레이드 플랜(Upgrade Plan)을 선택하면 된다.     아이폰용 프리미어 앱으로 차세대 크리에이터는 정밀한 영상 편집의 강점을 누릴 수 있고, 숙련된 전문가는 이동 중에도 유연하게 편집할 수 있다. 이 신규 모바일 앱은 단편 영화, 뮤직비디오, 유튜브 및 틱톡 콘텐츠, 클라이언트 업무, 개인 프로젝트 등 다양한 콘텐츠 제작과 편집을 가속화한다. 크리에이터는 일상 브이로그를 촬영하고 편집할 수 있으며, 스트리머는 라이브 하이라이트 장면을 클립으로 만들어 공유할 수 있다. 이외에도 팟캐스터는 언제 어디서든 대화를 정리하고 스튜디오급 효과음을 추가할 수 있다. 어도비 프리미어 모바일 앱은 강력한 모바일 편집 툴을 제공하며, 크리에이터가 다양한 기기에서 원활하게 작업할 수 있도록 지원한다. 이동 중에도 편집 프로젝트를 시작하고, 데스크톱에서 프리미어 프로를 통해 정밀하게 편집을 마무리할 수 있는 유연성을 제공한다. 모바일 앱이 제공하는 편집 기능은 다음과 같다. 무제한 초고속 멀티 트랙 타임라인, 4K HDR 편집, 프레임 단위의 정밀 편집, 역동적인 애니메이션 캡션, 부드러운 속도 및 모션 효과, 즉각적인 배경 제거 등 모바일에서도 완전한 크리에이티브 콘텐츠 제어가 가능한 엔드 투 엔드 편집 툴 선명한 보이스오버를 위한 음성 향상 (Enhance Speech)과 완벽한 타이밍의 사운드 요소를 위한 사운드 효과 생성(Generative Sound Effects) 등 스튜디오급 사운드를 제공하는 AI 오디오 툴 AI 기반 스티커부터 매끄러운 배경 확장, 이미지를 비디오로 생성에 이르기까지 독특한 애셋을 어도비의 상업적으로 안전한 생성형 AI를 통해 생성 iOS에 최적화된 빠르고 반응성 높은 성능, 간편한 미디어 관리, 방해 요소와 워터마크 없는 환경에서 영감이 떠오르는 대로 편집 가능 수백만 개의 스티커, 이미지, 어도비 폰트, 로열티 없는 음악 트랙 등 방대한 무료 크리에이티브 애셋을 활용해 콘텐츠에 생동감 부여 틱톡, 유튜브 쇼츠, 인스타그램 등 주요 소셜 플랫폼에 한 번의 터치로 내보내기. 각 플랫폼에 맞게 영상 크기를 조정하고 주요 장면이 프레임을 벗어나지 않게 하는 기능 제공   아이폰용 프리미어 모바일 앱은 전 세계 앱스토어에서 이용 가능하다. 안드로이드용 프리미어 모바일 앱은 현재 개발 중이다. 어도비의 마이크 폴너(Mike Polner) 크리에이터 제품 마케팅 부문 부사장은 “크리에이터에게 전문가 수준의 크리에이티브 콘텐츠 제작 역량을 제공하게 돼 기쁘다”면서, “스튜디오급 오디오, 정교한 편집 툴과 뛰어난 비주얼을 갖춘 아이폰용 프리미어 앱으로 모바일에서도 손쉽게 콘텐츠를 제작하고 공유할 수 있고, 일상적인 순간을 언제 어디서든 완성도 높은 스토리로 바꿀 수 있다”고 말했다.
작성일 : 2025-10-01
[포커스] 코리아 그래픽스 2025, AI로 가속하는 산업과 크리에이티브의 변화를 짚다 (2)
‘코리아 그래픽스 2025’가 지난 9월 11~12일 온라인으로 진행됐다. ‘AI로 혁신하는 3D 시각화와 산업의 미래’를 주제로 열린 ‘코리아 그래픽스 2025’에서는 급변하는 기술 트렌드 속에서 AI(인공지능)와 3D 시각화가 산업과 문화 전반에 미치는 영향력을 조명했다. 또한 AI 기술의 실질적인 적용 사례와 잠재력을 통해, AI가 단순한 도구를 넘어 창의적 동반자로 진화하는 흐름을 짚었다. ■ 정수진 편집장   ■ 같이 보기 : [포커스] 코리아 그래픽스 2025, AI로 가속하는 산업과 크리에이티브의 변화를 짚다 (1)     AI·3D 시각화 기술의 현재와 미래를 짚다 9월 11일에는 ‘디지털 트윈 & 3D 시각화’ 트랙이 진행됐다. 에픽게임즈 코리아의 권오찬 시니어 에반젤리스트는 ‘리얼타임을 통한 디지털 트랜스포메이션의 진화, 그리고 에픽게임즈의 에코시스템’을 주제로 발표했다. 그는 디지털 트윈을 통한 시각화가 건축, 도시 계획, 훈련 시뮬레이션, 자동차 산업 등 다양한 분야에서 혁신적인 의사결정을 이끌어내는 사례를 소개하면서, 3D 인터랙티브 콘텐츠로의 전환을 강조했다. 권오찬 시니어 에반젤리스트는 “에픽게임즈는 이러한 변화를 성공적으로 지원하기 위해 나나이트, 루멘, 라지 월드 코디네이터, 절차적 콘텐츠 생성 툴 같은 리얼타임 렌더링 기술과 함께 메타휴먼, 애셋 스토어, 리얼리티 스캔 2.0 등 풍부한 에코시스템을 제공한다”고 밝혔다.   ▲ 에픽게임즈 코리아 권오찬 시니어 에반젤리스트   HP 코리아의 차성호 이사는 ‘AI 워크스테이션을 통한 생산성 향상 방안 및 사례’를 발표했다. 워크스테이션은 R&D, 금융, 데이터 과학, AI 등의 분야에서 성능과 안정성을 겸비한 비즈니스 제품군으로 자리잡고 있다. 차성호 이사는 HP의 AI 워크스테이션이 40 TOPS 이상의 NPU(신경망 처리장치)와 코파일럿 키를 탑재하고 있으며, 대량의 그래픽 메모리를 바탕으로 솔리드웍스, 오토데스크 레빗, D5 렌더 등 ISV 애플리케이션에서 높은 생산성 향상을 보인다고 소개했다. 또한, 프로그램과 목적에 따른 최적 하드웨어 선택의 중요성을 강조하면서, “HP는 데모 프로그램을 통한 성20 · 능 검증 기회를 제공한다”고 덧붙였다.   ▲ HP 코리아 차성호 이사   에스엘즈의 정재헌 대표는 ‘AEC 산업을 위해 진화하는 공간지능 기술’을 주제로, 2020년 캐나다 ‘어그멘티드 그라운드’ 프로젝트의 AR 원격 시공 경험을 비롯해 자체 개발한 추론형 AI로 BIM 모델 이미지를 학습하여 고객사의 MEP 설계 노하우의 보안을 유지하면서 자동 배관 설계를 진행한 사례를 소개했다. 또한 ‘증강 휴먼’ 기술이 피지컬 AI 기반의 ‘증강 로봇’으로 진화하는 여정도 공유했다. 정재헌 대표는 “초기 AR 디바이스 탑재를 넘어 휴머노이드 로봇 및 드론에도 공간 지능 기술을 적용 중이며, 드론에서 수신한 GNSS 좌표를 기반으로 BIM 모델을 고정밀 증강하여 실시간 현장 영상 위에 데이터를 매핑하는 데 성공했다”고 밝혔다.   ▲ 에스엘즈 정재헌 대표   유니티코리아의 김현민 시니어 설루션 엔지니어는 ‘유니티 애셋 매니저로 혁신하는 CAD 데이터 관리와 실시간 협업’에 대해 발표했다. 그는 “유니티가 디자인 및 프로토타입 작업 간소화, 비용 절감, 브랜드 경험 강화 등 산업 전반에 몰입감 있고 인터랙티브한 경험을 제공한다”고 설명했다. 오픈 플랫폼인 유니티는 카티아, 솔리드웍스 등 70여 종의 CAD 포맷을 지원하며 애셋 관리, 버전 관리와 함께 20여 종 이상 플랫폼 빌드를 제공하는 엔드 투 엔드 설루션을 제공한다. 또한 유니티 애셋 매니저(Unity Asset Manager)는 클라우드 기반에서 대용량 CAD/3D 데이터를 효율적으로 관리하며, AI 태깅, 버전 관리, 데이터 스트리밍 기능을 통해 실시간 협업 환경을 구축한다.   ▲ 유니티코리아 김현민 시니어 설루션 엔지니어   메가존클라우드의 홍동희 유니티 유닛 테크 그룹장은 ‘CAD와 유니티의 만남 : 새로운 비즈니스 수익 모델과 창의적 혁신’을 발표했다. 그는 “유니티의 실시간 렌더링, 인터랙티브 기능, 멀티플랫폼 배포 능력이 정밀한 설계에 강점을 가진 CAD에 새로운 가치를 부여하고 수익화할 수 있다”고 강조했다. 또한, 가상 복제본 생성부터 AI 결합을 통한 완전 자율화까지 디지털 트윈의 진화 과정을 설명하며, “유니티는 디지털 트윈 개발을 위한 최적의 플랫폼”이라고 전했다. 유니티의 에코시스템을 활용해 기업은 새로운 비즈니스 영역을 창출하고, 개인은 CAD와 유니티를 겸비한 전문가로서 경쟁력을 강화할 수 있다는 것이 그의 설명이다.   ▲ 메가존클라우드 홍동희 유니티 유닛 테크 그룹장   캐디안의 한명기 상무는 ‘AI 이미지 인지기술 기반 3D 도면 생성 방안 및 적용 설루션 소개’를 주제로 발표를 진행했다. 한명기 상무는 “캐디안은 1990년 설립된 국산 CAD 개발 기업으로, 2020년에는 AI CAD 개발을 선언하며 설계 도면 생성 과정의 어려움을 해결하는 데에 AI를 접목했다”고 설명했다. 캐디안은 최근 전통 목조 건축의 손도면을 2D/3D 도면화하는 ‘CADian TWArch’를 개발하여 불국사 복원 가상 설계에 적용했으며, 올해 연말 출시 예정이다. 또한, 현대 건축을 위한 ‘CADian AI-CE’는 JPG, PDF, DWG 등 다양한 도면에서 벽체, 창호, 룸 정보 등을 AI로 탐지하여 도면을 재생성하고 BOM을 산출한다. 한명기 상무는 “캐디안 AI CAD의 미래는 스마트 블록, 디자인 어시스턴트, 인스펙션 시스템 등 기능 강화와 함께 궁극적으로 AI 에이전트를 통한 ‘말로 설계하는 세상’을 목표로 한다”고 전했다.   ▲ 캐디안 한명기 상무   이노시뮬레이션의 이지선 CTO는 ‘모빌리티 XR 사례와 AI 융합 기술의 미래’를 전망했다. 그는 XR 기술이 나와 외부 세계를 소통하는 모든 통로를 대체하는 기술이며, 그래픽, 디바이스, 시뮬레이션 기술과 밀접하다고 정의했다. 그리고 운전 시뮬레이터, 가상 훈련, HMI 검토, 가상 품평, AR HUD 등 다양한 모빌리티 XR 응용 사례를 소개하며 개발 기간과 비용 절감 효과를 강조했다. 이지선 CTO는 “AI와 XR 기술의 결합은 모빌리티 무인화 시대를 가속화할 것”이라면서, “이노시뮬레이션은 AI 개발 툴을 활용하여 AI와 모빌리티가 혼합된 시뮬레이션 시스템을 연구 개발 중”이라고 소개했다.   ▲ 이노시뮬레이션 이지선 CTO   디자인과 제조의 미래를 만드는 생성형 AI 9월 12일에는 ‘AI 비주얼 트렌드 & 응용’ 트랙이 진행됐다. LG CNS의 정용기 선임은 ‘Image Gen.AI를 활용한 업무 생산성 향상 방안’에 대한 발표에서, 생성형 AI 기술에 기반한 LG CNS의 Image Gen.AI 엔진을 소개했다. 이를 활용하면 디자인 과정에서 아이디어 구상 시간을 단축하는 등의 프로세스 개선을 통해 비주얼 콘텐츠의 생성 시간과 비용을 50% 이상 줄여줄 수 있다는 것이 정용기 선임의 설명이다. 또한, LG CNS의 Image Gen.AI 엔진을 탑재한 COP(Content Optimization Platform)도 소개했다. COP는 이미지 생성 및 편집, 배경 제거/교체/확장, 부분 수정 등의 기능을 제공하며, 특화 학습을 통해 고객사의 특정 스타일을 반영한 마케팅 이미지를 생성한다. 정용기 선임은 “COP는 제품의 디테일을 유지하면서 다양한 연출 컷을 만들 수 있으며, 향후 매체별 배너 이미지 자동 생성 기능을 개발 중”이라고 밝혔다.   ▲ LG CNS 정용기 선임   아이스케이프의 조세희 대표는 ‘이미지부터 3D까지 : 크리에이터가 알려주는 생성형 AI 영상 제작’을 주제로 발표했다. 조세희 대표는 AI를 활용한 영상 콘텐츠 제작 과정을 실무 사례와 함께 소개하면서, “영상 제작은 스토리보드, 키 이미지 생성, 영상화, 음악 생성, 편집의 5단계로 진행되며, AI가 텍스트, 이미지, 오디오, 3D 모델 등 다양한 콘텐츠를 생성한다”고 설명했다. 또한, 3D 오브젝트를 활용해 가상 공간에서 영상을 만들고, 미드저니의 옴니 레퍼런스와 페이스 스왑, 일레븐랩스를 이용해 가상 인간의 일관된 이미지와 음성을 제작하는 과정도 시연했다. 조세희 대표는 “AI는 생산성을 높일 수 있는 도구이지만, 영상 구조, 조명, 연출 등의 기본 지식은 필수”라고 짚었다.   ▲ 아이스케이프 조세희 대표   AI팩토리의 김태영 CEO는 ‘크리에이터를 위한 AI 에이전트 활용 및 ‘바이브 코딩’ 발표를 통해 엔트로픽의 클로드 코드(Claude Code)를 활용해서 AI와 협업하여 코드를 작성하고 실행하는 방법을 시연했다. 바이브 코딩(vibe coding)은 대화식으로 사용자가 원하는 내용을 AI 에이전트에게 전달하면 AI가 코딩을 수행하는 방식이다. “요구사항 명세서 역할을 하는 파일을 통해 더욱 상세한 지시가 가능하다”고 소개한 김태영 CEO는 발표 중 실제 라이브 시연을 통해 상품 소개 웹 페이지를 제작하고, AI가 텍스트와 이미지를 자동 생성하여 콘텐츠를 풍부하게 만드는 과정을 선보였다.   ▲ AI팩토리 김태영 CEO   IUM SPACE의 이윰 대표는 ‘AI 툴로 구현하는 비주얼 세계 : 실무 적용과 아트워크 융합 사례’를 주제로 발표했다. 생성형 AI 시대의 진정한 창의성은 ‘세계관 디자인’에 있다고 짚은 이윰 대표는 미드저니의 스타일 레퍼런스 기능을 통해 42억 개의 스타일 시드를 탐색하며 “각 시드가 담고 있는 고유한 세계관을 이해하는 것이 중요하다”고 설명했다. 또한, 인간의 상상력과 AI의 지능을 결합하여 고유한 스타일과 이야기를 만드는 과정을 소개했다. 이윰 대표는 “AI는 의미를 생성하지 않으므로, 인간 창작자가 의미를 부여하고 다양한 이미지를 통합하여 스토리를 완성하는 것이 핵심”이라고 전했다.   ▲ IUM SPACE 이윰 대표   ■ 같이 보기 : [포커스] 코리아 그래픽스 2025, AI로 가속하는 산업과 크리에이티브의 변화를 짚다 (1)
작성일 : 2025-10-01
[칼럼] 인공지능 기술 : 도입에서 혁신으로
디지털 지식전문가 조형식의 지식마당   빠르게, 그리고 깊게 지난 2년간 필자는 정신없이 AI 지식을 흡수하고 수많은 설루션을 직접 사용했다. 신기함과 불편함이 뒤섞인 체험 끝에, 직감적으로 2025년이 인공지능 기술의 이정표가 될 것이라 확신하게 됐다.   거시 흐름, 지능형 자동화와 에이전트의 부상 인공지능(AI) 기술의 발전은 2024년을 기점으로 단순히 새로운 기술의 도입을 넘어, 산업과 사회 전반의 혁신을 촉발하는 핵심 동력으로 자리 잡았다. 여러 분석가는 2024년이 AI 도입의 해였다면, 2025년은 AI가 기존 산업의 경계를 허물고 운영 방식을 근본적으로 재정의하는 ‘혁신의 해’가 될 것으로 전망하고 있다. 이러한 변화의 물결 속에서 기업들은 막연한 기대감을 넘어, AI 기술을 통해 실질적인 비즈니스 가치(ROI)를 창출하는 데 집중하고 있다. 특히, 반복적이고 명확한 규칙 기반의 작업을 AI로 자동화함으로써 즉각적인 효율성 증대와 함께 투자 성과를 확보하는 전략이 부상하고 있다. 이러한 맥락에서 ‘지능형 자동화(intelligent automation)’는 단순 반복 작업을 넘어 복잡한 워크플로를 자율적으로 처리하고 의사결정까지 내리는 단계로 진화하고 있다. 이는 ‘AI 에이전트’의 형태로 구현되며, 응용 AI의 차세대 진화로 주목받고 있다.  이러한 거시적 흐름 속에서 AI 기술의 3대 핵심 분야인 언어 모델, 이미지 및 영상 모델, 음성 모델의 최신 기술적 동향과 시장 변화를 심층적으로 분석하고, 나아가 이들 간의 융합 현상인 ‘멀티모달 AI’의 부상을 조망함으로써 비즈니스 리더와 기술 전문가에게 전략적 통찰을 만들어 봤다. 첫 번째, 대규모 언어 모델(LLM)의 혁신은 대부분 ‘트랜스포머(transformer)’ 아키텍처에 기반을 두고 있다. GPT-4, LLaMA 2, Falcon 등 현재 시장을 선도하는 모델은 이 아키텍처를 활용하여 방대한 데이터 세트에서 인간 언어의 패턴과 구조를 학습한다. 트랜스포머는 언어 모델의 근간을 이루며, 그 영향력은 비단 텍스트에만 머무르지 않고, 오픈AI(OpenAI)의 최신 비디오 생성 모델인 소라(Sora)의 ‘디퓨전 트랜스포머’ 아키텍처에도 확장 적용되고 있다. 최근 LLM 훈련 방법론은 단순히 모델의 규모를 키우는 것을 넘어, 효율과 특화된 성능을 확보하는 방향으로 진화하고 있다. LLM 시장은 ‘규모’를 추구하는 초대형 모델(LLM)과 ‘효율’을 추구하는 소형 언어 모델(SLM)이 공존하는 양면적 발전 양상을 보인다. GPT-4o나 제미나이(Gemini)와 같은 초대형 모델은 뛰어난 범용성과 성능으로 시장을 선도하는 한편, 특정 산업이나 용도에 맞게 최적화된 SLM은 적은 비용과 빠른 속도를 무기로 틈새시장을 공략하고 있다. 이러한 이원화된 전략은 기업이 적용 업무의 성격에 따라 두 모델을 전략적으로 선택하거나 조합하는 하이브리드 접근법을 채택하도록 유도하고 있다. 두 번째, 최근 이미지 및 영상 생성 모델의 핵심 기술은 ‘디퓨전 모델(diffusion model)’이다. 이 모델은 기존의 생성적 적대 신경망(GAN)이 가진 ‘모드 붕괴(mode collapse)’ 문제를 해결하며 고품질의 다양하고 사실적인 이미지 생성을 가능하게 했다. 디퓨전 모델은 이미지에 점진적으로 노이즈를 추가한 뒤, 이 노이즈를 단계적으로 제거하며 깨끗한 이미지를 복원하는 방식을 사용한다. 이 기술은 스테이블 디퓨전(Stable Diffusion), 달리(DALL-E)와 같은 대표적인 서비스에 활용되고 있다. 대규모 언어 모델과 마찬가지로, 이미지 및 영상 모델 역시 규모의 확장과 효율의 최적화라는 상반된 흐름을 동시에 경험하고 있다. 디퓨전 모델은 모델의 규모가 클수록 더 좋은 성능을 보이지만, 그만큼 막대한 연산 자원과 느린 처리 속도라는 문제에 직면한다. 이러한 한계를 극복하기 위해 모델 경량화와 처리 속도를 높이는 기술적 접근이 중요하게 다루어지고 있다. 이는 AI 기술의 상용화와 대중화를 위한 필수 단계이다. 영상 생성 기술은 미디어 및 엔터테인먼트 산업의 콘텐츠 창작 패러다임을 근본적으로 변화시키고 있다. 텍스트 입력만으로 원하는 비디오를 만들 수 있는 능력은 브레인스토밍을 가속화하고, 마케팅 자료, 게임 비주얼, 와이어프레임 및 프로토타입 제작 시간을 획기적으로 단축시켜 기업의 시장 대응력을 높인다. 특히, 전자상거래 기업은 AI 생성 이미지를 사용하여 다양한 제품 쇼케이스와 맞춤형 마케팅 자료를 대규모로 제작할 수 있다. 세 번째, 음성 모델은 크게 음성 신호를 텍스트로 변환하는 ‘음성 인식(ASR : Automatic Speech Recognition)’과 텍스트를 음성으로 변환하는 ‘음성 합성(TTS : Text-to-Speech)’ 기술로 구분된다. 딥러닝 기술의 발전은 이 두 분야에 혁명적인 변화를 가져왔다. 음성 인식(ASR) : 딥러닝 기반의 엔드 투 엔드 모델은 음향 모델링과 언어 모델링 과정을 통합하여 ASR의 정확도를 비약적으로 향상시켰다. 최신 시스템은 배경 소음을 제거하고 자연어 처리(NLP) 기술을 활용하2025/10여 문맥을 이해함으로써 최대 99%에 가까운 정확도를 달성하고 있다. 이는 단순히 음성을 텍스트로 바꾸는 것을 넘어, 사용자의 의도를 정확히 이해하고 적절하게 대응하는 대화형 AI 시스템의 핵심 기반이 된다. 음성 합성(TTS) : 딥러닝 기반 모델은 기계적인 느낌을 벗어나 사람처럼 자연스럽고 운율이 담긴 목소리를 생성하는 데 큰 발전을 이루었다. 이는 텍스트 분석, 운율 모델링, 그리고 실제 음성 파형을 생성하는 ‘보코더(vocoder)’ 과정을 통해 이루어진다. 현대 음성 합성 기술의 발전 방향은 단순히 자연스러움을 넘어, 인간-기계 상호작용을 더욱 몰입감 있고 개인화된 경험으로 이끄는 데 있다. 감정 표현 TTS : 이는 기계에 감정을 부여하여 인간 언어와 더욱 유사한 음성을 생성하는 것을 목표로 한다. 기쁨, 슬픔, 분노 등 다양한 감정을 표현하는 음성 합성은 사용자 경험을 더욱 풍부하게 만든다. 개인화된 음성 합성(Personalized TTS) : 이 기술은 약 1시간 분량의 데이터만으로 개인의 목소리를 복제하여 맞춤형 TTS를 만드는 연구 단계에 있다. 이는 부모의 목소리로 동화책을 읽어주는 등 감성적이고 따뜻한 응용 분야에 적용될 가능성을 열어준다.   감성으로 완성되는 기술 올해는 유난히 더운 것인지 아니면, 우리가 에어컨 환경에 너무 노출되어서 더위에 대한 저항력이 없어진 것인지는 모르지만 너무 더워서 정신적 활동이 힘들었다. 그 와중에 개인 자료를 정리하던 중에 개인적으로는 필자의 입사 이력서 사진을 우연히 찾아봤으나, 손상이 많이 되어서 인공지능으로 복원해 보기로 했다.     그림 1. 옛날 사진을 스마트폰으로 촬영한 이미지와 구글 인공지능으로 생성한 이미지   우선 스마트폰으로 이 사진을 찍은 다음 구글의 제미나이로 복원하고 다양한 모습으로 재현해 봤다. 그리고 동영상도 만들어 봤다. 아주 작고 희미한 흑백 사진이라고 우리의 머리속에 있는 이미지와 유사할 때까지 계속 보강된 이미지를 만들 수 있다. 그래서 최근에는 ‘포즈의 정리(Theorem of Pose)’라는 책을 구입해서 인공지능 생성 이미지 프롬프트를 본격적으로 연구해 보기로 했다.     그림 2. 구글 제미나이로 생성된 이미지   돌이켜보면 생각보다 빠른 속도다. 기술은 때로 불안과 경외를 동시에 불러온다. 그러나 확실한 것은, 인공지능이 우리의 감성을 자극하기 시작했다는 사실이다. 오래된 사진이 되살아나고, 목소리가 감정을 띠며, 텍스트가 움직이는 영상으로 변한다. 도입의 해를 지나 혁신의 해로 들어서는 지금, 우리는 효율을 넘어 의미를 설계해야 한다. AI는 결국, 우리 일과 삶의 이야기를 더 풍부하게 엮어내는 도구다. 기술이 감성을 만나 경험을 재편할 때, 진짜 혁신은 비로소 현실이 된다. 기업의 입장에서 2024년이 ‘도입의 해’였다면 2025년은 운영 방식 자체를 재정의하는 ‘혁신의 해’다. 기업은 막연한 기대가 아니라 ROI로 말하기 시작했고, 반복적·규칙 기반 업무를 AI로 자동화하여 즉각적인 효율과 투자 성과를 확보하는 전략이 주류로 부상했다. 그 중심에는 언어, 시각(이미지·영상), 음성이라는 세 가지 축과 이들을 촘촘히 엮어내는 멀티모달 AI가 있다.   ■ 조형식 항공 유체해석(CFD) 엔지니어로 출발하여 프로젝트 관리자 및 컨설턴트를 걸쳐서 디지털 지식 전문가로 활동하고 있다. 현재 디지털지식연구소 대표와 인더스트리 4.0, MES 강의, 캐드앤그래픽스 CNG 지식교육 방송 사회자 및 컬럼니스트로 활동하고 있다. 보잉, 삼성항공우주연구소, 한국항공(KAI), 지멘스에서 근무했다. 저서로는 ‘PLM 지식’, ‘서비스공학’, ‘스마트 엔지니어링’, ‘MES’, ‘인더스트리 4.0’ 등이 있다.     ■ 기사 내용은 PDF로도 제공됩니다.
작성일 : 2025-10-01
[에디토리얼] AI 기반 스마트홈, 엔지니어링의 새로운 도전과 기회
독일 베를린에서 열린 IFA 2025는 단순한 가전 박람회가 아니라, AI가 어떻게 일상과 산업을 재편하는지를 보여준 무대였다. 전시를 관통한 키워드는 ‘AI in Everything’. 그 중에서도 ‘스마트홈’은 엔지니어링 업계가 주목해야 할 사례로 떠올랐다.   스마트홈, ‘맥락 기반 지능’으로 진화 삼성전자가 선보인 ‘앰비언트 AI’는 단순한 명령형 제어에서 벗어나, 상황과 맥락을 스스로 파악해 작동하는 방향으로 진화하고 있다. 음성인식 수준을 넘어 다중 센서 데이터, 사용자 행동 패턴, 생활 맥락을 종합적으로 분석해 자율적으로 의사결정을 내리는 구조다. 이는 상황 인지 컴퓨팅(context-aware computing)과 사이버 물리 시스템(CPS)이 결합된 고도화된 형태로 해석된다. LG전자의 ‘AI 가전의 오케스트라’ 역시 같은 흐름이다. 개별 가전이 따로 움직이는 대신, 중앙 AI 엔진이 전체를 조율해 에너지 효율과 사용자 편의를 높인다. 이는 분산 제어 시스템과 시스템 오브 시스템즈(SoS) 아키텍처가 적용된 사례로, 제조 현장의 생산 관리 시스템(MES)이 생활 공간으로 확장된 모습에 가깝다.   상호운용성 표준화의 본격화 스마트홈이 대중화되지 못했던 가장 큰 이유는 기기 간 상호운용성이 부족했기 때문이다. 이를 해결하기 위해 글로벌 기업들이 합의한 매터(Matter) 표준은 엔지니어에게 중요한 시사점을 준다. 매터는 와이파이, 스레드, 이더넷 같은 기존 네트워크 환경 위에서 동작하며, 브랜드와 무관하게 기기간 원활한 연결을 보장한다. 최근 공개된 매터 1.4.2는 QR 코드 기반 설정, 다중 환경 지원, 공개키 기반 보안 체계를 포함한다. 이는 단순한 사용자 편의성을 넘어, 기기 수명 주기 관리·원격 유지보수·사이버 보안까지 고려한 통합 설계가 필요하다는 점을 보여준다. 결국 표준화는 기술의 시장 채택률을 좌우하는 핵심 요인으로, 앞으로 산업 전반에서도 필수적 과제가 될 것이다.   엔지니어링을 향한 메시지 : 자동화·웰빙·지속가능성 IFA 2025의 또 다른 메시지는 지능형 자동화와 웰빙 중심 설계다. 요리 상태를 컴퓨터 비전으로 인식해 자동으로 조리하는 스마트 오븐, 생체 신호를 연속 모니터링해 맞춤형 건강 관리 설루션을 제시하는 헬스케어 기기들은 에지 AI와 실시간 데이터 분석 기술을 기반으로 한다. 이는 제조, 건설, 에너지 등 다양한 엔지니어링 분야에서 인간 중심 설계와 예측 유지보수로 확장될 수 있는 모델이다. 특히 주목할 점은 이러한 시스템이 데이터 현지 처리와 개인 정보 보호를 전제로 설계되고 있다는 것이다. 건강 정보나 생활 패턴과 같은 민감한 데이터는 클라우드가 아닌 로컬 기기에서 처리하는 에지 컴퓨팅 아키텍처를 적용하고 있다. 스마트홈은 단순히 생활 편의성을 높이는 기술이 아니라, AI·사물인터넷(IoT)·표준화·자동화가 결합될 때 어떤 엔지니어링 생태계가 만들어지는지를 보여주는 대표적인 사례다. 엔지니어에게는 시스템적 사고와 통합 설계 역량의 중요성을 예고하고 있다.   ■ 박경수 캐드앤그래픽스 기획사업부 이사로, 캐드앤그래픽스가 주최 또는 주관하는 행사의 진행자 겸 사회자를 맡고 있다. ‘플랜트 조선 컨퍼런스’, ‘PLM/DX 베스트 프랙티스 컨퍼런스’, ‘CAE 컨퍼런스’, ‘코리아 그래픽스’, ‘SIMTOS 컨퍼런스’ 등 다수의 콘퍼런스 기획에 참여했고,행사의 전반적인 진행을 담당해 왔다. CNG TV 웨비나의 진행자 겸 사회자로, IT 분야의 취재기자로도 활동 중이다. ■ 기사 내용은 PDF로도 제공됩니다.
작성일 : 2025-10-01
캔바, 16개 신규 언어 지원하는 ‘캔바 AI’로 대화형 디자인 생성 향상
캔바가 지난 4월 공개한 대화형 창작 파트너 ‘캔바 AI(Canva AI)’의 글로벌 확대를 발표했다. 캔바 AI의 대화형 인터페이스는 기존의 영어를 포함해 총 17개 언어로 디자인 생성을 지원하며, 보다 정확하고 문화적 맥락이 반영된 결과물을 제공해 어떤 아이디어든 AI를 통해 손쉽게 확장할 수 있도록 한다. 이번 업데이트로 캔바의 크리에이티브 AI 영향력이 한층 확대되어, 전 세계 수많은 크리에이터, 기업, 교육자 등이 자국어로 대화하듯 손쉽게 디자인을 완성할 수 있게 되었다. 캔바는 “대화형 AI가 창작의 필수 인터페이스로 자리잡음에 따라, 캔바는 언어의 장벽 없이 아이디어를 현실로 구현할 수 있는 플랫폼으로 자리매김하고 있다. 특히 이번 다국어 캔바 AI 출시를 통해 전 세계 더 많은 사람들이 AI와 함께 목표를 실현할 수 있게 되었다”고 전했다. 캔바 AI는 캔바의 생성형 도구들을 하나의 직관적인 인터페이스에 통합해 디자인 전문 지식 없이도 누구나 바로 창작할 수 있도록 지원한다. 사용자는 텍스트나 음성 입력을 통해 원하는 결과물을 간단히 요청하기만 하면 된다. 아이디어를 브레인스토밍하거나 캠페인을 기획하거나 다양한 디자인 자료를 제작하는 모든 과정에서 캔바 AI를 활용할 수 있다.     캔바 AI는 이제 영어 외에도 한국어를 포함한 아랍어, 중국어, 네덜란드어, 프랑스어, 독일어, 힌디어, 인도네시아어, 이탈리아어, 일본어, 폴란드어, 포르투갈어, 스페인어, 태국어, 터키어, 베트남어 등 16개의 신규 언어를 지원한다. 사용자가 AI를 활용해 모국어로 창작할 수 있도록 지원할 뿐만 아니라, 세계적으로 활용 가능한 캔바의 디자인 자산 라이브러리와 현지 관습에 기반한 결과물을 생성한다. 캔바의 캐머런 애덤스(Cameron Adams) 공동 창립자 겸 최고 제품 책임자는 “2억 4000만 명 이상의 캔바 사용자 대다수는 영어 이외의 언어를 사용한다”며, “캔바가 전 세계적으로 많은 사랑을 받는 중요한 이유 중 하나는 캔바를 진정한 ‘로컬 제품’으로 만들기 위해 세심한 노력을 기울여왔기 때문이다”라고 설명했다. 또한, “생성형 AI는 이제 디자인을 누구나 손쉽게 접근할 수 있도록 하는 핵심 기술이다. 따라서 이 기술이 각 문화적 맥락과 긴밀히 연결되도록 하는 것이 매우 중요하다”고 강조하며, “이를 통해 캔바의 디자인 생성 기술은 전 세계 모든 사람들이 이전에는 불가능했던 방식으로 목표를 달성할 수 있도록 지원하게 될 것”이라고 밝혔다.
작성일 : 2025-09-24