가트너가 2030년까지 기업용 소프트웨어 및 애플리케이션의 80%가 멀티모달(multimodal) 방식으로 전환될 것이라는 전망을 발표했다. 이는 2024년 10% 미만이었던 수치에서 크게 증가한 것이다.
가트너의 로버타 코자(Roberta Cozza) 시니어 디렉터 애널리스트는 “멀티모달 생성형 AI는 기존 모델로는 구현할 수 없었던 기능 및 성능을 제공해 의료, 금융, 제조 등 다양한 산업 분야의 기업용 애플리케이션을 혁신할 것”이라면서, “도메인 특화 언어 모델의 정밀도 향상, 운영 자동화, 맥락 기반 의사결정 인텔리전스 강화로 AI가 업무 전반에서 선제적으로 행동할 수 있도록 할 것이다. 기업용 소프트웨어의 멀티모달 전환은 비즈니스 운영 및 혁신에서의 근본적인 변화”라고 설명했다.
멀티모달 생성형 AI는 이미지, 동영상, 오디오, 텍스트, 수치 데이터 등 여러 유형의 데이터 입출력을 단일 생성 모델 내에서 처리한다. 이처럼 멀티모달리티는 모델이 다양한 유형의 데이터와 상호작용하고 결과물을 생성하도록 지원해 생성형 AI의 활용성을 강화한다. 가트너는 현재 많은 멀티모달 모델이 텍스트 투 비디오(T2V), 스피치 투 이미지(S2I) 등 몇몇 모달리티에 제한되어 있지만, 향후 몇 년간 더 다양하고 새로운 모달리티가 추가될 것으로 보고 있다.
멀티모달 생성형 AI 모델과 같이 파괴력이 높은 기술은 가트너의 생성형 AI 신기술 임팩트 레이더(Emerging Tech Impact Radar for GenAI)의 핵심부에 자리한다. 제품 리더는 고객이 한 단계 높은 비즈니스 가치를 달성할 수 있도록, 이러한 신흥 AI 기술 투자에서 전략적인 결정을 내려야 한다.
코자 시니어 디렉터 애널리스트는 “기업은 사용자 경험과 운영 효율성 향상을 위해 소프트웨어에 멀티모달 기능을 통합하는 데 집중해야 한다. 각 사업부는 멀티모달 생성형 AI가 제공하는 다양한 데이터 입출력을 활용해 새로운 차원의 생산성과 혁신을 실현할 수 있을 것”이라고 강조했다.