[포커스] 오라클, 데이터 웨어하우스 기술 혁신으로 기업 데이터의 수집/분석/공유 강화 지원
데이터 웨어하우스란 기업 내 다양한 소스에서 나온 데이터를 통합 관리하고 분석해 비즈니스 인사이트를 얻는데 활용할 수 있도록 지원하는 시스템을 가리킨다. 최근에는 기업에서 사내 시스템뿐 아니라 클라우드의 활용도 늘면서, 관리 및 분석해야 할 데이터의 종류와 양이 더욱 늘어나는 추세이다. 오라클은 자사의 자율운영 데이터 웨어하우스(Oracle Autonomous Data Warehouse : ADW)의 새로운 기능을 발표하면서, 데이터 웨어하우스 구축과 운영의 비용을 줄이고 사용의 단순화 및 용이성을 강화했다고 소개했다. ■ 정수진 편집장
▲ 오라클 자율운영 데이터 웨어하우스는 멀티 클라우드 환경을 위한 통합 기능을 강화했다.
머신러닝으로 자율운영 강화한 데이터 웨어하우스 선보여
오라클의 조지 럼킨(George Lumpkin) 제품 개발 부문 부사장은 “지난 2018년 ADW를 선보이면서 데이터베이스 관리의 부담이 줄어들 것으로 기대했는데, 실제로 기업들이 ADW를 선택한 주된 이유는 데이터베이스의 관리 비용을 중심으로 한 TCO 효과로 나타났다”고 전했다.
ADW는 머신러닝을 기반으로 데이터베이스의 구동과 분석, 복구 등에서 자율운영을 강화한 솔루션이다. 오라클은 이번에 발표한 신기능을 통해 기존 데이터 웨어하우스 및 데이터 레이크의 개 방성과 성능을 더욱 높이고 비용을 낮출 수 있다고 소개했다.
오라클 ADW는 데이터베이스 전반에 대한 네이티브 멀티 클라우드 기능 및 개방형 표준 기반의 데이터 공유 기능을 제공하고, 로코드(low-code) 기반 도구를 활용하여 데이터 통합 및 분석을 간소화하며, 오브젝트 스토리지와 동일한 비용으로 초고속 엔터프라이즈 스토리지를 제공함으로써 데이터 레이크의 경제성을 높이는데 초점을 맞췄다.
오라클 ADW가 새롭게 선보인 주요 개선점은 ▲멀티 클라우드 데이터 웨어하우스 ▲데이터 레이크의 새로운 개념 제시 ▲데이터 스튜디오 ▲오픈 데이터 공유 등 네 가지이다.
멀티 클라우드 환경에 적합한 데이터 관리 지원
데이터 웨어하우스의 핵심은 데이터가 어디에서 만들어지는지와 상관 없이 모든 데이터를 수집·취합할 수 있어야 한다는 것이다. 특히 멀티 클라우드를 사용하는 기업이 늘면서, 다양한 클라우드 플랫폼에 데이터가 더욱 폭넓게 분포하고 있는 추세이다. 이에 대응해 오라클 ADW는 다양한 데이터 레이크(data lake) 파일 포맷을 지원하고, 클라우드 위치와 무관하게 데이터에 액세스할 수 있도록 개선됐다.
오라클 ADW는 AWS, 애저(Azure), 구글 클라우드(Google Cloud) 상의 오브젝트 스토리지에 대한 안전한 액세스와 함께 애저 SQL(Azure SQL), 애저 시냅스(Azure Synapse), 아마존 레드시프트(Amazon Redshift), 스노우플레이크(Snowflake), 몽고DB(MongoDB), 아파치하이브(ApacheHive),포스트그레SQL(PostgreSQL)에 대한 라이브 SQL 연결, 100개 이상의 데이터 소스로부터 데이터를 수집하는 사전 구축 커넥터를 지원한다. 또한 아파치 아이스버그(Apache Iceberg) 테이블에 대한 쿼리 액세스, AWS 글루(AWS Glue)와의 통합에 기반한 데이터 레이크 스키마 및 메타데이터의 자동 수집 기능도 추가되었다.
럼킨 부사장은 “오라클 ADW는 멀티 클라우드의 데이터를 분석하기 위해 복수의 클라우드를 통합 지원한다. 이에 따라 각각의 클라우드에서 분석 도구를 실행하는 형태를 벗어날 수 있게 됐다” 면서, “네트워크의 통합, 데이터의 통합을 넘어 데이터 소스의 통합으로 확장하는 것이 목표”라고 설명했다.
▲ 데이터 분석을 위한 다양한 도구를 사전 탑재해, 관리 부담을 줄였다.
여러 클라우드의 데이터를 한 곳에서 통합 분석
오라클 ADW는 여러 클라우드에서 데이터 레이크를 선택할 수 있는 새로운 아키텍처를 내세운다. 기존의 데이터 레이크가 여러 클라우드 서비스를 연결해 개방성과 상호운영성 측면에서는 장점 이 있지만, 여러 클라우드 서비스에 대한 관리가 어렵다는 것이 오라클의 시각이다.
이에 따라 오라클 ADW는 최적화된 통합 데이터레이크를 지원하는데 중점을 두고, 다양한 데이터 분석 툴을 단일 플랫폼 위에서 통합 제공하는 전략을 추진하고 있다. 또한 오라클 ADW에 쓰이는 엑사데이터(Exadata) 데이터베이스의 스마트 스토리지 기술을 적용해 데이터 저장을 최적화했으며, 엑사데이터 스토리지의 가격을 75% 이상 인하했다. 럼킨 부사장은 “어떤 아키텍처를 선택하든 같은 비용으로 데이터를 저장할 수 있지만, ADW 스토리지의 데이터에서 직접 쿼리를 실행할 때 더 빠른 속도를 제공한다” 고전했다.
데이터 분석 도구와 커넥터의 관리 간소화
오라클 ADW는 간소화된 데이터 통합 및 데이터 분석 기능도 강화됐다. 오라클은 이번에 로코드 기반의 오라클 자율운영 데이터베이스 데이터 스튜디오(Oracle Autonomous Database Data Studio)를 추가하면서, 단일 UI(사용자 인터페이스)를 기반으로 데이터 생애주기 전반에서 분석, 공유 기술을 통합 제공한다고 밝혔다.
데이터 스튜디오는 다양한 서드파티 기능을 한 곳에서 제공함으로써, 데이터 분석가나 데이터 과학자가 IT 팀의 지원 없이 직접 데이터를 로드, 변환, 분석할 수 있고 이런 작업을 위한 도구를 추 가로 구매하거나 연결해 사용하는 번거로움을 줄인다. 럼킨 부사장은 “데이터 변한 단계에서 OOTB(out-of-the-box : 소프트웨어 구입 후 곧바로 사용할 수 있는 형태)로 활용할 수 있도록 100개 이상의 커넥터를 무료로 사전 탑재했다”면서, “단순하고 저비용, 빠른 속도의 분석 솔루션을 통해 웨어하우스나 데이터 분석 솔루션을 구축하고 관리하는 과정이 더 쉬워질 것”이라고 밝혔다.
▲ 오라클 ADW는 멀티 클라우드의 데이터 관리 효율을 높이고자 했다.
데이터 공유의 개방성 향상
이메일로 파일을 전달하는 것은 여전히 기업에서 업무 데이터를 공유하는 가장 흔한 방법이다. 하지만, 오라클은 오라클 ADW가 업계 표준의 오픈소스 델타 공유(Delta Sharing) 프로토콜을 사 용해 개방형 협업을 지원한다고 소개했다. 고객사는 이 프로토콜을 지원하는 애플리케이션 및 서비스를 통해 사용자들과 안전하게 데이터를 공유할 수 있다. 데이터 공유 속도가 향상되면 비즈니스 의사결정에 오래된 데이터 및 부정확한 분석 결과가 사용되는 것을 방지하고, 보다 나은 의사결정을 내릴 수 있게 된다.
오라클 ADW 사용자는 데이터 스튜디오 내에서 공유할 데이터를 선택하고, 이를 공유받을 사람에게 알려준다. 수신자는 공유 데이터를 파일로 내려받는 것이 아니라, 메일로는 공유에 대한 알림만 받고 실제 데이터는 데이터 스튜디오가 제공하는 API(응용프로그램 프로그래밍 인터페이스)를 통해 자기가 사용하는 툴에서 액세스할 수 있게 된다. 데이터를 공유한 사용자는 공유한 데이터에 누가 언제 액세스하는지 확인할 수 있고, 원래 데이터가 변경될 때 즉시 업데이트하거나 공유된 사용자의 권한을 변경할 수도 있다.
럼킨 부사장은 “오라클 ADW의 데이터 공유가 갖는 가장 큰 차이는 개방성이다. 오라클과 비 오라클 시스템, 회사 내부와 외부를 가리지 않고 데이터를 안전하게 공유할 수 있다. 다른 회사의 솔루 션은 분리된 데이터베이스 사이에는 공유가 불가능하지만, 오라클 ADW는 멀티 클라우드에 적합한 개방형 데이터 공유를 지원한다” 고 설명했다.
▲ 오라클의 조지 럼킨 부사장이 온라인 기자간담회를 통해 오라클 ADW의 주요한 개선점에 대해 소개했다.
■ 기사 내용은 PDF로도 제공됩니다.
작성일 : 2023-06-01