딥러닝의 개념, 동향 및 CNN 기반 비전
이번 호에서는 비욘드 BIM(Beyond BIM)의 관점에서 4차 산업혁명에서 큰 역할을 하게 될 인공지능, 특히 머신러닝(Machine Learning) 기법 중 딥러닝(Deep Learning) 기술 연구 동향을 소개한다. BIM은 응용에 따라 딥러닝의 좋은 데이터 소스가 될 수 있다. 그리고 최근 비전 분야에서 좋은 성능을 보여주고 있는 CNN(Convolutional Neural Network)에 대한 개념 및 학습 모델 개발 방법을 함께 소개한다. 비전은 Scan to BIM의 핵심 기술 중 하나이다. CNN은 비전 분야에서 새로운 지평을 열어가고 있다. 여기서는 CNN의 대표적인 예제인 MNIST 필기체 이미지 인식을 구글 텐서플로를 통한 개발 방법을 간단히 설명한다.
1. 딥러닝 기술 동향
현재 딥러닝은 응용·목적별로 다양한 신경망으로 발전하고 있다. 이번 호에서는 대표적인 딥러닝 신경망 기술 동향 및 개념을 소개한다.
(1) 컨볼루션 뉴럴 네트워크
비전(Vision) 분야에서 잘 활용되는 컨볼루션 뉴럴 네트워크(CNN : Convolutional Neural Network, 컨브넷)는 학습 데이터의 특징을 추출하는 특징 추출기를 신경망 학습 과정에 포함시켜 일괄적으로 처리한다. 패턴 인식에서 많이 사용하는 특징 추출기 신경망의 가중치는 학습을 통해 결정된다. CNN에 입력된 원본 이미지는 앞쪽의 특징 추출 신경망을 통과한다. 여기서 추출된 이미지 특징 맵(Feature Map)은 분류 신경망에 다시 입력된다. 분류 신경망은 이미지 특징을 기반으로 이미지 최종 범주를 분류한다. 특징맵을 생성하는 필터까지도 학습이 가능해 비전 분야에서 성능이 우수하다.
그림 1. CNN 기반 동물 이미지 학습 분류(PyImageSearch)
(2) 순환신경망
순차적 데이터에서 규칙적인 패턴을 인식하고, 추상화된 정보를 추출할 수 있는 순환신경망(RNN : Recurrent Neural Network)(Sepp Hochreiter, 1997)은 텍스트, 음성, 음악, 영상 등을 다루는 데 적합하다. RNN은 그래디언트 소실 문제(Gradient Vanishing Problem)가 있어 최적해를 계산하지 못하는 경우가 있었다. 이를 개선하기 위해 LSTM(Long Short Term Memory)가 개발되었다. RNN 문제는 LSTM으로 어느 정도 해결되어 인공지능 기반 번역, 자동 작곡, 작사, 저술, 주가 예측 등 다양한 분야에서 활용되고 있다.
그림 2. LSTM 기반 음악 작곡(Konstantin Lackner, 2016)