이번 호에서는 Beyond BIM의 관점에서 4차 산업혁명의 큰 역할을 하게 될 인공지능, 특히 머신러닝(Machine Learning) 분야에서 좋은 성능을 보여주고 있는 딥러닝(Deep Learning) 신경망 학습모델인 CNN(Convolutional Neural Network)에 대한 개념을 간략하게 정리하고, 최근 스캔-비전 분야에서 활용사례를 소개한다.
페이스북이 기존 RNN 기반 번역 기술보다 9배 속도가 빠른 컨볼루션 뉴럴 네트워크(Convolutional Neural Network : CNN) 기반의 번역 기술인 CSSL(Convolutional Sequence to Sequence Learning)을 오픈소스로 깃허브(GitHub)에 공개했다.
페이스북은 언어 장벽을 넘기 위해 경쟁사보다 9배 빠른 기계학습 번역기술을 개발한 것이다. 페이스북 인공지능 그룹(Facebook AI Research Group : FAIR)의 과학자인 Michael Auli와 David Grangier는 이 기술을 더 발전시켜 페이스북 제품에 적용할 것이라고 언급하고 있다. 이 기술은 평소 대화에서 사용하는 구어체를 인식할 수 있다. FAIR는 CSSL 기법이 세계 6500개의 언어 자동 번역이 가능한 잠재력을 가지고 있다고 언급했다.
그림1. 영어-독일어 번역 신경망 훈련 개념도(텍스트 문장이 인코딩되고, Gated Linear Unit는 시그모이드와 곱을 계산한다. 왼쪽 아래 Decoder Context Representation에서 Dot Product를 계산해, 번역될 단어를 예측한다. Jonas Gehring 외, 2017. 5)
1. CNN 딥러닝 학습모델 개념
딥러닝 기법 중 하나인 CNN은 오래 전 사용했던 패턴인식기술에 보았던 특징 추출 기법을 활용한다. 처음 CNN에서 이미지 특징(Feature) 추출용 필터(Filter)와 신경망이 잘 조합된 네트워크를 보았을 때, 필자는 참 괜찮은 기술이라 생각했다. 특징을 잘 표현하는 필터와 라벨(Label) 매칭(Matching) 모델을 잘 정의해 학습시키면 비전, 신호, 음성, 역설계 등 다양한 응용이 가능하다. CNN은 특징 전체를 조망하고 학습하는 강점과 범용성을 가지고 있다.