• 회원가입
  • |
  • 로그인
  • |
  • 장바구니
  • News
    뉴스 신제품 신간 Culture & Life
  • 강좌/특집
    특집 강좌 자료창고 갤러리
  • 리뷰
    리뷰
  • 매거진
    목차 및 부록보기 잡지 세션별 성격 뉴스레터 정기구독안내 정기구독하기 단행본 및 기타 구입
  • 행사/이벤트
    행사 전체보기 캐드앤그래픽스 행사
  • CNG TV
    방송리스트 방송 다시보기 공지사항
  • 커뮤니티
    업체홍보 공지사항 설문조사 자유게시판 Q&A게시판 구인구직/학원소식
  • 디렉토리
    디렉토리 전체보기 소프트웨어 공급업체 하드웨어 공급업체 기계관련 서비스 건축관련 업체 및 서비스 교육기관/학원 관련DB 추천 사이트
  • 회사소개
    회사소개 회사연혁 출판사업부 광고안내 제휴 및 협력제안 회사조직 및 연락처 오시는길
  • 고객지원센터
    고객지원 Q&A 이메일 문의 기사제보 및 기고 개인정보 취급방침 기타 결제 업체등록결제
  • 쇼핑몰
케라스와 코랩을 활용한 간단한 딥러닝 모델 훈련, 모델 저장 및 재사용
2019-09-02 3,000 26

BIM 칼럼니스트 강태욱의 이슈 & 토크

 

해외 건설분야에서는 딥러닝과 같은 인공지능 기술 기반 스타트업이 큰 투자를 받고 있다. 이번 호에서는 딥러닝 환경을 쉽게 구축해 학습할 수 있는 방법을 소개한다.

 

■ 강태욱 | 건설환경 공학을 전공하였고 소프트웨어 공학을 융합하여 세상이 돌아가는 원리를 분석하거나 성찰하기를 좋아한다. 건설과 소프트웨어 공학의 조화로운 융합을 추구하고 있다. 팟캐스트 방송을 통해 Engineering digest와 관련된 작은 메시지를 만들어 나가고 있다. 현재 한국건설기술연구원에서 BIM/GIS/FM/BEMS/역설계 등과 관련해 연구를 하고 있으며, 연구위원으로 근무하고 있다.

이메일 | laputa99999@gmail.com
페이스북 | www.facebook.com/laputa999
홈페이지 | https://sites.google.com/site/bimprinciple
팟캐스트 | http://www.facebook.com/groups/digestpodcast

 

딥러닝 개발은 코딩보다는 딥러닝 환경 설과 데이터 구축에 많은 노력이 들어간다. 예를 들어 딥러닝 환경설정은 무한 삽질로 빠지는 경우가 있다. 우분투, 텐서플로(Tensorflow), 케라스(Keras) 등의 설정은 GPU와 궁합이 잘 맞지 않을 경우 우분투부터 여러 번 설치해야 할 수 있다. 딥러닝 학습 모델에 필요한 데이터 세트를 모으고 라벨링하는 작업은 정말 피곤한 일이다. 이후 라벨링된 데이터 세트를 얻은 후에도 딥러닝 모델 학습에 맞게 구조화하는 작업도 귀찮은 것이다. 케라스는 이러한 일을 단순화시켜주는 기능을 제공한다.


이번 호에서는 딥러닝 환경으로 구글의 코랩(CoLab)을 사용한다. 케라스의 ImageDataGenerator는 수집한 데이터 파일들을 폴더에 <그림 1>과 같이 넣어 두면, 폴더명을 라벨로 사용해 각 데이터 파일에 라벨링을 자동으로 처리한다. 이를 이용하면 라벨링하는 노력을 아낄 수 있다.

 


trainset/cats
         /dogs
testset/cats
         /dogs
 

 

이번 호에서는 다음과 같은 CNN(Convolutional Neural Network) 모델을 학습할 때 좀 더 손쉬운 학습 데이터를 준비, 훈련, 저장 및 재사용 방법을 간략히 정리한다.

 


그림 1. CNN Deep Learning Model(Convolutional Neural Networks with Data Augmentation using Keras, kaggle)

 

이 글에서는 데이터 준비 및 훈련 방법에만 초점을 맞추기 위해 Cat, Dog 이미지 데이터를 사용한다. 딥러닝 도구는 케라스의 CNN을 사용할 것이다.

 

1. 데이터 준비
우선 다음 압축파일을 다운로드 받는다. 이 파일 안에는 구글에서 얻은 고양이와 개 이미지 파일들을 훈련용 8000개, 테스트용 2000개를 가지고 있다.


■ CNN 소스코드 및 데이터 : https://sds-platform-private.s3-us-east-2.amazonaws.com/uploads/P14-Convolutional-Neural-Networks.zip

 

코랩 서버에 훈련 데이터 세트를 업로드하기 위해, 압축파일을 풀고 dataset 폴더를 별도 zip 파일으로 압축한다. 참고로, 이 데이터 세트 구조는 <그림 2>와 같다.

 


그림 2. 딥러닝 데이터 세트 구조

강태욱 laputa99999@gmail.com


출처 : 캐드앤그래픽스 2019년 9월호

포인트 : 무료

© 캐드앤그래픽스 무단전재 및 재배포금지, 기사 게재 희망시 당사 문의
  • kakao

댓글 0

로그인 후 댓글을 달수있습니다
등록된 코멘트가 없습니다.