PowerPoint - Data Mining Research Lab., Sogang Univ.
Download
Report
Transcript PowerPoint - Data Mining Research Lab., Sogang Univ.
Data Mining
Lab Assignment 4
Deep Learning
Data Mining (CSE5312/CSEG312), 2015 Fall
1
Exercise 1
Deep Learning with Package ‘h2o’
Data Mining (CSE5312/CSEG312), 2015 Fall
2
Example 1: Package ‘h2o’
R Ver 3.2.2 확인 필수
R 패키지 h2o 설치
h2o 패키지 로드
library(h2o)
h2o 패키지 설명
install.packages("h2o") 함수를 사용하여 패키지를 설치한다.
help(h2o) or https://cran.r-project.org/web/packages/h2o/h2o.pdf
데이터
MNIST handwritten digits
http://pjreddie.com/projects/mnist-in-csv/
상단의 train set, test set 다운, 데이터 형태 =
Data Mining (CSE5312/CSEG312), 2015 Fall
Label
x1
x2
x3
…
3
x784
Example 1: Package ‘h2o’
R Ver 3.2.2 확인 필수
#패키지 설치
install.packages("h2o")
#패키지 로드
Library(h2o)
(필수)
#작업 공간 설정
setwd("work path")
#h2o 실행
localH2O = h2o.init(ip = "localhost", port = 54321,
startH2O = TRUE, nthreads = -1,
max_mem_size = '10g', min_mem_size = '8g')
Data Mining (CSE5312/CSEG312), 2015 Fall
4
앞 페이지의 h2o 패키지 설명을 참조하여
자신의 컴퓨터 사양에 알맞는 nthreads, max_mem_size, min_mem_size를 설정한다.
Example 1: Package ‘h2o’
실행 결과 및 접속
Data Mining (CSE5312/CSEG312), 2015 Fall
5
Example 1: Package ‘h2o’
- Import Files -
Data Mining (CSE5312/CSEG312), 2015 Fall
6
Example 1: Package ‘h2o’
- Import Files 첫 번째 행은
“Label” 이기 때문에
“Enum”으로 설정
Data Mining (CSE5312/CSEG312), 2015 Fall
Test Set도 마찬가지로
import 한다.
7
Example 1: Package ‘h2o’
- Build Model 1. “hw4_학번_m” 으로 생성
2. Train data set으로 설정
3. Set N-fold cross-validation
4. Label 에 해당하는 column 설정
5. Deep Neural Network 설정
Data Mining (CSE5312/CSEG312), 2015 Fall
8
6. 설정 후 맨 아래 Build Model 버튼 클릭
Example 1: Package ‘h2o’
- Build Model -
“▶” 버튼을 클릭하여 자세한 내용 확인
Data Mining (CSE5312/CSEG312), 2015 Fall
9
Example 1: Package ‘h2o’
- Predict Model -
“hw4_학번_p” 로 생성
Test data set으로 설정
Data Mining (CSE5312/CSEG312), 2015 Fall
“▶” 버튼을 클릭하여 자세한 내용 확인
10
Example 1: Package ‘h2o’
- Save Model -
앞의 설정된 작업 공간에 폴더가 생성
Data Mining (CSE5312/CSEG312), 2015 Fall
11
Example 1: Package ‘h2o’
- Save Flow 1. “hw4_학번” 로 생성
2. Flow Save
다운로드 폴더에 .flow 파일 생성
3. Download this Flow
Data Mining (CSE5312/CSEG312), 2015 Fall
12
Exercise 1
1.
Example을 수행한다.
2.
9, 10 page 에서 “▶” 를 눌러 확인할 수 있는 Model과 Predict의 결과를 바탕으로
MNIST Data Set을 Deep Learning에 적용한 과정 및 결과를 간략하게 보고서에 서술한다.
3.
보고서와 저장한 Flow 파일, 추출한 Model 폴더를 .zip 파일로 압축하여 제출한다.
Data Mining (CSE5312/CSEG312), 2015 Fall
13
Exercise 2
Deep Learning with Theano
Data Mining (CSE5312/CSEG312), 2015 Fall
14
Example 2: Theano
Theano
CPU/GPU symbolic expression compiler in python
http://deeplearning.net/software/theano/
Theano install(Linux & MAC os)
Deep Learning Tutorial
http://deeplearning.net/software/theano/install.html
http://deeplearning.net/tutorial/
Git repository
Theano : https://github.com/Theano/Theano
DeepLearningTutorial : https://github.com/lisa-lab/DeepLearningTutorials
Data Mining (CSE5312/CSEG312), 2015 Fall
15
Example2 : Theano in Windows
Theano With CUDA in Windows.hwp를 참고하여 설치한다.
문서에서 프로그램의 버전 및 경로가 다를 경우 해당 부분을 자신의 환경에 맞게 수정한다.
위의 방법으로 문제 발생시
VMware 나 Dual-booting 등으로 Ubuntu를 설치하는 것을 추천합니다.
Data Mining (CSE5312/CSEG312), 2015 Fall
16
Example : Theano in Windows
https://github.com/lisa-lab/DeepLearningTutorials 에서 zip 파일을 받아 압축을 해제한다.
C:\SciSoft\env.bat 파일을 실행하여 cmd를 실행시킨 후
Python DeeplearningTutorials/code/DBN.py를
실행해 보고 결과를 확인한다.
Data Mining (CSE5312/CSEG312), 2015 Fall
17
Example 2: Theano in Linux & MAC os
Theano에서 제공하는 Document를 참고한다.
Linux
http://deeplearning.net/software/theano/install.html#linux
MAC os
http://deeplearning.net/software/theano/install.html#mac-os
Data Mining (CSE5312/CSEG312), 2015 Fall
18
Example2 : Theano install
Windows - Docker
Docker (https://www.docker.com/) for Window 8/8.1 or newest
2013년에 등장한 새로운 컨테이너 기반 가상화 도구로써, 계층화된 파일시스템(AUFS, BTRFS 등)
을 사용해 가상화된 컨테이너의 변경사항을 모두 추적하고 관리한다. 이를 통해 컨테이너의 특정
상태를 항상 보존해두고, 필요할 때 언제 어디서나 실행할 수 있다.
http://docs.docker.com/windows/started/ 를 참고하여 Docker를 설치한다.
※
Window 7인 경우는 설치를 추천하지 않습니다.
※
설치 중 문제 발생 시 뒤의 다른 방법으로 설치를 진행하시기 바랍니다.
Data Mining (CSE5312/CSEG312), 2015 Fall
19
Example2 : Theano install
Windows - Docker
윈도우 8 이상에서 Docker를 설치 후 Docker Quickstart Terminal를 실행하면
아래와 같은 창이 뜨고, IP가 제대로 할당되어 네트워크가 연결됨을 확인한다.
Data Mining (CSE5312/CSEG312), 2015 Fall
20
Example2 : Theano install
Windows - Docker
다음 명령어를 실행한다.
docker run -it kaixhin/theano
Data Mining (CSE5312/CSEG312), 2015 Fall
21
Example2 : Theano install
Windows - Docker
성공적으로 theano가 설치된 가상환경이 구축되었으면 다음 명령어를 수행한다.
git clone https://github.com/lisa-lab/DeepLearningTutorials
이어 DeepLearningTutorials/code/DBN.py를 실행하여 Deep Belief Network를 이
용한 MNIST data의 학습 및 분류작업을 수행하여 본다.
Data Mining (CSE5312/CSEG312), 2015 Fall
22
Exercise 2
1.
http://deeplearning.net/tutorial/DBN.html#dbn 을 읽고 간략하게 DBN(Deep
Belief Network에 대해 보고서에 서술한다.
2.
Example 및 문서 및 웹사이트를 참고하여 Theano를 설치한다.
3.
Deep Learning Tutorials의 code/DBN.py를 GPU로 수행하고 실행화면 또는
결과를 캡처하여 첨부한다.
Data Mining (CSE5312/CSEG312), 2015 Fall
23
Summary
Exercise 요약 (해야 할 일)
Exercise 1
1.
Example을 수행 후, 수행한 내용인 .flow 파일과 추출한 모델 폴더를 압축한 .zip 파일을 제출한다.
2.
Example을 수행한 과정 및 결과를 Model과 Prediction(9p, 10p)의 내용을 바탕으로 보고서에 서술한다.
Exercise 2
1.
DBN(Deep Belief Networks에 대해 간략하게 보고서에 서술한다.
2.
Theano를 설치하고 DeepLearningTutorials의 DBN.py를 실행 후 실행 화면을 캡처하여 보고서에 첨부한다.
Data Mining (CSE5312/CSEG312), 2015 Fall
24
Submission
제출물: 각 Exercise 에 대한 보고서
제출 기한: 2015년 12 월 10 일 24:00 전까지
제출 방법
Softcopy: 조교에게 e-mail로 제출 ( [email protected] )
dm2015_hw4_학번_이름.zip
(보고서, hw4_학번.flow, hw4_학번_m.zip)
Email 제목 : dm2015_hw4_학번_이름
Data Mining (CSE5312/CSEG312), 2015 Fall
25