뉴로 컴퓨터 개론 제 14 장 제 14 장 뉴로 컴퓨터 응용 제 14 장 뉴로 컴퓨터 응용.

Download Report

Transcript 뉴로 컴퓨터 개론 제 14 장 제 14 장 뉴로 컴퓨터 응용 제 14 장 뉴로 컴퓨터 응용.

뉴로 컴퓨터 개론
제 14 장
1
제 14 장
뉴로 컴퓨터 응용
2
제 14 장 뉴로 컴퓨터 응용
차례
14.1
14.2
14.3
14.4
14.5
14.6
14.7
음성 합성
음성 인식
문자 인식
영상 처리
무인 자동차 주행
로봇 제어
의료 진단 시스템
3
제 14 장 뉴로 컴퓨터 응용
음성 합성
4
음성 합성
NETtalk
T. Sejnowski & C. Rosenberg
영어 문장을 입력하여
음소들로 변환
5
제 14 장 뉴로 컴퓨터 응용
음성 합성
NETtalk 신경망 구조
/k/
출력층
은닉층
입력층
(-
a
-
c
a
t
-)
6
제 14 장 뉴로 컴퓨터 응용
음성 합성
NETtalk 신경망
 입력층
인접한 7개 문자 입력 위해 7개 그룹
각 그룹은 알파벳과 구두점 표현하기 위해 29개 뉴런
전체 203개 뉴런
 은닉층
학습 효율을 고려하여 80개 뉴런
 출력층
음소와 강세등을 표현하기 위해 26개 뉴런
7
제 14 장 뉴로 컴퓨터 응용
음성 합성
NETtalk 성능

연결 강도
임의의 작은 값(-0.3∼+0.3)으로 초기화

BP 알고리즘

학습 패턴
웹스터 포켓 사전에서 1,000개 단어 선택

95% 정확도
8
제 14 장 뉴로 컴퓨터 응용
음성 인식
9
음성 인식
음성 타자기
T. Kohonen
입력한 음성을 인식하여
상응하는 문자 출력
10
제 14 장 뉴로 컴퓨터 응용
음성 인식
포노토픽 맵 형성을 위한 신경망 구조
입
력
출력
11
제 14 장 뉴로 컴퓨터 응용
음성 인식
포노토픽 맵 신경망

입력층
음성 신호 15개 스펙트럼으로 분해하여 입력
15개 뉴런

출력층
96개 뉴런
12
제 14 장 뉴로 컴퓨터 응용
음성 인식
포노토픽 맵
a
a
o
o
a
a
o
o
l
a
a
o
o
l
ah
h
u
. .
. .
h
m
u
h
r
h
u
v
r
r
m
vm
p
tk
k
l
r
v
v
v
r
a
v
e
pt
g
n
n
d
k
g
m
n
d
p
t
y
p
y
h
p
i
h
i
j
hi
k
h
i
i
j
r
p
j
j
r
e
j
hj
p
t
y
n
t
e
j
s
s
s
13
제 14 장 뉴로 컴퓨터 응용
음성 인식
포노토픽 맵의 반응 시퀀스
 음성 파형 분석시간 9.83ms
14
제 14 장 뉴로 컴퓨터 응용
음성 인식
음성 타자기 성능

자율 학습법(SOM)

k, p, t 음소의 명확성 떨어짐

92%∼97% 인식률
15
제 14 장 뉴로 컴퓨터 응용
문자 인식
16
문자 인식
우편번호 인식 시스템
T. LeCun
필기체 숫자의
우편번호 인식
17
제 14 장 뉴로 컴퓨터 응용
필기체 숫자 인식 신경망 구조
문자 인식
18
제 14 장 뉴로 컴퓨터 응용
문자 인식
필기체 숫자 인식 신경망

입력층
한 숫자를 정규화한 16×16 그레이 영상 입력
256개 뉴런

은닉층
3계층으로 구성
각각 768개, 192개, 30개 뉴런

출력층
0∼9의 숫자를 표현하기 위해 10개 뉴런
제 14 장 뉴로 컴퓨터 응용
19
문자 인식
우편번호 인식 시스템 성능

BP 알고리즘

학습 패턴
손으로 쓴 7,291개 우편번호

학습에 사용된 패턴 0.14% 오인식

일반 패턴 5% 오류
20
제 14 장 뉴로 컴퓨터 응용
영상 처리
21
영상 처리
SexNet
B. Golomb & T. Sejnowski
사람 얼굴을 입력하여
남녀의 성별을 판별
22
제 14 장 뉴로 컴퓨터 응용
영상 처리
전처리
 512×512 얼굴 영상
 눈을 수평하게 위치
 두 눈의 간격 12개 화소
 눈과 입의 간격 8개 화소
 전체 30×30 영상 축출
23
제 14 장 뉴로 컴퓨터 응용
영상 처리
영상 압축
 전처리한 영상을 40개 화소로 압축하기 위해
영상 압축 신경망에 입력
 영상을 영상 압축 신경망에 입력하여
 동일한 영상이 출력되도록 학습
24
제 14 장 뉴로 컴퓨터 응용
영상 처리
영상 인식
 영상을 영상 압축 신경망에 입력하여
은닉층의 출력 얻고
이를 영상 인식 신경망의 입력으로 사용
 영상 인식 신경망은 남녀 식별
25
제 14 장 뉴로 컴퓨터 응용
영상 처리
영상 압축 신경망 구조
출력층
은닉층
입력층
26
제 14 장 뉴로 컴퓨터 응용
영상 처리
영상 압축 신경망

입력층
전처리된 30×30 영상 입력
900개 뉴런

은닉층
40개 뉴런

출력층
900개 뉴런
27
제 14 장 뉴로 컴퓨터 응용
영상 처리
영상 인식 신경망 구조
출력층
은닉층
입력층
28
제 14 장 뉴로 컴퓨터 응용
영상 처리
영상 인식 신경망
입력층

압축 영상 입력 위해 40개 뉴런
은닉층

40개 뉴런
출력층

남녀 식별 위해 1개 뉴런
29
제 14 장 뉴로 컴퓨터 응용
영상 처리
SexNet 성능

BP 알고리즘

학습 패턴
남녀 각각 45명씩 90명의 사진

89% 남녀 인식률
30
제 14 장 뉴로 컴퓨터 응용
영상 처리
영상 복원 시스템
Y. Zhou & R. Chellappa
손상된 영상을
Hopfield 모델을 이용하여 복원
31
제 14 장 뉴로 컴퓨터 응용
영상 처리
손상된 영상 복원
원래의 영상 손상된 영상
가역 필터
신경망
32
제 14 장 뉴로 컴퓨터 응용
무인 자동차 주행
33
무인 자동차 주행
ALVINN 무인 주행 시스템
D. Pomerleau
도로 영상을 입력 받아
자동차가 자동 주행할 수 있도록
핸들을 조작하는 시스템
34
제 14 장 뉴로 컴퓨터 응용
무인 자동차 주행
ALVINN 신경망 구조
35
제 14 장 뉴로 컴퓨터 응용
무인 자동차 주행
ALVINN 신경망

입력층
도로 상황을 촬영한 영상 정보/거리 정보/명암 정보
1,217개 뉴런

은닉층
29개 뉴런

출력층
핸들 조작을 위해 46개 뉴런
36
제 14 장 뉴로 컴퓨터 응용
무인 자동차 주행
ALVINN 성능

BP 알고리즘

학습 패턴
1,200개 도로 영상

ALVIN 시스템을 장착한 자동차로
도로에서 무인 시험 주행 성공
37
제 14 장 뉴로 컴퓨터 응용
로봇 제어
38
로봇 제어
이동식 로봇
S. Nagata
빛 센서, 초음파 센서 등의 센서를 통해
외부 자극을 입력받아
전후진, 좌우회전, 경보음 등으로 반응하는
이동식 소형 로봇
39
제 14 장 뉴로 컴퓨터 응용
로봇 제어
이동 로봇 제어 신경망 구조
40
제 14 장 뉴로 컴퓨터 응용
로봇 제어
이동 로봇 제어 신경망

이성망
입력층
13개 뉴런
은닉층
9개 뉴런
출력층
7개 뉴런
로봇의 반응
본능망에의 흥분 및 억제 신호 입력

본능망
입력층/은닉층/ 출력층 각각 5개 뉴런
41
제 14 장 뉴로 컴퓨터 응용
로봇 제어
이동 로봇 제어 성능

BP 알고리즘

로봇 제어에의 활용 가능성 입증
42
제 14 장 뉴로 컴퓨터 응용
의료 진단 시스템
43
의료 진단 시스템
DESKNET
Y. Yoon & L. Peterson
의대생 교육용
피부병 진단 시스템
44
제 14 장 뉴로 컴퓨터 응용
의료 진단 시스템
DESKNET 신경망 구조
45
제 14 장 뉴로 컴퓨터 응용
의료 진단 시스템
DESKNET 신경망

입력층
피부병 징후와 임상 자료 96가지
96개 뉴런

은닉층
20개 뉴런

출력층
건선, 백선 등 10가지 피부병 진단
10개 뉴런
46
제 14 장 뉴로 컴퓨터 응용
의료 진단 시스템
DESKNET 성능

BP 알고리즘

학습 패턴
환자 250명 자료

환자 99명 대상 실험

건선

나머지 병
정확도 30%
정확도 70%∼80%
47
제 14 장 뉴로 컴퓨터 응용