Transcript Document

제 4 강 학습
1
 문 1. 왜 “망고” 쥬스는 맛있어 보일까? (광고)
 문 2. 어떤 유태인이 아우슈비츠는 사진만 보아도 식
은땀을 흘리는가? (환경의 영향)
 문 3. feel이 통하는 것은 어떤 경우인가? (과거 결정
론)
2
<개념들의 구분>
 본능(instinct): 목표지향적인, 생득적으로 계획된 행
동 = 종 특유행동. 연어 회귀.
 반사(reflex): 생득적으로 특정한 자극에 대한 특정
반응(예: 슬개골 반사)
 각인(imprinting): 초기 생존과정에서 결정적 시기에
환경내의 특정 대상과 밀착관계가 급속히 진행되어
그 행위가 영속. (예, 오리).
cf) critical period. 학습과 성숙의 상호작용.
3
<개념들의 구분>
 감각화(sensitization): 감각경험에 따라 환경에 더욱
반응하려는 경향. 예: 기분 나쁜 일 후의 과민 감정(화
가 남 - 예민반응). (신경과민)
 습관화(habituation): 환경에 덜 반응하려는 경향. 특
정 자극에 감각화(기차소리)된 후 익숙해 져서 둔감화.
(아기 실험: 낯가리기).
 성숙(maturation): 나이에 따른 생물학적 변화.
 학습: 이전 경험에 기인한 비교적 영속적인 행동변화
또는 그 변화의 잠재력
4
 학습원리의 필요성:
1) 정상행동과 비정상행동 이해 -> 심리치료
2) 유전과 환경의 상호작용 이해 -> 개인차
3) 실제 교육장면에 응용 -> teaching machine
 행동주의: S-R
5
 초기 행동주의 학습 이론의 가정
1) 행동은 환경에 대한 반응으로 인지적 중개 불필요
2) 관찰 가능한 행동에 초점
3) 등위성 (Equipotentiality): 자극과 반응의 동등
가치
4) 학습 원리의 종 (species) 보편성: 동물 학습 연
구를 통한 인간 학습 이해 (진화론의 영향: 정신과
정에서의 동물과 인간의 연속성 강조)
--> 따라서 초기 학습 연구는 동물 연구에 많이 기초
하고 있으며, 학습의 대상이 되는 행동들도 비교적 초
보적인 행동들이었다.
6
1. Pavlov와 조건반사
 도식적 표현들
무조건 자극 (unconditioned stimulus)
무조건 반응 (unconditioned response)
조건 자극 (conditioned stimulus)
조건 반응 (conditioned response)
 연합의 학습
심리적 반사: Pavlov(소화생리학으로 노벨상)의 개
소화기 실험의 부산물
 정향 반사(orienting reflex): 상황의 다양한 자극에
귀 기울임.
 절차: UCS + CS -> UCR , CS -> CR
7
8
9
2. 주요현상
1) 조건반응의 획득
- 강화시행과 무강화시행
2) 소거
- 실험적 소거: CS의 CR 효과 없음
- 소거와 망각은 별개: spontaneous recovery의 문
제
3) 일반화
-자극일반화: 유사자극에의 반응(전이)
- 일반화 기울기: 유사할소록 CR 비 높음
10
4) 고차조건형성(2순위 조건형성)
절차: 사각형(CS) + 메트로놈 소리(CS이지만 UCS
의 속성) -> CR
- 조건자극의 강화물 속성 활용
5) 변별
- 두 개 이상의 자극 구별 실험신경증: 원과 타원 변
별시킨 후 타원을 원에 가깝게 하면 신경증 걸림.
11
3. 범위
 실험실 밖의 많은 일상반응
 많은 동물 종에서 발견
 특히 다양한 정서 반응: 공포증(phobias)
12
II. 도구적 조건형성 (Instrumental Conditioning)
 동물원의 돌고래: 반응이 원하는 결과(생선)를 초래하
므로 반응이 도구의 역할
 기본적으로 유사(반응의 종류와 강화물의 역할)하지
만 차이점도 존재:
(1) 결과에 의한 학습 - 강화(보상)가 적절한 반응에 의존
(2) 반응 선택의 문제 - 많은 수의적 반응에서 선택됨
13
1. Thorndike의 효과의 법칙
 진화론의 간접 영향: 추리와 이해의 종간 연속성의 문
제
1) Puzzle box 속의 고양이
 수수께끼 상자: 페달을 밟으면 문이 열리는 상자
 수수께끼 상자 속의 고양이가 연습을 거듭할수록 빨리
상자를 벗어남(잠복 시간의 감소)
14
15
2) 효과의 법칙(law of effect)
 어떤 반응의 결과(즉, 효과)가 그 반응의 수행 경향
을 강화 또는 약화시킬지 결정. 즉, 반응에 따라 보
상이 오면 그 반응은 강하게 될 것이고, 보상이 없
으면(또는 처벌) 그 반응은 약하게 될 것. 정반응이
보상과 연합될수록 정반응의 강도 증가.
 동물의 고차 지능, 이해력, 목표 성취 위한 노력을
가정할 필요도 없음.
16
 Thorndike: 효과의 법칙은 적자생존의 법칙의 동
의어. 적절 반응 유지, 부적절 반응 제거.
 동물이 인간처럼 학습하는가(Darwin), 인간이 동
물처럼 학습하는가?
-> 학습자와 학습과제의 동등성 신념: 학습(조건
형성)의 법칙은 모든 상황과 인간을 포함한 모든
동물에 적용된다는 신념
17
18
19
2. Skinner와 조작적 행동
 Thorndike는 두(고전과 도구) 조건형성이 기본적으
로 동일하다고 본 반면, Skinner는 전혀 별개로 봄.
꠆꠆respondent: 특정 자극에 의한 유발 반응 (elicit)
꠆꠆operant: 자발적으로 방출되는 반응 (emit)
 Skinner Box: 반응률 측정하는 장치
20
3. 주요 현상
 강화(reinforcement): CR을 강하게 하는 조작
 행동(학습)은 강화의 결과
 강화 vs. 처벌
 정적
 부적
 정적
 부적
강화:
강화:
처벌:
처벌:
선호자극 존재로 인하여 반응 확률 증가
혐오자극 제거로 인하여 반응 확률 증가
혐오자극 존재로 인하여 반응 확률 감소
선호자극 제거로 인하여 반응 확률 감소
21
선호 자극
혐오 자극
제시
정적 강화(+)
정적 처벌(-)
제거
부적 처벌(-)
부적 강화(+)
단, + 와 – 는 반응의 증가와 감소 표시
22
1) 일반화와 변별: 고전적 조건형성과 유사
2) 조형(shaping)
 계기적 근사법(successive approximation)에 의한 반
응 성취
 오줌 싸개 치료법
3) 미신
 매 15초 마다 먹이 제공받는 비둘기 실험: 배 고플 때
기이한 행동 보임
 반응과 강화물 사이의 인과관계가 없는데도 그릇된 연
합의 학습.
 예) 자동 엘리베이터
23
4) 조건강화
 1차적 강화물(선천적 강화물, 음식)과 2차적 강화
물(조건강화물: 학습된 강화물, 돈) 구분.
 조건강화물의 강도: 실험실 상황에서는 1차보다
낮지만, 실생활에서는 그렇지 않을 수 있는데, 다
른 많은 1차 강화물과 연합의 강도 때문으로 설명.
-> 효과의 법칙의 수정
5) 강화의 지연
 인간과 쥐의 차이: 인간은 시공의 초월 가능. 인간
은 때로 강화의 지연을 극복함
-> 효과의 법칙의 또 다른 수정 많은 행동이 장기
적 결과보다 즉각적 보상에 의해 지배:
예) 흡연. 보상의 기울기 초월의 어려움.
24
6) 강화 계획
 연속 강화 vs. 부분 강화
 연속 강화보다 부분 강화가 학습효과 큼 (즉 소거가
어려움)
예) 간헐적 강화: 도박 & 미신
 비율 계획: 고정 vs. 변화
 간격 계획: 고정 vs. 변화
 비율 계획이 간격계획 보다 우수
 고정 비율 계획
 변화 비율 계획 --- 도박기계 & 가장 높은 반응율
25
III. 인지학습 (Cognitive learning)
 무엇이 학습되는가?
 학습에 대한 행동주의적 이론에 반대
1. 고전적 조건형성의 인지적 견해
1) CS와 UCS의 시간적 관계
 CS와 UCS의 선행, 후행, 동시 짝짓기: 모두 조건형성
가능
 약간 선행(0.5초)이 가장 좋은 결과
26
2) 수반성(contingency)
 Pavlov는 근접성(contiguity)이면 충분하다고 함
 Rescorla의 반론: 수반성
: 조건형성은 CS-UCS의 짝과 무CS-무UCS의
짝에 동시 의존(확률로 설명)
(예) CS-UCS의 짝의 확률이 무CS-무UCS의 짝
의 확률보다 낮으면, 뒤쪽이 조건형성.
 회피상자 실험: 무수반성 조건(소리가 들릴 때와
그렇지 않을 때 전기충격 확률 동일, 40%))과 수반
성 조건(소리가 들리면 40% 충격을 받지만 소리가
들리지 않으면 40% 충격부터 계속 줄어듦).
27
 결과: 수반성 조건에서만 조건형성 발생: 소리의
예언력의 차이. CS 부재는 안전신호.
 학습자는 가설 검증자 혹은 소박한 과학자
 수반성의 부재: 유해한 생리적 효과 발생(무수반성
조건의 쥐가 더 많이 위궤양 걸림).
: 공포와 불안의 구분 - 대상의 유무
28
3) 저지(blocking: 차폐)
 소리(CS)로 조건형성된 쥐에게 “빛과 소리”를 동
시제시 후 빛만 제시하면 조건형성 안됨.
 “부패한 고기 - 애벌레 발생” 짝만 본 사람은 파리
의 역할 무시: 편견의 발생.
4) 수반성 계산
 결론: 고전적 조건형성에서 학습하는 것은 자극의
신호적 성질 (예언력)
 수반성과 자극의 새 정보 가치가 동시에 존재해야
함.
 원시적 형태의 학습: 맹목적, 자동적, 불수의적 통
29
제. 예) 아우슈비츠 수용소 방문 유태인.
2. 도구적 조건 형성의 인지적 견해
 도구적 조건형성에서 수반성: 반응과 강화 사이의 수
반성(유관성) 학습.
 유아의 반응통제: 생후 2 달 아기의 모빌 실험
 학습된 무기력 (Learned helplessness)
: 통제력을 상실한 유기체의 동기적, 인지적, 정
서적 손상(우울증)
Seligman & Maier (1976)의 yoked dog 연구
- 학습된 무기력이 면역체계 약화시킴
30
IV. 행동주의 이론에 대한 진화론의 비판(한계)
 Species- general vs. Species-specific
등위성 가정에 대한 도전 - 종에 따라 학습이 용이한
것이 있고 어려운 것이 있다.
1) 고전적 조건 형성에서 특정 CS와 특정 US는 연합
이 잘됨
 준비성 (preparedness): 선천적 경향성
 미각 혐오는 질병과 연합이 쉬움 (쥐 실험의 경우)
31
32
2) 학습된 미각 혐오와 CS-US 간격
 Garcia 연구: 미각혐오에 대한 지연학습 가능
 진화적 가치
3) 조작적 조건 형성에서 비임의성
예) 비둘기에게 회피반응을 학습시키는데 쪼기 반응
은 부적절 (cf. 날기)
33
V. 동물의 복잡한 인지
 인지도 (cognitive map): Tolman의 견해
 잠재 학습 (Latent learning)
 통찰 행동: Kohler의 통찰 학습
 학습과 수행의 구분: 강화(보상)는 학습 변수가 아니
라 수행 변수. 강화 없이 단순 관찰로도 학습 가능
34
35
36
37