인지신경기반 언어정보처리 시스템 개발

Download Report

Transcript 인지신경기반 언어정보처리 시스템 개발

인지신경기반 언어정보처리
시스템 개발
남기춘(고려대학교 심리학과)
임희석(천안대학교 정보통신학부)
차례
• 연구 필요성 및 목적
• 개발실적
• 추진 방법
• 기대 효과
연구 필요성
• 인간 언어정보처리 원리 규명을 위한 언어학
및 언어심리학, 신경언어학, 의학, 전산언어학
등의 다학문적 접근(문제의 복잡성)
• 학제간 연구팀 육성에 필요(장기적 속성)
• 언어정보처리시스템 개발의 기반 제공
• 언어장애인의 평가와 재활치료 시스템 개발의
기반 제공
연구 목표
• 최종 연구 목표
– 인지신경과학 연구에 따른 형태소와 구문
정보처리 자료를 기반으로 정상뇌와 손상
뇌 모형을 규명하고,
– 한국어정보처리시스템, 언어교육, 언어장애
재활 개발을 위한 한국어 형태소 및 구문
분석/생성 시스템 개발
연구개발실적 1: 연구기반 조성
1. 고대 연구팀 구성(박사 9명; 박사과정 4명; 석사과정 6명)
참여교수
평가도구 팀
브레인매핑
팀
시뮬레이션
팀
언어 및 음
성 장애팀
남기춘1
박권생2
최양규3
오현금4
임희석5
김수진6
팀장: 편성범7
팀장: 김동휘8
팀장: 임희석
팀장: 김수진
정재범10
조혜숙10
황유미11
권미선12
이홍재13
채수경14
권유안10
이윤형10
정재범10
김가영9
권혜원10
조혜숙10
1:고려대학교 심리학과 2:계명대학교 심리학 3: 춘해대학교 유아치료학과 4: 고려대학교
불어불문학과 5:천안대학교 정보통신학부 6: 나사렛대학교 언어치료학과 7:보훈병원 재활의학과
8:고려대학교 의과대학 재활의학과 9:고려대학교 재활의학과 언어치료실 10: 고려대학교
심리학과 대학원 11:고려대학교 언어과학과 대학원 12:이화여자대학 언어병리학과 대학원 13:
삼성병원 영상연구실 14: 한라대학교 보건학과
2. 실질적 공동 연구
1). 1회/1주일 공동 세미나 개최
2). 1회/1주일 research 회의
3). 3회/1년 외부인포함 워크샵 개최
4). 한국언어청각 임상학회(2000) 개최
연구개발실적 2:
실어증 환자 연구
• 연구 성과
– 문장이해관련 어휘, 통사, 의미 시스
템의 뇌영역 규명(이홍재 등, 2001)
– 단어 산출에 관련된 뇌 영역 확인(김
동휘, 2001; 편성범 등, 1999)
• 단어산출의 의미시스템과 어휘시스
템 분리
• 의미시스템의 구분
– 문자 해독 장애 규명(조경덕 등,
1998)
– 한글과 한자의 뇌영역 확인(권미선
등, 2000; 이동훈 등, 2001)
– 언어 이해 관련 대뇌 좌우반구 비대
칭성(문영선, 등, 1999; 이홍재 등,
1998)
– Subcortical Area와 언어 산출의 상
관 규명(김동휘, 2000, 2001)
연구개발실적 3:
fMRI 연구
감산법 특정영역 확인
문법
우리집 마당에 꽃이 피우다
영수가 학교에서 담배를 피우다
통사
문장의미
18261
20000
문장
의미
15000 17663
10000
3409
5000
아버지가 학교에서 가방을 읽는다
아버지가 거실에서 신문을 읽는다
통사
0
2173
좌반구
우반구
한글문장 처리과정 : 1) 통사 : 우반구 BA44,45 영역 활성화
2) 문장의미 : 좌반구 BA39 영역 활성화
3) 편재화 : 좌반구 우세
의미
연구개발실적 4:
뇌파 측정을 통한 ERP 연구
0.1
0.08
어휘
형태
0.06
0.04
0.02
0
fz
c3
c4
cz
pz
o1
o2
0.1
•한글문장 정보처리
0.08
문법
0.06
0.04
0.02
0
fz
c3
c4
cz
pz
o1
o2
0.100
문장
의미
초기문법처리
-> 어휘와 의미처리
-> 통사재분석,
의미재통합
어휘: 후두엽
0.080
0.060
문법: 전두엽
0.040
0.020
의미: 대뇌전영역
0.000
fz
c3
c4
cz
pz
o1
o2
(한글:SOV구조)
연구개발실적 5:
한국어기능어미 지식 표상
CP
/
• 연구 성과
– 한국어 이해와 산출에 관련된 통
사 지식 구조 규명(황유미 등,
1999, 2000)
– 한국 용언 어휘의 분류 규명(김윤
정 등, 2000; 황유미 등, 2001)
• 본용언/보조용언 구분
• 규칙용언/불규칙용언 구분
• 화시적/조응적 대명사 분류
– 한국어 통사 이해와 산출의 해리
(남기춘 등, 2000)
\
C' ① C만 손상
/ \
C TP
/
\
T' ② C와 T손상
/ \
T
NegP
/ \
AgrP
/ \
Agr' ③ C,T,Agr 손상
/
\
Agr VP
/ \
V
NP
연구개발실적 6:
한국어정보처리 시스템
• 연구 성과
– 형태소와 어휘의 표면구조와 심
층구조 구분(남기춘 등, 2001;
정재범 등, 1998, 2001)
– 어절중심의 전자사전과 형태소
중심의 전자사전 설계(임희석,
2000; 정재범 등, 1999)
– 품사별 차별적 전자사전 설계
(권유안 등, 2001)
– 형태소와 어휘의 의미 중심 심
층구조 설계
– 용례기반 한국어 구문분석
– 한국어 어휘출현빈도 검색시스
템
– 연관어휘 획득 시스템 개발(한
국어/영어)
연구개발실적 7:
언어장애 분류 및 network 구축
• 연구성과
– 언어장애의 대분류 및 세분류
•
•
•
•
Anomia 환자의 세분류
Broca 환자의세분류
Dyslexia 환자의 세분류
Apraxia와 Dysarthria분류
– 언어장애 평가 도구
• 검사 SET
– Anomia 검사 SET
– Agramatism 검사 SET
• 개별 검사 도구
– 어휘 정보처리 손상 평가도구, 형태소-정보처리 손상 도구, 이해와 산출 손상 평
가 도구, 통사 지식 표상 손상 평가 도구
• 난독증 평가도구
– 실어증 연구 네트워크 구축
• 고대병원, 한국보훈병원, 경희의료원, 중앙병원, 삼성병원, 이대언
어병리협동과정
• 성북구 보건소, 서대문구 보건소
연구방법 1: 학제적 접근
정보처리론 접근
한국어 형태/구문
지식표상 규명
한국어정보처리
대뇌신경회로망 규명
신경해부학 접근
전산학 접근
한국어 형태/구문
정보처리모형
컴퓨터 시뮬레이션
한국어정보처리시스템
언어장애 분류
및 DB 구축
손상 뇌 접근
연구방법 2: 추진전략
표준과학연구원
뇌과학연구센타
- fMRI 측정기술
- MEG 측정기술
언어처리 연구
패러다임
대뇌 시공간
영상자료
고려대
- 인지신경계산언어모형
- 언어지식표상
계산주의 언어
모형 실험결과
인지계산
언어모형
손상뇌 자료
인지신경
언어모형
고대병원
천안대
- 손상뇌 언어처리 모형
-손상뇌DB 구축
-Brain Mapping
계산 언어 모형
-형태,구문정보처리시스템
-형태소,어휘,구문전자사전
기대성과 및 활용방안
활용
분야
언어교육
시스템
언어장애
재활보조
시스템
자연어
처리
시스템
인지 신경기반 한국어 형태.구문정보처리기
응용
연구
뇌 정보처리 기반 언어이해 생성모형
기반
연구
정상뇌 모형
정상뇌 연구
손상뇌 모형
손상뇌 연구
- 형태,구문 지식표상
- 언어장애평가모형개발
- 언어정보처리 시스템구조
- 언어장애 DB 구축
- 형태,구문연구 패러다임개발
- Brain Mapping