한글오토마타

Download Report

Transcript 한글오토마타

한글 모아쓰기 기계
(오토마타)
한국과학원(KAIS)
석사학위논문, 1978. 2.
최광무
SIGPL 겨울학교, 2012-02-03
한국과학기술원 전산학과 최광무
현대한글 정의
•
초성
19 자 = 자음 14 자 + 겹자음 5 자
•
중성
21 자 = 모음 10 자 + 겹모음 11 자
•
받침
28 자 = 자음 14 자 + 겹자음 2 자 + 복자음 11자 + 1
•
한글 = 초성ⅹ중성ⅹ받침 = 19 ⅹ 21 ⅹ 28 = 1,1172자
ㄱ, ㄴ, ㄷ, ㄹ, ㅁ, ㅂ, ㅅ, ㅇ, ㅈ, ㅊ, ㅋ, ㅍ, ㅍ, ㅎ,
ㄲ, ㄸ, ㅃ, ㅆ, ㅉ
ㅏ, ㅑ, ㅓ, ㅕ, ㅗ, ㅛ, ㅜ, ㅠ, ㅡ, ㅣ
ㅘ,
ㅝ,
ㅙ,
ㅞ,
ㅐ, ㅒ, ㅔ, ㅖ, ㅚ,
ㅟ,
ㅢ,
ㄱ, ㄴ, ㄷ, ㄹ, ㅁ, ㅂ, ㅅ, ㅇ, ㅈ, ㅊ, ㅋ, ㅌ, ㅍ, ㅎ.
ㄲ,
ㅆ,
ᇚ,
ㄳ, ㄵ,
ㄺ,
ㅄ,
종성복용초성
ㄶ,
ㄻ,
終聲復用初聲
ㄼ, ㄽ, ㄾ, ㄿ, ㅀ,
e(받침 없는 경우)
– 한글 unicode
SIGPL 겨울학교, 2012-02-03
한국과학기술원 전산학과 최광무
3
한글 기본자모
•
기본자모 24자
– 자음 14자, 모음 10자
– ㄱ ㅏ ㄱ ㄱ ㄱ ㅗ = 각꼬 or 갂고
•
•
ㄱ과 ㄲ을 다른 문자로 한다.
글자 끝 기호 필요.
•
표준 기본자모(29자)
•
최소 기본자모(26자)
•
현재 컴퓨터 자판(33자)
•
3ⅹ4 자판
– 자음 14자 + 모음 10자 + 쌍자음 5자(ㄲ, ㄸ, ㅃ, ㅆ, ㅉ)
– 자음 14자 + 모음 10자 + 쌍자음 2자(ㄲ, ㅆ)
– 자음 14자 + 모음 14자(ㅐ, ㅒ, ㅔ, ㅖ) + 쌍자음 5자
– 삼성: 11자 = 모음 3자 + 자음 7자 + Blank(시간초과; 글자 끝)
•
•
모음 3자: ∙ (천), ㅡ(지), ㅣ(인)
자음 7자: ㄱ(ㅋ, ㄲ), ㄴ,(ㄹ), ㄷ(ㅌ,ㄸ), ㅂ(ㅍ, ㅃ), ㅅ(ㅎ, ㅆ), ㅈ,(ㅊ, ㅉ), ㅇ(ㅁ)
•
•
모음 4자:ㅏ, ㅓ, ㅡ, ㅣ
자음 6자: ㄱ(ㅋ), ㄴ(ㄷ, ㅌ), ㄹ, ㅁ(ㅂ, ㅍ), ㅅ(ㅈ, ㅊ), ㅇ(ㅎ)
– LG: 12자 = 모음 4자 + 자음 6자 + 획 추가 + 쌍 자음
SIGPL 겨울학교, 2012-02-03
한국과학기술원 전산학과 최광무
4
한글 모아쓰기기계(29자)
기본자모 24자 + 겹자음 5자
ㅗ
ㅗ
O
c={ㄱ,ㄴ,…,ㅎ,ㄲ,…ㅉ} ㅜ
c
V
초성 := 입력
v
v
ㅜ
U
c
ㅣ
ㅓ (ㅟ)
(ㅝ)
ㅏ,ㅑ
ㅓ,ㅕ,ㅡ
A
ㅏ,ㅑ
ㅓ,ㅕ,ㅡ
ㅣ c
(ㅐ,…,ㅙ,ㅞ,ㅢ)
ㅏ,ㅑ,ㅓ,ㅕ,ㅗ,ㅛ,ㅜ,ㅠ,ㅡ,ㅣ
ㅘ, ㅝ,
ㅛ,ㅠ,ㅣ
ㅚ, ㅟ,
ㅐ,ㅒ,ㅔ,ㅖ,ㅙ, ㅞ, ㅢ
ㅛ,ㅠ,ㅣ
I
ㄴ
v
ㄹ
v
K
ㄳ,ㅄ
c-{ㅅ}
ㅈ,ㅎ
N
R
v
ㄸ,ㅃ,ㅉ
한국과학기술원 전산학과 최광무
받침 := Bfr
ㄵ,ㄶ
c-{ㅈ,ㅎ}
ㄱ,ㅁ,ㅂ,ㅅ,
ㅌ,ㅍ,ㅎ
ㄺ,ㄻ,ㄼ,ㄽ,
c-{ㄱ,ㅁ,…,ㅎ}ㄾ,ㄿ,ㅀ
ㄷ,ㅁ,ㅅ,ㅇ,ㅈ
ㅊ,ㅋ,ㅌ,ㅍ,ㅎ
ㄲ,ㅆ
c
받침 := ε;
초성 := Bfr
받침 := OBfr; 초성 := Bfr
SIGPL 겨울학교, 2012-02-03
ㅅ
받침 := ε; 초성 := Bfr
(ㅘ)
v={ㅏ,ㅑ,…,ㅡ,ㅣ}
S
c
ㅏ ㅣ
(ㅚ)
ㄱ,ㅂ
L
받침 := Bfr
받침 := OBfr + Bfr
c
받침 := ε
5
한글의 출력
9벌식
•
9벌식(출력 벌수(타자기)) 한글 (11x15)
– 초성 6가지/초성 ⅹ 19 초성
초성
초성
초성
초성
초성
초성
ㄱ:
ㄱ:
ㄱ:
ㄱ:
ㄱ:
ㄱ:
가,
고,
과,
각,
곡,
곽,
갸,
교,
괘,
갹,
굑,
괙,
거,
구,
괴,
걱,
국,
괵,
겨,
규,
궈,
격,
귝,
궉,
•
•
•
•
•
•
가형
고형
과형
각형
곡형
곽형
•
•
받침 O: 아, 야, 어, 여, 오, 요, 우, 유, 으, 이, 애, 얘, 에, 예, 의, 와, 왜, 외, 워, 웨, 위
받침 X: 악, 약, 억, 역, 옥, 욕, 욱, 육, 윽, 익, 액, 얙, 엑, 옉, 읙, 왁, 왝, 왹, 웍, 웩, 윅
– 중성 2가지/중성 ⅹ 21 중성
개,
그
궤,
객,
극
궥,
걔, 게, 계, 기
귀, 긔
걕, 겍, 곅, 기
귁, 긕
– 받침 1가지/받침 ⅹ 27 받침(ε 제외)
•
= 114 가지
한글 dot matrix printer
=
42 가지
=
27 가지
– Printronix, 150 d.p.i.
– 183 가지 x 11 x 15 / 8 ≒ 3.7 KB
•
•
Hoffman coding
1 KB + 0.5 KB
– 한글 모아쓰기 기계 0.5 KB(Intel 8080)
– 2KB ROM
SIGPL 겨울학교, 2012-02-03
한국과학기술원 전산학과 최광무
6