한글 설계문서의 추적성 분석을 위한 문장 단위의 유사도 알고리즘 개발

Download Report

Transcript 한글 설계문서의 추적성 분석을 위한 문장 단위의 유사도 알고리즘 개발

한글 설계문서의 추적성 분석을 위
한 문장 단위의 유사도 알고리즘
개발
원자력 계측제어 및 정보공학 연구실
유영제
2002. 5. 20
목차







서론
한글 문장의 유사도 분석 알고리즘
보호계통 설계문서를 위한 필수격 및 격조사
동사격틀
격 이동 규칙
계산 결과
결론 및 향후 과제
서론



설계 문서의 한글화로 인해 그에 대한 추적성 분석 기
법이 요구됨
한글 문장의 유사도를 계산하기 위한 알고리즘을 개발
할 필요가 생김
격문법을 이용한 한글 문장의 유사도 분석 알고리즘을
개발하여 현재 프로그램화 작업에 있음
한글 문장의 유사도 분석 알고리즘
입력문
동사의 격틀
확정
어절 단위로
분할
명사구의
격 결정
동사 구분
격틀 정보
동사
어간 (원형)
명사구들 간의
비교
격이동 규칙
선어말어미
/어미
유사도
산출
보호계통 설계문서를 위한 필수격 및 격조사
Cases
Serial No.
Cases
Serial No.
Prv (provider)
1
Var (variable)
7
Rcv (receiver)
2
Spt (setpoint)
8
Pth (path)
3
Mod (module)
9
Gen (generator)
4
Act (action)
10
Loc (location)
5
Meas (measure)
11
Sig (signal)
6
Func (function)
12
Postpositions
Serial No.
Postpositions
Serial No.
이, 가, 은, 는
1
로, 로써
6
을, 를
2
로, 으로
7
와, 과
3
로부터, 에게서
8
에, 에서
4
만큼
9
에, 에게
5
보다
10
동사격틀(1/2)
받다
[[2
1](3
2)(1
8)[6
2]]
[[1
1](3
2)[2
5][6
2]]
[[9
1][10
2]]
[[9
1][12
2]], [[9 1][8
2]]
2][5
4]]
보내다
수행하다
갖다
설치하다
[[9
동사격틀(2/2)
감소하다
[[7
1][11
9]]
1][8
5]]
[[9
1][10
1]], [[9 1][12
[[7
1][8
10]]
[(9
1)(10
6)[10
2]], [(9 1)(10
7)[10
2]]
[(9
1)(10
6)[12
2]], [(9 1)(10
7)[12
2]]
도달하다
[[7
가능하다
1]]
낮다
개시하다
격 이동 규칙(1/2)

[V+(아)서]
– 격틀 변화 없음. 접속형. 과정
• DRPS는 ENFMS, CPCS 그리고 APC로부터 안전변수신호를 받다.
DRPS는 ENFMS, CPCS 그리고 APC로부터 안전변수신호를 받아서

[V+는]
– 기존 격틀의 agt가 [V+는] 뒤로 이동. 형용사형
• (이)기능은 원자로 정지 신호를 원자로 정지 차단기에 보내다.
원자로 정지 신호를 원자로 정지 차단기에 보내는 기능

[V+ㄴ다]
– 격틀 변화 없음. 평서 종결형.

[체언+하]
[체언+되]
– 기존 격틀의 obj가 agt로 됨. agt는 생략.
• 설계자가 보수시험반을 발전소 보호계통 캐비닛에 설치하다.
보수시험반이 발전소 보호계통 캐비닛에 설치되다.

[V+어]
– 격 이동 없음. 접속형.
격 이동 규칙(2/2)

[V+ㄹ]
– 격틀 변화 없음. –수-, -때- 등의 체언을 수식하는 역할
• 발전소가 불필요한 보호동작 없이 냉각되다.
발전소는 불필요한 보호동작 없이 냉각될 수 있다.

[체언+하]
[체언+시키]
– 기존 격틀의 agt가 obj로 됨.
• 설정치가 어떤 양만큼 감소하다.
설정치를 어떤 양만큼 감소시키다.

[V+ㅁ]
– 격 이동 없음. 명사형.
• 운전원이 설정치를 리셋시키다.
운전원이 설정치를 리셋시킴으로써

[V+(으)면]
– 격 이동 없음. 조건.

[V+어지]
– 기존 격틀의 obj가 agt로 됨.
• 설정치의 자동 감소를 이루다.
설정치의 자동 감소가 이루어지다.
계산 결과(1/3)


Source: 각 비교논리 프로세서는 트립상태를 결정하는
비교논리를 가진다.
Destination: 비교논리는 트립상태를 결정한다.
Destination
Source
결정하다
결정하다
비교논리 트립상태
비교논리 트립상태
가지다
프로세서 비교논리
트립상태
(Similarity) = 57%
비교
NULL
 2 2  1 4   0
 1 3
           0      0.57
 2 7
 2 2  2 7   2
계산 결과(2/3)


Source: 동시논리 프로세서는 동일 채널 및 타 채널의
해당계열 비교논리 프로세서로부터 전송된 4개의 트립
상태 신호와 동일 채널의 ATIP으로부터 전송된 트립채
널우회 신호를 이용하여 출력 신호를 결정한다.
Destination: 동시논리 프로세서는 동일 채널 및 타 채널
의 해당계열 비교논리 프로세서로부터 전송된 4개의
트립 상태 신호와 트립채널우회 신호를 입력으로 받아
동시논리 프로세서의 출력을 결정한다.
  16 10  1 28    4 2  1 9 
                0.68
  22 12  2 41    4 5  2 41 
(Similarity) = 68%
계산 결과(3/3)


Source: 각 채널의 원자로 정지신호는 동시논리 프로세
서의 디지털 출력모듈을 통해 개시회로를 거쳐서 원자
로 정지 스위치기어와 하드와이어로 연결된다.
Destination: 원자로 정지신호는 동시논리 프로세서의
디지털 출력모듈을 통해 원자로 정지 스위치기어와 하
드와이어로 연결된다.
  2 8  1 14    2 6 2  1 14 
                 0.61
  6 8  2 33    6 6 2  3 33 
(Similarity) = 61%
결론 및 향후 과제




ATIP, DRPS 요구사항 단계 설계문서 중 150문장을 토
대로 필수격과 동사의 격 프레임 및 동사의 변형에 따
른 격 프레임의 변화를 분석하였음
완성된 알고리즘으로 계산한 결과 만족할만한 성능을
보이는 것으로 추정됨 (정확한 결과는 프로그램화가
완료된 후에 평가할 예정)
프로그램화 완료 후 새로운 알고리즘이 기존의 알고리
즘보다 우월함을 입증할 예정
150개의 문장에서 발견된 63개의 동사들만으로는 충분
한 coverage를 보장할 수 없으므로 추후 더 많은 동사들
에 대한 자료 구축이 필요할 것으로 보임