한미르 지도서비스 시스템

Download Report

Transcript 한미르 지도서비스 시스템

한미르 서비스 개발 및 발전방향
2000. 3.31
한국통신 한미르개발팀
유광일
한미르시스템 구성도

KORNET
155M * 2
L4 Switch
F/W
VPN으로
NET를 3개로
운영
L4 Switch
Switch 시스코 카탈리스트
전화번호 검색엔진






요구사항
외래어 검색 방법
검색엔진 구조
DataBlade 란 ?
사용자 SQL FlowChart
기능 사용 설명
상호검색요구사항





Fragment에 의한 테이블 및 인덱스 구성
 20 column을 가진 500만 데이터 구축(8 data space)
 Informix Dynamic Server - Universan Data Option
9.14UC6
검색질의어에 의한 상호자료 검색
 부분검색, Forwarding matching 검색방법 지원
 외래어(외국어)에 의한 검색 방법 제공
 통상명, 동의어 사전에 의한 검색방법 지원
다양한 출력/통계정보 제공
 상호,주소,대표 선출력(order by, group by등)
 count처리, 연결 전화번호 처리
사용자 질의어로 부터 질의패턴 자동 반영
동시 현행화 지원
부분검색 기본방법

부분 검색 색인 방법

인덱스 : 상호명의 2음절 패턴으로 구성,포스팅 테이블 생성시 자동 생성

포스팅 테이블 : 동일한 패턴을 가진 상호명에 대한 rowid정보 기록

상호테이블 : 상호데이타를 유지하는 테이블
포스팅 테이블
인덱스
패턴
통신
통신
상호 rowid
상호 테이블
상호명
rowid
한국통신
123
광주이동통신
456
123,342,456,….
34,456,777,…..
변환코드화 규칙 테이블
유 형
항
변환 방식
변 환 코 드값
단 순 변환
w
ㅎ (1), ㅃ (1), ㅇ (1), ㅍ (1)
단 순 변환
x
ㅏ (2),
단 순 변환
y
ㅣ (2), ㅟ (2)
단 순 변환
z
ㅅ (3) + ㅅ (1)
받 침 삭제
1
ㄹ (3) + ㄹ (1)
받 침 삭제
1
마 지막 문자 의 ㅅ (3)
삭 제 후 ‘트 ’ 추 가
1$wr1
마 지막 문자 의 ㄱ (3), ㅋ (3)
삭 제 후 ‘크 ’ 추 가
1$hrl
모 음 축약 1
다 음 글자의 중 성
ㅅ (1),
제 1 유형
ㅈ (1),
목
ㅆ (1),
ㄸ (1),
ㅌ (1)
ㅓ (2),
ㅗ (2),
ㅔ (2),
ㅐ (2)
제 2 유형
제 3 유형
제 4 유형
‘ㅗ ’+’오 ’,
‘ㅗ ’+’우 ’,
‘ㅜ ’+’
삭 제후 종성 연 결
우’
제 5 유형
모 음 축약 2
‘ㅜ ’ + ‘아 ’
‘ㅜ ’를 ‘ㅘ ’로 변 환 ,
다 음 글자의 중 성
삭 제 후 연결
외래어 검색 기법
클로버슈퍼마캣
ㅋ ㅡ ㄹ ㄹ ㅗ
2
ㅂ ㅓ
ㅅ ㅠ
1
ㅍ ㅓ
ㅁ ㅏ
ㅋ ㅐ ㅅ
1
1
3
h r 1 $ 7 y 1 $ 9 y 1 $ w z 1 $ x y 1 $ 8 y 1 $ h y 1 $ w r 1 $
1
ㅋ ㅡ
ㄹ ㅗ
크로바수퍼마케트
ㅂ ㅏ
1
ㅅ ㅜ
1
ㅍ ㅓ
ㅁ ㅏ
ㅋ ㅔ
ㅌ ㅡ
검색엔진 구조
To Clients
TEXTUAL DOCUMENTS
USER COMM HANDLING
In the
PARALLEL
Dimension
(DSA)
QUERY
OPTIMIZER
INFORMIX
DSA
QUERY EXECUTOR
FOUNDATION
FRAGMENT
MANAGER
RSAM
VIRTUAL
TBL INTFCE
FUNCTION MGR.
SQL 3 PARSER
Fragmented,
Async Disk I/O
DATABLADE API - METADATA
To Browsers
SPATIAL DATA & IMAGES
BITMAP IMAGES
In the
DATA
Dimension
HTML TEMPLATES
VIDEO
(DataBlade
modules)
AUDIO
TIME-SERIES
… etc. ...
STATISTICAL ANALYSIS
DATA STRUCTURES
ROUTINES
In the LEGACY Dimension
In the PARALLEL DISK I/O Dimension
ACC METH
DataBlade 란 ?
DATATYPE
DEFINITIONS
SQL
INTERFACE
DATABLADE-SPECIFIC ROUTINES
( Functions and/or Procedures )
- SPL, C, C++ or Java - from Domain Experts & Users -
기존 타입의 확장 또는
완벽한 신규 타입
어떠한 SQL 개발자도
사용할 수 있는
SQL 인터페이스
ACCESS
METHODS,
as
Required
신규 자료형과
수행할 수 있는
신규 함수
신속한 검색을 위한
신규 인덱싱 또는
데이터 액세스 메소드
User SQL Statement Flow Chart
Send SQL
Client
Select … from...
HMcontains(desc,’전자’
);
객체 관계형 DB
ORDB Engine
Text Index
Send Result
name description
통신 전자통신. .
전자 통신전자연구소. .
DataBlade
Text Engine
전자, 통신
…...
기능 설명
Index 생성
create index idx0 on user_table (name)
using HanMir
in sbspace;
Keyword 검색
select * from user_table
where
HMcontains(name,'한국통신')
AND HMcontains(upjongname,'전자')
이점




SQL Level의 Keyword 검색 가능.
검색 속도 향상
Data의 통합 관리 용이
다른 Application과의 통합 용이.
지도 시스템

지도 서비스 서버





지도 생성 및 출력 서버
지도 DB
User Interface
지도 가공 서버
주소 기반 검색엔진


주소-좌표 변환 서버
주소-좌표 DB
시스템 개괄 요약도
지도 서비스 서버(NT 서버)
지도 요청
Web Browser
지도 서버
지도 반환
요청지도반환
주소-좌표
변환요청
지도 검색
해당 주소
주소값
검색
해당
좌표값
상호부 CGI
지도 DB
가공된
지도화일
업종부 CGI
주소기반검색엔진(Unix 서버)
주소-좌표
변환서버
주소-좌표
DB
지도 가공
서버
(Unix 서버)
지도 서비스 서버

지도 서버







환경 : NT 서버, Visual C++
지도 생성 및 출력 서버
주소-좌표변환 서버로부터 전달된, 주소 위치의 X,
Y 좌표값을 기준으로 Map을 Rendering
가공된 지도 DB : 자체적으로 정의한 map format
형태
해당 지도 결과를 화면에 출력
Zoom In/Out 기능
지도 서비스 화면의 Interface를 구성
지도 가공 서버

지도 가공 서버


환경 : Unix 서버, C Language
Microstation에서 작업한 DGN format 파일을 자
체적으로 정의한 map format 파일로 변환
•
•

지역별, 레벨별로 저장되어 있음
•
•

DGN format : 모든 지형들을 element들로 구성한 지도
데이터 저장 형식
map format : DGN format 파일을 단순화->분할 작업
을 거친 자체적 지도 format
지역별 : 서울, 부산, 대구, 대전, 인천, 울산
레벨별 : Zoom 상태에 따라서 8레벨로 구분
결과 map 화일은 지도서버에 전송하여 사용
주소 기반 검색 엔진(1)
 주소-좌표





변환서버
환경 : Unix 서버, C Language
지도 서버로부터 넘겨받은 주소를 parsing
주소-좌표 지번 DB
지번 DB : B+ tree 형태
<동코드, 지번, 좌표값>으로 구성됨
 Message
queue방식으로 Client와 통신
주소 기반 검색 엔진(2)

Message queue 방식
주소->좌표
변환 요청
주소-좌표
변환서버
지도 서버
변환된 좌표값
Message queue
....
B+ tree : 주소-좌표 DB
주소 기반 검색 엔진(3)
 주소





기반 검색 엔진 작동의 순서
사용자 Query 분석
주소를 parsing
주소-좌표DB에 질의
해당 좌표를 구함
지도 서버에 해당 좌표값을 전달