검색엔진

Download Report

Transcript 검색엔진

7장
인터넷과 차세대 인터넷 프로토콜
(IPv6)
인터넷과 차세대 인터넷 프로토콜 7장
이 장에서 다룰 내용
학습목표
1
1
2
2
3
인터넷의 발전과정, 현황을 분석하고 인터넷에서 제공하는
정보서비스에 대한 이해와 활용 능력을 향상시킨다
기존 인터넷 프로토콜(IPv4)의 문제점을 파악하고
차세대 인터넷 프로토콜의 구조와 동작을 살펴본다.
이 장에서 다룰 내용
목차
1
1
인터넷의 개요 및 현황
2
2
인터넷 정보서비스
3
3
차세대 인터넷과 IPv6
Section 01 인터넷의 개요 및 현황
 ARPANET- 최초의 네트워크
 미 국방성(DoD) 산하의 ARPA(Advanced Research Projects Agency)에서 연구원,
군납업체, 그리고 관련기관 간에 정보를 공유하기 위해 4개의 IMP를 상호간에 연결한
네트워크
 IMP(Interface Message Processors): 각 기관이 연구 프로젝트를 수행하기 위해
연결시킨 미니컴퓨터들을 IMP(Interface Message Processors)라고 명명함.
 초기에 NCP(Network Control Program)라는 프로토콜을 사용
 1983년 네트워크 프로토콜로 TCP/IP를 공식적으로 채택
• 이후 유닉스 시스템에서의 TCP/IP의 구현은 인터넷이 여러 산업체와 각 기관으로 널리
확산되는 데 결정적인 역할
ARPANET- logical MAP
인터넷의 발전
 NSFNET- 5대의 슈퍼컴퓨터 연결
 1986년, 미국 국립과학재단(NSF)의 네트워크인 NSFNET이 등장
 ARPANET 이용자 흡수

인터넷의 발전
 1990년대 들어서는 인터넷의 정보 사용에 대해서 부분적인 상용화 허용
 이후 월드와이드웹(WWW)의 발달과 더불어 점점 많은 기업들이 기업의 이미지 광고, 제품소개,
전자상거래 등에 인터넷을 도입
 현재 인터넷은 무선인터넷을 포함하여 기하급수적으로 성장
 현재 세계 180여개 국에서 2억 6천만 대 이상의 호스트 컴퓨터가 연결
 사용자의 수가 14억 5천만 명을 넘고, 하루 평균 1000만 명 이상이 인터넷에 접속을 하고 있는
것으로 추산.
연도별 전 세계 인터넷 이용자 증가 추세
인터넷이용자수(단위 :천명)
1,600,000.00
1,467,040.10
1,400,000.00
1,209,934.20
1,200,000.00
인터넷이용자수
1,004,714.40
1,000,000.00
868,006
800,000.00
722,497.90
615,845
600,000.00
400,000.00
488,614.20
389,601.70
275,376.80
200,000.00
0.00
1999
2000
2001
2002
2003
2004
• 초고속 인터넷 가입자수 : 3억 3천만 명
2005
2006
2007
주요 국가(OECD 가입국)의 국가도메인 비교
• 우리나라의 국가도메인(‘kr’): 캐나다에 이어 11위 (901,878개)
국내현황 - 인터넷 이용자 수
 1999년 국내 인터넷 이용자 수는 900만 명
 2007년 : 3,400만 명을 상회 (100인당 75명 정도가 인터넷이용)
인터넷이용자수(단위 :천명)
35,000
31,580
33,010
34,120
34,820
29,220
30,000
26,270
24,380
25,000
20,000
19,040
15,000
10,860
10,000
5,000
0
1999
2000
2001
2002
2003
2004
2005
2006
2007
국내 인터넷 현황
 국내의 인터넷 관련 현황에 대한 통계자료 (통계항목에 따라 조사 기준시점에
차이가 있음)
 초고속 인터넷 가입자수는 인구 100명당 30.5명으로 세계 7위 (2007년말 기준),
 국내 인터넷 호스트 수는 5,433,591개로 세계 3위(2005년말 기준),
 IPv4 인터넷 주소 보유수 62,080,000개로 세계 9위(2008년 4월 기준),
 IPv6 인터넷 주소 보유수는 5,194(/32)개로 세계 6위(2008년 4월 기준)
 최상위 도메인인 kr 도메인 수는 954,000개 (2008년 기준)
Section 02 인터넷 정보서비스
 웹(Web) 서비스
 인터넷의 성장과 함께 기존의 텍스트 위주의 서비스뿐만 아니라 사운드(Sound), 이미지(Images),
동화상(Animation) 등 멀티미디어 서비스를 제공할 수 있는 인터넷 서비스가 요구됨
 하이퍼텍스트(hypertext)란 개념을 사용하는 웹의 등장으로 인터넷을 통한 다양한 멀티미디어
서비스 에 대한 요구조건을 충족시킴 .
 웹 서비스의 종류
 이메일 서비스 혹은 웹 메일(web mail) 서비스
 파일 및 정보검색 서비스 아키(Archie) : 전 세계에 산재되어 있는 파일이나 프로그램에 대한 정보를
검색할 수 있는 데이터베이스 검색 서비스
 메뉴 방식의 정보검색 서비스 고퍼(Gopher) : 검색하는 정보가 보다 전문성을 포함하거나 특정한
주제에 대한 정보 검색을 하는 경우에 유용하게 사용 가능
웹 서비스의 종류(계속)
 와이즈(WAIS) 서비스 : 문서 인덱스를 이용한 문서 검색 제공서비스
 파일전송 서비스(FTP) : 전 세계 어느 곳에 있더라도 정보와 파일을 쉽고 빠르게 교환가능.
 원격접속 서비스 텔넷(Telnet): 물리적으로 원격지에 있는 컴퓨터를 사용할 수 있도록
해주는 서비스
 지구촌 전자게시판 서비스 유스넷(Usenet) : 동일한 관심사를 가진 사람들이 특정 주제에
대해 토론의 장을 제공
검색엔진 (search engine)
 검색엔진이란?
 인터넷에 있는 방대한 자료 중 찾고자 하는 것을 빠른 시간 안에 찾을 수 있도록 정보를 수집하고
찾아주는 도구
 현재 인터넷 검색엔진은 한글 및 영문 검색엔진을 포함해 500여 가지 종류가 서비스 중임 .
 검색엔진의 분류(1)
 키워드형 검색엔진: 검색어로 키워드 또는 주제어를 입력하여 정보를 검색하는 방법을 사용
 주제별 목록 검색엔진: 대 분류에서 소 분류로 분류항목을 축소하여 순차적으로 검색
 검색엔진의 또 다른 구분(2)
 웹 페이지 검색엔진: 자동화된 로봇 프로그램이 웹 페이지 문서를 수집
 디렉터리 검색엔진: 사람이 주제별로 웹사이트 주소록을 정리
검색엔진의 세대별 구분(1)
 1세대 검색엔진 (디렉터리 검색엔진)
 사람이 직접 좋은 사이트를 선별하여 정리하는 검색엔진
 2세대 검색엔진 (1세대 로봇 검색엔진)
 웹봇(webbot) 또는 에이전트(agent)를 이용한 알타비스타와 같은 로봇 검색엔진의 형태로
등장함.
 검색결과의 활용이 이용자에게 용이하지 못하여 큰 호응을 얻지 못함.
 2.5세대 검색엔진 (디렉터리와 로봇의 응용 검색엔진)- 메타 검색엔지 사용
 메타 검색엔진이란? 자체적으로 정보를 보유하고 있지는 않으면서, 다른 검색엔진 서비스
회사들의 검색결과를 실시간으로 가져와서 정리해서 보여주는 방식
 사용 예로서, 디렉터리 검색엔진의 장점과 로봇 검색엔진의 장점을 잘 혼합한 형태의 네이버,
다음, 엠파스, 파란 등이 현재 서비스 중임.
검색엔진의 세대별 구분(2)
 3세대 검색엔진 (2세대 로봇 검색엔진)
 2세대 로봇 검색엔진을 장착한 구글 등장
 구글은 페이지랭크(Page Rank)를 통해, 첫 페이지에 클릭하고 싶은 정보가 노출되게 하는
논리구조를 적용하여 현재 가장 앞선 기술로 평가되고 있음
 4세대 검색엔진(3세대 로봇 검색엔진) - 차세대 검색엔진
 지금까지 사용해온 방식과는 전혀 다른 검색 방식을 사용
 키워드 방식 기반이 아닌 의미 기반의 검색 방법을 사용하는 최첨단 방식의 검색엔진
Section 03 차세대 인터넷과 IPv6
 차세대인터넷 프로토콜(IPv6)의 필요성과 등장배경
 인터넷 사용의 급증으로 기존 인터넷 구조로는 사용자의 요구를 충족시키기에 어려움.
 다양한 멀티미디어 서비스의 제공을 위한 기술적 보완에도 불구하고 날로 증가되는 인터넷 사용자와
다양한 높은 수준의 요구에 대처하기에 한계.
 32비트를 사용하는 IPv4주소는 약 43억개의 주소 생성이 가능하나, 비효율적인 할당(유효한 주소
개수는 5~6억 개) 및 무선인터넷, 정보가전 등의 신규 IP주소 수요로 인하여 주소부족 문제 또한
심각하게 대두.
 1996년에 IETF(Internet Engineering Task Force)에서는 기존의 IPv4 프로토콜에서 보안기능,
자동설정 기능 등을 보완한 IPv6규격(RFC2460)을 차세대 인터넷 프로토콜 표준으로 채택.
IPv6 데이터그램의 형식 (Format)
 기본 헤더와 사용자 데이터(payload) 영역으로 구성
 기본 헤더 영역은 40바이트로 이루어짐.
 사용자 데이터(payload) 영역은 다시 확장 헤더와 상위계층으로부터 받은 데이터패킷
영역으로 구분.
IPv6 데이터그램의 형식 (Format)
 버전(4비트): IPv6인 경우 6
 우선순위 영역(4비트): 사용자 데이터그램의 우선순위(priority)에 관련된 영역.
 흐름라벨(24비트): 전송측이 특별한 처리를 원하는 패킷에 대한 흐름을 정의.
 유료부하 길이(16비트): 헤더 다음에 이어서 오는 나머지 부분의 길이를 바이트(8비트)
단위로 나타냄. 즉 사용자 데이터 영역과 확장 헤더를 포함한 전체 길이를 표시.
 다음 헤더(8비트): 다음에 오는 확장 헤더가 어떤 형태인지를 알려줌.
 홉 제한(8비트): 이 영역은 데이터그램에 허용된 홉의 남아있는 수를 나타냄. 여기서
홉(hop)이란 하나의 라우터에서 또 다른 라우터로 이동한 횟수를 뜻함.
 소스 및 목적지 주소(128비트): IPv6는 기존 IPv4의 주소길이를 4배 확장한 128비트
주소를 사용.
IPv6 데이터그램 각 영역의 기능
[그림 7-8] IPv6 데이터그램 형식(format)
확장 헤더
 홉 간 옵션(hop-by-hop option) 헤더: 홉 간 프로세스를 요구하는 특별한 옵션을 정의.
 소스 라우팅(Source Routing) 헤더: 확장된 라우팅 기능을 제공
 단편화 헤더(Fragment Header): 이 영역은 분할과 재조립 정보를 포함.
 인증 헤더: 패킷의 무결성과 출처를 제공.
 암호화 보안 유료부하(Encrypted security payload) 헤더: 보안성을 제공.
 목적지 옵션(destination option) 헤더: 목적지에 검색된 선택사항의 정보를 포함.
[그림 7-10] IPv6의 확장 헤더 유형types)
IPv6에서의 IP주소 표기법
 128비트를 16비트씩 나눠서 16진수로 쓰고 콜론(:)으로 구분.
 예: ABCD:1234:5678:1234:5678:ABCD:1234:5678
 콜론으로 구분되는 영역이 0으로 시작할 경우에는 0을 생략(전체 16진수가 0인 경우에는
0으로 표시)
 예: ‘1234:0123:0012:0001:0000:0002:0003:0004’ ‘1234:123:12:1:0:2:3:4’
 8개의 영역 중에서 0000인 영역이 연속적으로 나타나는 경우에는 해당 영역들을
생략가능(단, 한 번으로 제한)
 예: ‘11:0:0:0:55:0:0:88’  ‘11::55:0:0:88’로 쓸 수 있음.
 네트워크 ID의 표현 ‘11:11:11:11:11:11:11:11/64’와 같은 표현이 가능 (여기서
‘11:11:11:11’이 네트워크 ID)
 IPv6에서는 서브넷 마스크는 사용하지 않음.
IPv6의 주소체계(1)
 유니캐스트 주소
 유니캐스트(unicast) 주소로 보내진 패킷들은 항상 해당 주소로 식별되는 장치로만 전달.
 애니캐스트 주소
 각기 다른 노드에 속하는 주소의 집합에 대한 식별자.
 애니캐스트 주소로 보내진 패킷은 해당 주소로 식별될 수 있는 노드 중 라우팅 프로토콜에 의해
정해지는 가장 가까운 노드로 보내짐.
IPv6의 주소체계(2)
 멀티캐스트 주소
 각기 다른 노드에 속하는 많은 수의 노드를 식별하는데 사용.
 멀티캐스트 주소로 전송된 패킷들은 해당 주소로 식별될 수 있는 모든 노드로 전송됨.
 ‘FF01:0:0:0:0:0:0:1’과 ‘FF02:0:0:0:0:0:0:1’은 모든 노드의 멀티캐스트주소(All Nodes Multicast
Address) 용도로 예약
 ‘FF01:0:0:0:0:0:0:2’와 ‘FF02:0:0:0:0:0:0:2’는 모든 라우터 멀티캐스트주소(All Routers Multicast
Address) 용도로 사용.
IPv6 특성과 응용(1)
 확장된 주소 공간 (128비트)
 모든 노드와의 종단간 연결성(End-to-End Connectivity)을 제공.
 상시 활성화(Always on) 상태에서 자기만의 주소를 가질 수 있으며, 필요할 경우 복수의 주소나
변경되는 주소를 가지는 특성, 즉 능동적 주소 특성(Active Addressability)을 제공.
 한 단말은 언제나 다른 단말에서부터의 대화요청을 수용.
 효율적인 헤더의 구성
 사용하는 서비스의 형태에 따라 헤더를 분리.
 여러 개의 독립된 헤더를 사용하여 그 기능에 맞도록 전송  네트워크에서의 패킷 처리 시간을
단축과 전송되는 정보의 양을 기존의 인터넷 프로토콜보다 줄일 수 있음.
IPv6 특성과 응용(2)
 자동설정 기능 (Autoconfiguration)
 사람의 개입을 최소화하기 위한 기능
 무상태(Stateless) 방식과 상태(Stateful) 방식으로 구분된다.
• 무상태 방식 : 해당 시각의 상황을 관리할 필요 없이 표준에 참여하는 노드들이 있으면 그
노드들간의 상호작용에 의해 설정이 완료. 주로 설정대상 노드 자기 식별에 이용.
• 상태 방식: 설정 대상 노드들의 식별뿐 아니라 자신이 이용하려 하는 서비스 대상에 대한
설정까지 범위가 넓어짐. 해당 시각의 상태를 관리해야 함을 의미.
 단순화, 효율화된 데이터 구조
 종단에 있는 노드와 데이터 전송에 참여하는 네트워크 노드 사이의 역할을 분명하게 구분하여,
네트워크 운영 및 구성에 대한 융통성을 향상시켜 보다 단순화, 효율화된 데이터 구조가 되도록 함.
 QoS 기능과 보안 기능 강화 - 인증성, 기밀성, 데이터 무결성 등의 지원 가능
IPv4 와 IPv6 특징 비교
구분
IPv4
IPv6
주소길이
32 비트
128비트
표시방법
8비트씩 4부분으로 10진수
로 표시
202.30.64.22
16비트씩 8부분으로 16진수로 표시
2001:0230:abcd:ffff:0000:0000:ffff:1
111
주소개수
약 43억 개
주소할당
A, B, C, D 등 class 단위의
비순차적할당(비효율적)
네트워크 규모 및 단말기 수에 따른 순
차적 할당(효율적)
품질제어
Best Effort 방식으로 품질
보장이 곤란
(Type of Service 에 의 한
QoS 일부지원)
등급별, 서비스별로 패킷을 구분할 수
있어 품질보장이 용이(Traffic Class,
Flow Label에 의한 QoS 지원)
보안기능
IPsec 프로토콜 별도 설치
확장기능에서 기본으로 제공
Plug & Play
없음
있음(자동 네트워킹 가능)
Mobile IP
상당히 곤란(비효율적)
용이(효율적)
웹캐스팅
곤란
용이(Scope Field 증가)
약[43억x43억x43억x43억]개
(거의 무한대)
차세대 인터넷에 대한 전망(1)
 차세대 인터넷이란? 기존의 인터넷 시스템의 문제점을 해결하여 고속 대용량의
대화형(Interactive) 멀티미디어 서비스의 제공이 가능한 새로운 형태의 인터넷을 말함.
 차세대 인터넷 프로젝트(project)-NGI(Next Generation Internet)
 미국 연방정부 주도하에 산업계와 학계가 연합하여 추진, 주로 학술 및 연구단체 중심으로 연구가
진행되고 있으며, 고속 대용량의 대화형 멀티미디어 서비스가 가능한 네트워크의 구축을 목표로 함
 차세대 인터넷 이용자는 IPv6의 자동 주소설정 기능으로 장소 이동에 따른 IP주소 재입력
등 통신 환경을 일일이 설정해야 하는 불편이 제거되고, 이동 IP 기능으로 유․무선 등 이종
네트워크에서도 끊임없이 통합 서비스가 가능해져서, 다양한 인터넷 서비스를 매우
편리하게 이용할 수 있게 됨.
 인터넷 사업자는 IPv6의 품질관리 기능 및 보안기능을 이용하여, 고품질의 신뢰성 높은
인터넷 서비스를 제공할 수 있게되고, 인터넷 이용자는 멀티캐스팅 등 고품질의 동영상
서비스를 쉽게 이용할 수 있게 됨.
차세대 인터넷에 대한 전망(2)
 차세대 인터넷의 특징
 고속 백본 네트워크를 구축함으로서 안정성, 신뢰성, 운영성이 개선
 종단간(end-to-end) QOS 제공, 멀티 캐스트 서비스, 네트워크 보안성 향상, 이동성 제공,
VPN(Virtual Private Network) 기능 등 향상된 기능을 제공
 차세대 인터넷은 유․무선 및 위성통신 네트워크의 연동과 다양한 네트워크에서 제공하는
서비스의 통합을 촉진할 것으로 예상
 유․무선의 여러 ISP 네트워크와 LAN/WAN 등과의 상호연동 및 이러한 상호연동을
바탕으로 다양한 네트워크 간의 연동체계가 고도화될 것으로 기대
 차세대 인터넷은 유무선 및 위성통신 네트워크, 이동통신 네트워크, 센서 및 유비쿼터스
네트워크 등 다양한 네트워크들이 상호간에 융합되고, TV, 라디오 등 방송 네트워크와 각종
첨단 복합단말기들이 결합되는 광대역통합 네트워크를 수용할 것으로 예상
요약(1)
 인터넷은 현재 세계 180여 개 나라에서 2억 6천만 대 이상의 호스트 컴퓨터가 연결되어 있으며 그
사용자의 수가 14억 5천만 명을 넘고, 하루 평균 1,000만 명 이상이 접속을 하고 있는 것으로
추산되는 글로벌 네트워크 시스템이다.
 웹의 기능적 특징과 다양한 웹 서비스의 종류를 살펴보았다.
 차세대 인터넷이란 현 인터넷 시스템의 문제점을 해결하여 고속․대용량의 대화형(Interactive)
멀티미디어 서비스의 제공이 가능한 새로운 형태의 인터넷이다.
 IPv6란 현재 사용하고 있는 IPv4의 주소길이(32비트)를 4배 확장하여 IETF가 1996년에 표준화한
128비트 차세대 인터넷 주소체계로, 보안기능, 자동설정기능 등을 보완하였다.
 차세대 인터넷 프로토콜인 IPv6는 보다 단순화된 형태의 헤더 정보를 제공하기 위해서, 헤더를
사용하는 서비스의 형태에 따라 분리하였다.
요약(2)
 IPv6는 종단에 있는 노드와 데이터 전송에 참여하는 네트워크 노드 사이의 역할을 분명하게
구분하여, 네트워크 운영 및 구성에 대한 융통성을 향상시키고 보다 단순화, 효율화된 데이터 구조를
갖는다.
 차세대 인터넷의 특징은 고속 백본 네트워크를 구축함으로써 안정성, 신뢰성, 운영성이 개선되고,
종단간(end-to-end) QOS 제공, 멀티 캐스트 서비스, 네트워크 보안성 향상, 이동성 제공,
VPN(Virtual Private Network) 기능 등 향상된 기능을 제공한다
인터넷과 차세대 인터넷 프로토콜 7장 끝
31