Transcript Document

1
Παγκόσμιος Ιστός
2
World Wide Web- Ο Παγκόσμιος Ιστός
 Ανακαλύφτηκε από τον Tim-Berners Lee, ερευνητή του
CERN (Ευρωπαϊκό εργαστήριο Φυσικής Υψηλής Ενέργειας) το
1989. Ο στόχος ήταν να επιτρέπει σε ερευνητές ανά τον κόσμο
να ανταλλάσσουν κείμενα μεταξύ τους.
Στα τέλη του 1990 η βασική ιδέα είχε υλοποιηθεί στο CERN.
 Η βασική μονάδα του παγκόσμιου ιστού ή απλά ιστού έχει
πολλές ονομασίες όπως σελίδα(page), κείμενο(document),
πόρος(resource).
To World Wide Web Consortium (W3C) αναπτύσσει και
προωθεί στάνταρτ τεχνολογίες (π.χ. HTML, XML) για τον
ιστό. To W3C ηγείται από τον Tim Berners-Lee.
3
WWW- Ο Παγκόσμιος Ιστός
 Τί είναι: μετάφραση από το http://www.pcwebopedia.com/
Είναι ένα σύστημα από διακομιστές του διαδικτύου (internet servers)
που υποστηρίζει κείμενα τα οποία είναι ειδικά φορμαρισμένα. Τα
κείμενα είναι στην μορφή μιας γλώσσας που ονομάζεται γλώσσα
σημείωσης υπερκειμένου, HTML (HyperText Markup Language) και
υποστηρίζει συνδέσμους (links) σε άλλα κείμενα καθώς και σε
γραφικά, ήχο και video αρχεία. Αυτό σημαίνει ότι μπορεί ο χρήστης
να μετακινείται από το ένα κείμενο στο άλλο επιλέγοντας με το
ποντίκι τα κατάλληλα σημεία στο κείμενο.
Δεν είναι όλοι οι διακομιστές διαδικτύου μέρος του παγκόσμιου
ιστού.
Υπάρχουν πολλές εφαρμογές δικτυακής πλοήγησης (Web browsers)
που κάνουν εύκολη την πρόσβαση στον ιστό. Δύο από τους πιο
συνηθισμένους είναι το Netscape Navigator και Microsoft's Internet
Explorer.
4
Η εξάπλωση του διαδικτύου
Η εξάπλωση του διαδικτύου
Host=ένα σύστημα υπολογιστή με εγγεγραμμένη ΙP διεύθυνση
5
Η εξάπλωση του παγκόσμιου ιστού
Η εξάπλωση του ιστού
Sites (ιστότοπος) = # των διακομιστών ιστού (web servers) (ένας
host μπορεί να έχει πολλά sites χρησιμοποιώντας διαφορετικά
domains or θύρες (port numbers))
6
URLs
To URLs (Universal Resource Locator) (Παγκόσμιος
Προσδιοριστής Πόρων) είναι ένα είδος δείκτη που προσδιορίζει τον
πόρο με την αναπαράσταση του μηχανισμού πρόσβασης σε αυτόν
(π.χ. με βαση τη «θέση» (location) του). To URL είναι ένας κωδικός
ο οποίος προσδιορίζει μοναδικά την ακριβή θέση του πόρου στον
ιστό και το πρωτόκολλο που χρησιμοποιείται για την πρόσβαση στον
πόρο.
Για παράδειγμα το URL του Ευρωπαϊκού Κοινοβουλίου είναι
http://www.europarl.eu.int/home/default_el.htm και αποτελείται από
τα ακόλουθα μέρη:
7
URLs – Ενιαίος (ή Παγκόσμιος) Εντοπιστής Πόρων
•Το σχήμα (http://) το οποίο προσδιορίζει το πρωτόκολλο που
χρησιμοποιείται για την πρόσβαση στον πόρο. Σε αυτήν την
περίπτωση ο πόρος είναι μια ιστοσελίδα η οποία είναι προσπελάσιμη
μέσω του HTTP πρωτοκόλλου. Άλλα παραδείγματα πρωτοκόλλων
είναι το ftp:// για τη μεταφορά αρχείων και το telnet:// για την
πρόσβαση σε κάποιον host.
•To Internet Domain Name ή IP διεύθυνση (σε αυτήν την περίπτωση
είναι : www.europarl.eu.int
•Ένας προσδιοριστής (identifier) ο οποίος προσδιορίζει πλήρως τον
συγκεκριμένο πόρο (συνήθως όπως σε αυτήν την περίπτωση είναι το
συνολικό όνομα του αρχείου που είναι η ιστοσελίδα. Στο παράδειγμα
μας η ιστοσελίδα είναι στο αρχείο default_el.htm το οποίο βρίσκεται
στον φάκελο home). Κάθε αρχείο στον ιστό, είτε κείμενο είναι είτε
video, είτε ήχος, εικόνα κλπ έχει το δικό του μοναδικό URL.
Το μοντέλο πελάτη-διακομιστή (client-server)
Με τον όρο διακομιστής ιστού (web-server) αναφερόμαστε και στο
πρόγραμμα που κάνει την εξυπηρέτηση στις ιστοσελίδες αλλά και στο
μηχάνημα που τρέχει το πρόγραμμα και είναι συνδεδεμένο στο
διαδίκτυο.
Το πρόγραμμα του διακομιστή ιστού (web server program), είναι
συνεχώς ενεργό και έτοιμο να δεχτεί αιτήσεις. Σε ένα μηχάνημα μπορεί
να «τρέχουν» πολλοί servers. Για να διαφοροποιήσουμε τον κάθε server
χρησιμοποιούμε την θύρα(port). Για παράδειγμα ο ftp server «τρέχει»
στην θύρα 21, o web-server στη θύρα 80. Αν ένας server τρέχει στην
προκαθορισμένη θύρα, τότε δεν χρειάζεται να την προσδιορίσουμε στο
URL.
Ο πελάτης ιστού (web-client) τρέχει ένα πρόγραμμα πλοήγησης (e.g.
Internet Explorer) και συνδέεται στο διαδίκτυο όποτε χρειάζεται.
Χρησιμοποιεί το HTTP (Hypertext Transfer Protocol) πρωτόκολλο και
ζητά από τον διακομιστή ιστού ιστοσελίδες και αρχεία, τα οποία και
λαμβάνει.
8
HTTP- Hypertext Transfer Protocol
•HTTP (Πρωτόκολλο Μεταφοράς Υπερκειμένων) : Ένα σύνολο από
κανόνες για την ανταλλαγή αρχείων, κειμένου, γραφικών, εικόνων και
άλλων αρχείων πολυμέσων στον παγκόσμιο ιστό
•Η βασική ιδέα στο HTTP πρωτόκολλο είναι ότι ο πελάτης κάνει μια
HTTP αίτηση και ο διακομιστής δίνει μια HTTP απάντηση.
•Η πιο βασική μορφή του πρωτοκόλλου που μπορεί να καταλάβει ένας
HTTP διακομιστής(server) , είναι μια εντολή GET. Αν συνδεθούμε με
έναν διακομιστή που «μιλά» HTTP και στείλουμε την εντολή «GET
όνομα αρχείου» o διακομιστής θα απαντήσει με τα περιεχόμενα του
αρχείου που ζητήσαμε και θα διακόψει τη σύνδεση. Ενα παράδειγμα:
9
HTTP- Hypertext Transfer Protocol
dias > telnet www.mbc.aueb.gr 80
Trying 195.251.250.185...
Connected to mbc.mcm.aueb.gr.
Escape character is '^]'.
GET /kafeza/ehe1/notes/test.html HTTP/1.1
Host:www.mbc.aueb.gr
HTTP/1.1 200 OK
Server: Microsoft-IIS/4.0
Date: Thu, 15 Jan 2004 16:23:10 GMT
Content-Type: text/html
Accept-Ranges: bytes
Last-Modified: Thu, 15 Jan 2004 16:20:43 GMT
ETag: "886e138683dbc31:3034«
Content-Length: 110
<html>
<head>
<title> this is a test </title>
</head>
<body>
This is a simple HTML page
</body>
</html>
10
Η λειτουργία του HTTP
•Ας υποθέσουμε ότι ένα πελάτης ζητά μια ιστοσελίδα, τότε:
Το όνομα του διακομιστή μεταφράζεται σε ΙΡ διεύθυνση με την
βοήθεια ενός DNS server (Σύστημα Ονομασίας Περιοχών)
O πελάτης συνδέεται στη θύρα 80 του διακομιστή
Πελάτης
Διακομιστής
(Explorer)
(Apache)
http://www.mbc.aueb.gr/kafeza/ehe1
/EHE1.htm
195.251.250.185
Πελάτης
(Explorer)
195.251.250.185
θύρα 80
Διακομιστής
(Apache)
11
HTTP- Hypertext Transfer Protocol
Ο πελάτης προσδιορίζει το αρχείο που χρειάζεται και στέλνει
την GET εντολή στον διακομιστή
Πελάτης
GET /kafeza/ehe1/EHE1.htm HTTP/1.1 Διακομιστής
(Explorer)
(Apache)
http://www.mbc.aueb.gr/kafeza/ehe1/EHE1.htm
 Ο διακομιστής βρίσκει πιο αρχείο θα στείλει
Πελάτης
Διακομιστής
(Explorer)
(Apache)
Το kafeza/ehe1/EHE1.htm είναι το
/etc/httpd/htdocs/kafeza/ehe1/EHE1.htm
12
HTTP- Hypertext Transfer Protocol
O διακομιστής στέλνει ένα κωδικό απάντησης και τον κώδικα
που ζητήθηκε.
Πελάτης
(Explorer)
HTTP/1.1 200 ΟΚ
Content-type: text/html
[τα περιεχόμενα της EHE1.htm]
Διακομιστής
(Apache)
http://www.mbc.aueb.gr/kafeza/ehe1/EHE1.htm
 Κόβεται η σύνδεση
Πελάτης
Διακομιστής
(Explorer)
(Apache)
13
HTML : HyperText Markup Language
 HTML (Γλώσσα Σημείωσης Υπερκειμένου): Είναι η γλώσσα
παρουσίασης στον διαδίκτυο. Η γλώσσα που χρησιμοποιείται για την
δημιουργία αρχείων του ιστού. Η HTML καθορίζει την δομή και την
παρουσίαση του αρχείου με την χρήση ετικετών(tags) και
κατηγορημάτων (attributes).
 Θέματα όπως οι γραμματοσειρές, αν τα γράμματα εμφανίζονται
έντονα ή πλαγιαστά, αν υπάρχουν πίνακες, αριθμημένη παρουσίαση,
τα χρώματα, οι εικόνες κλπ, καθορίζονται από την HTML,
υπερσύνδεσμοι.
14
Παράδειγμα HTML σελίδας σε πρόγραμμα
πλοήγησης
15
16
Η προηγούμενη σελίδα σε HTML
<html>
<head>
<meta http-equiv="Content-Language" content="en-us">
<meta http-equiv="Content-Type" content="text/html; charset=windows-1252">
<title></title>
</head>
Το κείμενο ανάμεσα στην ετικέτα <b> και </b> θα είναι bold
<body>
Η θέση της εικόνας hermes.gif
<p>This is a page</p>
<p><b>This is a page in bold</b></p>
<p>This is a link <a href="EHE1.htm">EHE1</a></p>
<p>This is an image<span lang="el">
<img border="0" src="hermes.gif" width="80" height="79"></span></p>
</body>
</html>
Θα εμφανιστεί εικόνα
17
Η HTML χρησιμοποιεί ετικέτες (tags)
•<html> είναι η πρώτη ετικέτα και υποδηλώνει ότι το αρχείο είναι
γραμμένο σε HTML.
•</html> δηλώνει το τέλος του HTMLl αρχείου
•<head> και </head> υποδηλώνουν την αρχή και το τέλος αντίστοιχα του
αρχικού μέρους του αρχείου. Τα HTML αρχεία αποτελούνται από δύο
μέρη το αρχικό (head) και το κύριο μέρος (body). Το αρχικό μέρος
παρέχει πληροφορία για το αρχείο αυτό καθ’ αυτό παρά για τα
περιεχόμενα του. Το κύριο μέρος αποτελείται από τα περιεχόμενα και
πληροφορία προς το πρόγραμμα πλοήγησης για το πως να τα εμφανίσει.
•<title> και </title> Το κείμενο ανάμεσα σε αυτές τις ετικέτες (tags)
εμφανίζεται στον τίτλο του παραθύρου (title bar).
•<p> κόβει την τρέχουσα γραμμή και εισάγει μια νέα γραμμή
•<img/> δηλώνει ότι θα εμφανιστεί μια εικόνα, και το κατηγόρημα src
δηλώνει το αρχείο που περιέχει την εικόνα.
18
Αλλες γλώσσες σημείωσης
•Η ΗΤΜL είναι μια γλώσσα για την παρουσίαση κειμένων αλλά δεν δίνει
καμία πληροφορία για το νόημα αυτών. Παρουσίαζει μια σειρά
χαρακτήρων, και μπρφοποιεί την παρουσίαση τους, αλλά δεν
αντιμετωπίζει αυτούς τους χαρακτήρες σαν αντικείμενα ή δεδομένα.
Χρειάζεται η XML για την κατανόηση της δομής του κειμένου με
σημασιολογικό τρόπο.
•XML – eXtensible Markup Langauge. Είναι μια γλώσσα για την
περιγραφή και ανταλλαγή δομημένης πληροφορίας. Είναι και αυτή
γλώσσα σημείωσης και μπορεί να περιγραφεί σαν μια γλώσσα για να
γράφουμε γλώσσες. Δεν στοχεύει να αντικαταστήσει την HTML – αλλά
στον να αυξήσει τη δύναμη της με το να διαχωρίσει τα δεδομένα και τον
τρόπο που αυτά παρουσιάζονται.
•XHTML – eXtensible Hypertext Markup Language . Είναι μια γλώσσα
σημείωσης που αναπτύχθηκε από το W3C σαν τον επανασχεδιασμό της
HTML 4.0 σαν εφαρμογή της XML. Συνδθάζει τις ικανότητες
μορφοποίησης κειμένου της HTML 4.0 και την
δομή πληροφορίας και επεκτασιμότητα της XML.