Pertinence d`une page web - Mathématiques | Académie de Dijon

Download Report

Transcript Pertinence d`une page web - Mathématiques | Académie de Dijon

Spécialité en Terminale S
Stage de formation continue
Académie de Dijon
Spécialité en Terminale S
1 – Une introduction
Introduction aux matrices
Traitement d’images
Une image en niveaux de gris :

mosaïque de pixels ;

chaque pixel codé par son intensité lumineuse ;

codage sur 1 octet, entre 0 (noir) et 255 (blanc) ;
intensité lumineuse des pixels normalisée par un
nombre de l'intervalle [0;1] ;


palette simplifiée de niveaux de gris ci-contre.
0
0 ,1
0 ,2
0 ,3
0 ,4
0 ,5
0 ,6
0 ,7
0 ,8
0 ,9
1
Introduction aux matrices
Traitement d’images
Une image carrée de 64 pixels.
On souhaite pouvoir effectuer
différents traitements sur cette
image comme :

éclaircir ;

assombrir ;

prendre le négatif.
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
0
Comment modéliser ces
traitements ?
Introduction aux matrices
Traitement d’images
 On associe à l’image un tableau de nombres.
 Modifier l’image revient à modifier les valeurs du tableau:
 en appliquant une fonction à chaque élément ;
(nécessité d’algorithmes de parcours de la matrice)
 en définissant une opération sur le tableau.
Introduction aux matrices
Traitement d'images : bilan

Notion de matrice apparaît naturellement.
 Nécessité de définir des opérations sur les matrices justifiée
:

par le but recherché (modifier l’image) ;

par les logiciels qui donnent pour M² un autre résultat
que le carré de chaque élément de M.
Introduction aux matrices
Un réseau de transports
Graphe des connexions entre les
gares de trois villes A, B et C.
Les entiers au-dessus des arêtes
indiquent le nombre de liaisons
pour chaque connexion.
On peut représenter ces
informations à l'aide de 2
matrices, puis en déduire la
matrice des liaisons de la ville A
vers la ville C.
Activité issue du manuel
Odyssée, Terminale S (Hatier)
Introduction aux matrices
Un réseau de transports
Introduction aux matrices
Un réseau de transports : bilan
 Le produit de matrices apparaît comme réponse à un
problème de dénombrement.
 Pour aller de la gare ai à la gare cj, il y a trois gares
intermédiaires possibles, ce qui aide à comprendre
dans ce cas la formule
3
c i j = ∑ a i k bk
k=1
j
Spécialité en Terminale S
2 – Le modèle de
diffusion d'Ehrenfest
Le modèle de diffusion d'Ehrenfest
Le modèle de diffusion d'Ehrenfest
Simulation
1000 particules et 10 000 échanges
Le modèle de diffusion d'Ehrenfest
Simulation
100 particules et 500 échanges
120
100
80
60
40
20
0
0
50
100
150
200
250
300
350
400
450
500
Le modèle de diffusion d'Ehrenfest
Simulation
10 particules et 500 échanges
12
10
8
6
4
2
0
0
50
100
150
200
250
300
350
400
450
500
Le modèle de diffusion d'Ehrenfest
Simulation
6 particules et 500 échanges
7
6
5
4
3
2
1
0
0
50
100
150
200
250
300
350
400
450
500
Le modèle de diffusion d'Ehrenfest
Simulation
2 particules et 500 échanges
2.5
2
1.5
1
0.5
0
0
50
100
150
200
250
300
350
400
450
500
Le modèle de diffusion d'Ehrenfest
Deux questions :
 Peut-on parler de stabilisation ?
 Peut-on toujours revenir à l'état initial ?
Le modèle de diffusion d'Ehrenfest : N=2
Les trois états possibles
Probabilité de
passer
à r1
à r2
à r3
de r1
0
1
0
de r2
1/2
0
1/2
de r3
0
1
0
Le modèle de diffusion d'Ehrenfest : N=2
Graphe et matrice de transition
1
2
1
r1
r2
r3
1
2
1
0 1 0
1
1
A=
0
2
2
0 1 0
( )
Le modèle de diffusion d'Ehrenfest : N=2
État au rang n modélisé par un vecteur ligne :
Loi de probabilité de la variable Xn
égale au nombre de particules dans II.
Initial : V0=(1 0 0)
Il est certain qu'il n'y a pas de particule dans II.
Rang 1 : V1=V0A=(0 1 0)
Il est certain qu'il y a 1 particule dans II.
Rang 2 : V2=V1A=V0A2=(½ 0 ½)
Il y a 1 chance sur 2 qu'il n'y ait pas de particule dans II,
1 chance sur 2 qu'il y en ait 2.
Rang 3 : V3=V2A=V0A3=(0 1 0)=V1
Le modèle de diffusion d'Ehrenfest : N=2
Recherche d'un état stable
(Vn) : suite géométrique de matrices lignes
A3=A donc la suite oscille entre deux valeurs :
 si n est pair, Vn=(½ 0 ½)
 si n est impair, Vn=(0 1 0)
Pas d'état stable
Le modèle de diffusion d'Ehrenfest : N=2
Retour à l'état initial
Sur 2n étapes : T2n nombre d'étapes
pour un retour à l'état initial
 P(T2n=1)=0
 P(T2n=2)=½
 P(T2n=3)=P(T2n=2k+1)=0
 P(T2n=2k)=(½)k
Le modèle de diffusion d'Ehrenfest : N=2
Retour à l'état initial
Espérance de T2n :
2n
n
n
i=1
k=1
k=1
E (T 2n )= ∑ i× P (T 2n =i )= ∑ 2k× P (T 2n = 2k )= ∑ k ×
n
∑
k=1
n
1
1
=
2−
2
2k − 1
1
∑ 2k − 1
k= 2
n
∑
k= 3
1
2k − 1
1
2k − 1
n− 1
()
1
= 1− ( )
2
1 1
= −( )
2 2
n− 1
n− 1
etc...
Par somme, on obtient :
n+ 2
E (T 2n )= 4− n− 1
2
Le modèle de diffusion d'Ehrenfest
Les cas N=3 et N=4
Réfléchir à une mise en place effective
avec les élèves.
Spécialité en Terminale S
3 – Échanges autour
du programme
Échanges autour du programme
• On ne commence pas par exposer pas des contenus,
on résout des problèmes.
• Les contenus introduits doivent être motivés, ils sont
réponses à une question, ce qui leur donne du sens.
Échanges autour du programme
Exigible au baccalauréat :
Les notions expressément écrites dans la colonne contenu.
Échanges autour du programme
Spécialité en Terminale S
4 – Le chiffrement
de Hill
Le chiffrement de Hill
Histoire des codes secrets
 Code César
 Codes par substitution monoalphabétique
 Code de Vigenère (décrypté par Babbage)
 Enigma : inventé vers 1918 par Scherbius,
décryptée pendant le 2nde guerre mondiale par Turing.
Le chiffrement de Hill
Un nouvel algorithme de codage
Fragilité des codes mono-alphabétiques
 Chaque lettre codée par un caractère unique.
 Décryptage possible par analyse des fréquences.
1931 : Nouvel algorithme publié par Lester Hill :
 Codage des caractères par bloc.
 Une même lettre codé par un caractère différent en
fonction de sa position.
Le chiffrement de Hill
Principe
 Chaque lettre codée par un nombre de 0 à 25.
 Clé de chiffrement constituée de 4 entiers compris
entre 0 et 25 : a, b, c, d.
 À chaque couple d'entiers (x ,y) on associe le couple
d'entiers compris entre 0 et 25 (x' ,y') tels que :
x' ≡ ax+by [26 ]
y' ≡ cx+dy [26 ]
Le chiffrement de Hill
Le chiffrement de Hill
Exercice 1
Le chiffrement de Hill
Le chiffrement de Hill
Exercice 2
Le chiffrement de Hill
Le chiffrement de Hill
Exercice 3
Le chiffrement de Hill
Le chiffrement de Hill
Exercice 4
Le chiffrement de Hill
Inconvénient et extensions
Le chiffrement de Hill est sensible à l'analyse des
fréquences :
 chaque couple de lettres est codé par le même couple de
lettres ;
 on peut donc étudier la fréquence des différents
digrammes.
Pour rendre l'analyse plus difficile, on peut coder par groupes
de 3 lettres ou plus.
Le chiffrement de Hill
Approche matricielle
On peut écrire la méthode sous forme matricielle :
X'=AX
où X est le vecteur colonne correspondant à deux lettres à
coder simultanément, A est la matrice clé et X' est le vecteur
colonne des lettres codées, avec des calculs modulo 26.
Le chiffrement de Hill
Synthèse
 Intérêt d'utiliser le tableur pour automatiser les calculs.
 Sujet charnière entre arithmétique et matrices.
 Réinvestissement des congruences.
 Introduction du concept de matrice inversible.
Spécialité en Terminale S
5 – La pertinence
d'une page Web et
l'algorithme PageRank
Pertinence d'une page Web : Pagerank
Une histoire du Web
 World Wide Web : Système hypertexte public
permettant de consulter des contenus multimedia par
internet.
 Idée développée par Tim Berners-Lee au Cern en
mars 1989.
 Projet rendu public en août 1991.
 Ne pas confondre avec internet, réseau physique
support de plusieurs protocoles (http, ftp, mail,
newsgroup).
Pertinence d'une page Web : Pagerank
Les moteurs de recherche
 1990-1992 : Liste de serveurs par Tim Berners-Lee.
 1990 : Archie, liste de serveurs FTP
 1993 : Catalogue du Web, W3Catalog (pas de
recherche)
 1993 : WWW Wanderer, premier robot
Aliweb, référencement par admins
 1994 : Webcrawler, robot + interface de recherche
Apparition de Lycos
 1995 : Yahoo (catalogue), Altavista
 Fin 90s : Nombreux moteurs, bulle financière
 1998-2000 : Montée en puissance de Google
 2011 : Google reçoit toujours 85 % des requêtes
Pertinence d'une page Web : Pagerank
Les raisons du succès de Google
 Une vision globale, alliant architecture complexe et
théorie mathématique approfondie pour la recherche.
 Théorie basée sur des recherches antérieures.
 Une approche différente du classement des réponses.
 La qualité (réelle ou ressentie) des réponses.
 Un large éventail
de services
“annexes”.
Pertinence d'une page Web : Pagerank
La formule de Brin et Page


P
R
T
P
R
T
P
R
T






1

d
1
2
n
P
R
(
A
)

d
 
 



NL
T
L
T
L
T






2
n
1

Un outil majeur : l’algèbre linéaire
Pertinence d'une page Web : Pagerank
Un exemple
Le web est un graphe orienté.
Pertinence d'une page Web : Pagerank
Comptage naïf :
Pertinence d'une page Web : Pagerank
Comptage pondéré :
Pertinence d'une page Web : Pagerank
Comptage récursif :
1
j  i
ij li
 Une page j est importante si beaucoup de pages
importantes pointent vers j.
 On tient compte de l’importance de la page d’origine
i et du nombre de liens qui en sont émis.
 Plausibilité
 Robustesse
Pertinence d'une page Web : Pagerank
Comptage récursif
n

a

j n

j
ij
i 1
i
1
où
1
 sii j
ai j li
0 sinon

Les coefficients vérifient :
a
0p
o
u
rto
u
ti,je
t
ij 
n
a
1p
o
u
rto
u
ti

j
1
ij
ai j : probabilité d’aller de la page i à la page j, en suivant
un des liens au hasard. On modélise ainsi un surfeur
aléatoire.
Pertinence d'une page Web : Pagerank
Comptage récursif
La matrice A constituée par les coefficients aij est une
matrice stochastique.
Les mesures de pertinences des pages, μi sont solutions
du système linéaire de n équations à n inconnues noté
W  WA
où W est la matrice ligne ayant pour coefficients les μi
Pertinence d'une page Web : Pagerank
Comptage récursif
Si l’on note Xp la position du surfeur après p étapes :
P
X

j

PX

j
P
X

i


p




p

1

1
p


X

i
n
p


i

1
c'est-à-dire
P

j
a
P

X

Xi

p

1
ij
p
n
i

1
En notant Up la matrice ligne des
P Xp  i
Up1 Up A
Pertinence d'une page Web : Pagerank
Comptage récursif
La suite des matrices lignes Up est donc géométrique :
Up U0 Ap
Les pertinences sont bien définies si la suite (Ap) des puissances
de la matrice Ap est convergente.
Pertinence d'une page Web : Pagerank
Limites du comptage récursif
Pertinence d'une page Web : Pagerank
Comptage récursif avec téléportation
 Probabilité c : le surfeur abandonne la page actuelle
se téléporte au hasard vers une des n pages du web ;
 Probabilité 1-c : modélisation précédente.
On obtient :
n
c
P
Xj



1

ca
P
X

i







p

1
i
j
p
n
i

1
ou encore
c


P
Xj



1

c
a
P
X

i







p

1
i
j
p


n


i

1
n
PX
 i1

n
puisque
i
1
p
Pertinence d'une page Web : Pagerank
Comptage récursif avec téléportation
Notation matricielle, où J désigne la matrice carrée (n,n)
dont tous les coefficients sont égaux à 1,
c


U

U
J

1c

A
p

1
p


n


ou encore
avec
U

c
AL

1
U
p

1
p
c
L= (11 .. . 1 )
n
Pertinence d'une page Web : Pagerank
Comptage récursif avec téléportation
La suite des matrices lignes Up est donc alors arithmeticogéométrique. Pour démontrer l'existence d'un état stable :
 on commence par chercher un point fixe : H
 en posant :
Vp Up H, on obtient :
p
V

1

c
V
A
 0
p 
p
puis
p
U

1

c
U

H
AH




p
0
p
 La constante c est un paramètre du modèle.
 c=0,15 correspond à suivre environ 6 liens en moyenne.
Pertinence d'une page Web : Pagerank
Exercice
Pertinence d'une page Web : Pagerank
Bibliographie

Document ressource Éduscol (juin 2012)

Michael Eisermann
Comment fonctionne Google ?
www-fourier.ujf-grenoble.fr/~eiserm

Christiane Rousseau et Yvan Saint-Aubin
Mathématiques et Technologie (Springer)
Spécialité en Terminale S
6 – Échanges autour
de l'évaluation