Presentazione di PowerPoint - Facoltà di Scienze Statistiche

Download Report

Transcript Presentazione di PowerPoint - Facoltà di Scienze Statistiche

Facoltà di Ingegneria
dell’Informazione, Informatica e
Statistica
Dip. di Informatica
e Sistemistica A. Ruberti
Dip. di Ing.
Dell’Informazione,
Elettronica e
Telecomunicazioni
Dipartimento di
Informatica
Dipartimento di
Scienze Statistiche
Paolo Franciosa
[email protected]
1
Sai ched'è la statistica? E' 'na cosa
che serve pe' fa' un conto in generale
de la gente che nasce, che sta male,
che more, che va in carcere e che sposa.
Ma pe' me la statistica curiosa
è dove c'entra la percentuale,
pe' via che, lì, la media è sempre eguale
puro c'o' la persona bisognosa.
Me spiego, da li conti che se fanno
seconno le statistiche d'adesso
risurta che te tocca un pollo all'anno:
e, se nun entra ne le spese tue,
t'entra ne la statistica lo stesso
perchè c'é un antro che se ne magna due.
Trilussa
2
La Statistica
NON è solo questo!
Elaborare informazione
Comunicare informazione
Assumere decisioni
Gestire operazioni complesse
Statistica:
Raccogliere, organizzare,
“far parlare” le informazioni
–Strumento di decisione
in condizioni di
incertezza
Offerta formativa
Master
I livello
Laurea
Laurea
specialistica
Dottorato di
ricerca
Master
II livello
Corsi di laurea in
Statistica
• Lauree
• Statistica, economia, finanza e assicurazioni
• Statistica, economia e società
• Statistica gestionale
• Lauree magistrali
• Scienze attuariali e finanziarie
• Scienze statistiche demografiche e sociali
• Scienze statistiche e decisionali
• Scienze statistiche ed economiche
• Scienze statistiche per le strategie aziendali
Ambiti professionali dello statistico (1)
–analisi dei processi demografici
–
–
–
–
struttura della popolazione,
logiche della produzione e del consumo, della
integrazione e dell’esclusione sociale,
sistemi di protezione socio-sanitari,
previdenza sociale
Profili professionali (2)
– nel settore assicurativo, previdenziale e bancario
– gestione di sistemi assicurativi e previdenziali privati
e sociali
– analisi dei mercati finanziari
– analisi dei sistemi economici
Riassumendo:
Analisi dei dati
per il
supporto alle decisioni
Profili professionali
–analisi dei processi demografici
–
–
struttura della popolazione,
logiche della produzione e del consumo, della
integrazione e dell’esclusione sociale
–
sui sistemi di protezione socio-sanitari
–
sulla sicurezza sociale
–in grado di inserirsi in
–amministrazioni, aziende, servizi, agenzie ed istituti di ricerca in attività
di raccolta di dati ed informazioni di tipo quantitativo e qualitativo
necessari alla soluzione di problemi specifici; di utilizzare i sistemi
informativi e gli archivi esistenti, redigere rapporti di sintesi di supporto
alle decisioni.
Attività principali
dello statistico
• Analisi dei dati
• “Data mining” (identificare relazioni
nascoste)
• Gestione del rischio
• Misurare significatività esperimenti
• Ottimizzare processi
Strumenti
•
•
•
•
Matematica
Calcolo delle probabilità
Informatica
Scienze applicate (Economia,
sociologia, finanza, …)
Analisi dei dati - Data Mining
Individuare regolarità
Presentare risultati
Statistica “spaziale”
• Studio di dati e fenomeni legati al
territorio
Le onde
L’impatto del moto ondoso
sulla costa è importante per
le
dinamiche
litoranee,
nonché per la valutazione
delle sollecitazioni sui porti e
le strutture costiere.
Inoltre il moto ondoso è il
maggior
responsabile
dell’erosione costiera e
delle sollecitazioni che
avvengono sulle strutture
marine fisse o flottanti
Dinamica delle onde
Le altezze d’onda si misurano in
acque profonde per evitare gli effetti
dovuti alla batimetria, sotto costa
l’onda frange e aumenta la propria
altezza….
Modello di previsione
dell’intensità delle onde
Sviluppo applicazioni GIS:
PESCA
Modelli spaziali: distribuzione dei giovanili (Kriging Bayesiano)
Medits 1996
Medits 2004
Grund 1996
Grund 2004
“Modelli” ….
La matematica per descrivere fenomeni!
 Modello lineare
generalizzato
 Modello additivo
generalizzato
 Modello additivo
generalizzato Bayesiano
Esempio: contare …
–Quanti esemplari di una specie animale ci
sono in una certa zona?
–Non possiamo osservarli tutti!
“stimiamo”
il numero
Modello:
urna di contenuto ignoto
–Quanti biglie ci sono nell’urna?
•
•
•
•
estraggo 10 biglie
le contrassegno e le reinserisco nell’urna
mescolo ….
riestraggo 10 biglie e le osservo
cosa deduco?
L’Informatica
NON è solo questo!
Informatica
Gestione dell’informazione:
• Basi di dati
•
•
•
•
•
•
Sviluppo di sistemi software
Sicurezza
Robotica
Trasmissione dell’informazione (reti di computer)
Rappresentazione dell’informazione
Aspetti teorici (decidibiità, complessità)
Esempio: rappresentare una
rete stradale
Struttura:
• punti (piazze, incroci, …)
• segmenti che uniscono punti
Altre “reti”
•
•
•
•
•
internet - computer uniti da collegamenti
web - pagine web con link ipertestuali
reti sociali (p.es. Facebook) - persone unite da “amicizia”
traffico telefonico - utenti uniti dalle chiamate
…….
Problema: trovare cammino più
breve tra due punti della rete
Come calcolare il cammino
più breve da A a B?
Soluzione ingenua:
tento tutti i percorsi possibili da A a B
e scelgo il migliore
Quanto tempo impiego? (ho 1.000.000 di PC a 100 GHz!!!!!)
Se la rete stradale ha 100 punti
e da ogni punto partono 5 strade …
1.000.000.000.000.000.000.000.
000.000.000.000.000.000.000.000 anni
Come calcolare il cammino
più breve?
a
b
Come calcolare il cammino
più breve da A a B?
Metodo (leggermente) più astuto:
Algoritmo di Dijkstra
a
b
Motori di ricerca
Un motore di ricerca (Google, Yahoo, …)
permette di trovare le pagine web che contengono le
parole richieste …
… ordinate per “utilità”
(autorevolezza)
Come si determina
l’autorevolezza di una pagina
web?
Si deve risolvere un
ENORME sistema
di equazioni lineari
Problema: verificare se due
file sono identici
archivio
archivio
Sede di Milano
Sede di Roma
36
Soluzioni
Trasferisco il file da Roma a Milano e lo confronto
• tempo di trasferimento elevato
• possibili errori di trasmissione (se il file è grande …)
Scelgo dei frammenti a caso, trasferisco i frammenti e li confronto
• se le differenze sono altrove non me ne accorgo
Calcolo un “numero” sufficientemente grande X a partire dal file A (a Roma)
Applicando lo stesso procedimento, calcolo il numero Y a partire dal file B (a Milano)
Trasferisco il numero X da Roma a Milano e lo confronto con Y
• trasferisco solo il numero (p.es. 100 cifre)
• se X e Y sono uguali, allora quasi sicuramente A e B sono uguali
37
Quasi sicuramente …
Se il numero derivato dal file ha 100 cifre, la probabilità di dare una
risposta non corretta è
1 su 10100
38