ELEMENTE DE STATISTICA MATEMATICA
Download
Report
Transcript ELEMENTE DE STATISTICA MATEMATICA
ELEMENTE DE
STATISTICA
MATEMATICA
a
STATISTICA MATEMATICA
Statistica matematica se ocupa de gruparea, analiza si interpretarea
datelor referitoare la un anumit fenomen precum si cu unele previziuni
privind producerea lui viitoare.
DEFINITIE. Prin populatia statistica se intelege orice multime
definita de obiecte de aceeasi natura. Elementele unei populatii se
numesc unitati statistice sau indivizi. Numarul de elemente
care constituie populatia se numeste volumul populatiei.
-----------------------------------------------------------------------------------------Se numeste caracteristica ( sau variabila statistica) a
populatiei trasatura comuna tuturor unitatilor ( indivizilor)
populatiei.
Caracteristica poate fi cantitativa ( daca se poate masura ) sau
calitativa ( in caz contrar ). In general o populatie se studiaza
dupa una sau mai multe caracteristici.
A
Caracteristica poate fi cantitativa ( daca se poate masura ) sau calitativa
( in caz contrar ). In general o populatie se studiaza dupa una sau mai
multe caracteristici. In cazul populatiilor cu un numar mare de indivizi se
efectueaza o statistica numai pentru o fractiune din populatia totala, iar
rezultatul obtinut se extinde pentru toata populatia. Fractiunea din
populatia totala pentru care se face statistica se numeste esantion. Este clar
ca aceste concluzii au sansa de a fi valabile cu cat esantionul este mai
mare. Gratie calculului posibilitatilor va fi posibil, in general, de a indica
gradul de incredere care se poate acorda concluziilor obtinute.
EXEMPLE
Populatia
Elevii unei
clase
Elevii unei
clase
Becurile
dintr-o
intreprindere
Locuitorii
unui oras
Locuitorii
unui oras
Caracteristica
Nota la teza
de
matematica
Culoarea
ochilor
Durata de
functionare
Varsta
Greutate
Caracteristicile : Nota la teza de matematica, Durata de viata, varsta.
Greutatea este de natura cantitativa, iar caracteristica Culoarea ochilor este
de natura calitativa.
Caracteristicile cantitative pot fi discrete ( sau discontinue) daca variabila
statistica ia valori finite ( sau numarabile) sau continue daca variabila poate
lua orice valoare dintr-un interval finit sau infinit (greutatea, talia, etc.).
A
Gruparea datelor se realizeaza cu scopul de a trage concluzii cu caracter
general.
Tabelul 1 de mai jos prezinta situatia notelor la teza de matematica intr-o
clasa de 25 de elevi.
Nota (caracteristica)
Numar de elevi
Nota ( caracteristica)
Numar de elevi
2
1
7
5
3
2
8
3
4
1
9
3
5
3
10
3
6
4
Plecand de aici se poate realiza tabelul 2 care prezinta o situatie mai sintetica
fata de cel precedent.
Clase de valori
Numar de elevi
<5
4
5-7
7
7 – 10
14
Q
In acest tabel am inmultit multimea valorilor caracteristicii in
trei clase. Se face conventia ca extremitatea dreapta ( cu exceptia,
eventual, a ultimei clase) pentru fiecare clasa sa nu apartina clasei.
De exemplu clasa 5-7 cuprinde valorile caracteristicii x, 5 ≤ x < 7 (
adica notele de 5 si 6). Lungimile claselor de valori sunt la
latitudinea celui care face investigatia si sunt stabilite in functie de
scopul urmarit. In cazul prezentat mai sus numarul elevilor care au
liat nota sub cea de „trecere” ( elevi foarte slabi pregatiti ) este egal
cu 4 si reprezinta 16% din totalul elevilor. Numarul celor cu o slaba
pregatire este reprezentat de cei care au luat note de 5 si de 6 ( deci
cei situati in a 2-a clasa ). Acesta este egal cu 7 si reprezinta 28% din
intregul elevilor. In fine in ultima clasa de valori , cei cu notele
7,8,9,10 sunt inclusi elevii buni si foarte buni. Acestia sunt in numar
de 14 si reprezinta 56 % din totalul elevilor. Numarul elevilor care
au obtinut o nota mai mare de 5 la teza este egal cu 21 si reprezinta
84% din totalul lor. In functie de aceste rezultate profesorul isi
poate formula o strategie pentru viitor in vederea imbunatatirii
performantelor elevilor acestei clase etc.
FRECVENTA ABSOLUTA. FRECVENTA RELATIVA.
FRECVENTE CUMULATE.
Numarul tuturor indivizilor ( sau unitatilor) unei populatii se numeste
efectivul total al acelei populatii. In cazul discret, tabelul 3, valorile
caracteristicii (nota –xi ) sunt date in prima coloana, iar in coloana a doua
figureaza numarul de indivizi ( ni ) corespunzator fiecarei valori a
caracteristicii.
Tabelul 3
Nota
Efectiv
Nota
Efectiv
xi
ni
2
3
4
5
xi
1
2
1
3
ni
6
7
8
9
10
Efectiv total : 1 + 2 + 1 + 3 + 4 + 5 + 3 + 3 + 3 = 25
( Σni )
4
5
3
3
3
Definitie. Se numeste frecventa absoluta ( sau efectiv ) a unei valori x a
caracteristicii, numarul de unitati ale populatiei corespunzatoare acestei
valori.
Q
In tabelul 3 valoarea 5 a caracteristicii are frecventa absoluta 3 ( in limbaj
uzual insemnand ca nota 5 a fost luata la teza de matematica de doar 3 elevi ).
Aceste date ( caracteristica, efectiv ) se reprezinta grafic, in raport de un
sistem de axe rectangulare, prin desene , care pun in evidenta anumite
rapoarte numerice. Graficul corespunzator se numeste diagrama. Alegerea
unitatii pe fiecare dintre axe ramane la latitudinea celui care prelucreaza
datele.
O prima reprezentare o constituie reprezentarea in batoane aplicata
caracteristicii discrete cu un numar mic de valori. Pe axa orizontala sunt
trecute punctele reprezentand valorile variabilei si din aceste puncte se ridica
segmente verticale de lungime egala cu frecventa absoluta a valorii
respective. Segmentele ridicate sunt masurate cu unitatea de pe axa
verticala.
In cazul tabelului 3 se obtine diafragma din figura 1.
A
Unind printr-o linie poligonala extremitatile superioare ale acestor segmente se
obtine ceea ce se cheama poligonul frecventelor ( marcat prin linii discontinue in
figura 1 ).
Realizam un alt tabel cu aceleasi note la teza de matematica in care lungimile
claselor sa fie aceleasi. Avem tabelul 4.
Clase de valori
Efectiv
Procent
2–4
3
12%
4-6
4
16%
6-8
9
36%
8 - 10
9
36%
A
Vom reprezenta aceste date printr-un grafic numit histograma, unde
pe axa orizontala se iau o succesiune de segmente egale ( reprezinta
lungimea claselor) si se ridica pe fiecare din aceste segmente considerate
ca baze , dreptunghiuri de inaltimi proportionale cu frecventele absolute
ale claselor respective( fig 2).
Daca in mijlocul fiecarui segment de pe axa orizontala ( aceste
mijloace de intervale le numim valori centrale ) se ridica segmente
proportionale cu frecventele claselor corespunzatoare fiecarui segment si
unim printr-o linie poligonala extremitatile ale acestor segmente se
obtine poligonul frecventelor.
Uneori datele ( din tabelul 4 ) se reprezinta prin dreptunghiuri de
baze egale si cu inaltimi proportionale cu procentele ( fig 3) sau prin
sectoare de cerc, cu unghiuri proportionale cu aceleasi numere ( fig 4).
D
Este adesea interesant de a prezenta intr-un tabel statistic pentru
fiecare valoare xi a caracteristicii raportul fi dintre numarul de indivizi
care au aceasta valoare si efectivul total al populatiei.
A
Definitie. Se numeste frecventa relativa ( sau simplu
frecventa ) a unei valori xi a caracteristicii raportul dintre
frecventa absoluta ni a valorii xi si efectivul total al
populatiei.
Se numeste frecventa cumulata crescatoare a unei valori x a
variabilei, suma tuturor frecventelor valorilor care apar pana
la x inclusiv.
Se numeste frecventa cumulata descrescatoare a unei valori
x a variabilei suma tuturor frecventelor valorilor care apar de
la x inclusiv.
Vom lucra cu frecventa cumulata crescatoare.
Prelucram datele oferite de tabelul 1 sub forma tabelului 5.
A
Nota
Efectiv
Frecventa
Frecventa cumulata
3
1
0,040
0,040
3
2
0,080
0,120
4
1
0.040
0,160
5
3
0,120
0,280
6
4
0,160
0,440
7
5
0,200
0,640
8
3
0,120
0,760
9
3
0,120
0,880
10
3
0,120
1
Daca din tabelul 5 se retin coloanele unu ( cu valorile caracteristicii ) si
trei ( cu valorile frecventelor ) atunci aceste informatii definesc distributia
sau repartitia statistica a variabilei respective.
Analiza statistica a unui fenomen , in raport cu o singura caracteristica ,
conduce la o serie de perechi de valori (caracteristica, efectiv).
ELEMENTE CARACTERISTICE UNEI SERII
STATISTICE.
Tabelele si graficele de mai sus ofera o buna idee a modului in care o
caracteristica este distribuita. Dar se cauta, adesea, de a ilustra aceasta distribuire
intr-o maniera mai cuprinzatoare prin cateva numere caracteristice.
1.Media .
Fie x variabila statistica ( caracteristica ) care ia valorile x1,x2,....,xk cu efectivele
corespunzatoare n1,n2,....,nk.
Acest numar se mai numeste si media ponderata a numerelor x1, x2 ,.....,xk ;
numerele n1, n2, ...,nk se numesc ponderile respective ale numerelor x1, x2 ,....., si
respectiv xk .
Media se mai poate scrie cu ajutorul frecventelor astfel
Luand datele din tabelul 1 gasim ca media notelor la teza
de matematica este
A
Daca pentru o caracteristica informatiile sunt impartite pe
clase, atunci xi este valoarea centrala a clasei respective ,
adica este mijlocul intervalului.
In cazul tabelului 4 gasim ca
MEDIANA
Observatie. Mediana nu este afectata de valorile extreme ale caracteristicii.
Modulul
Definitie. Prin modul (sau dominanta) unei serii statistice se intelege
valoarea caracteristicii corespunzatoare celei mai mari frecvente daca valorile
caracteristicii sunt discrete si valoarea centrala a clasei corespunzatoare celei
mai mari frecvente daca variabila este continua.
In cazul exemplului pe care-l analizam si corespunde variabilei discrete
(vezi tabelul 5) dominanta este 7.
A
Observatie. Modulul este insensibil la valorile extreme.Ca element
numeric modulul este mai putin utilizat decat media sau mediana.
Dispersia
Daca se doreste sa se vada cat se departeaza valorile de mediana
se poate calcula media diferentelor absolute | xi - |.Din
ratiuni esential teoretice se prefera sa se calculeze media patratelor
diferentelor ,adica daaca variabila ia valorile x1, x2 ,.....,xk cu
efectivele corespunzatoare n1, n2, ...,nk atunci
Numarul v se numeste dispersia valorilor (sau variatia) esantionului.
A
Acest numar se exprima in aceleasi unitati ca si caracteristica seriei.
Utilizand acest indicator putem compara doua clase de elevi din punct de
vedere al omogenitatii lor prin prisma mediilor finale. Cea care are
dispersia mai mica este mai omogena.
La fel un antrenor are posibilitatea de a forma doua echipe de footbal ,
cunoscand golurile marcate de fiecare echipa. Se va opri la acea formula de
echipa care este mai omogena, adica aceea care are dispersia mai mica.
PROPRIETATI ALE VARIATIEI
Prin calcul direct se arata usor ca variatia are exprimarile
PREZENTARE REALIZATA DE
ELEVA MINDRU IULIA