3-VjerojatnostIStatistika

Download Report

Transcript 3-VjerojatnostIStatistika

4. Vjerojatnost i
statistika
4.1 Izvod iz matematike
4.2 Vjerojatnost
4.3 Opisna statistika
4.4 Inferencijalna statistika
Inženjerima je statistika potrebna za:
1. praćenje stručne i znanstvene literature – rezultati istraživanja se u
radovima u pravilu izražavaju sažetom obliku, uz korištenje statističkih
termina i simbola
2. planiranje istraživanja i pokusa – koliko je potrebno pripremiti uzoraka
prije provedbe pokusa za dobivanje očekivanih rezultata
3. opise i analize rezultata sakupljanja podataka i/ili pokusa – izrazima
deskriptivne statistike se skup s velikim brojem podataka može kratko i
jasno opisati
4. uopćavanje zaključaka temeljenih na rezultata pokusa – korištenjem
metoda inferencijalne statistike kvantitativno se uopćavanje rezultata
provedenih pokusa
Za razumijevanje statistike neophodna su znanja iz vjerojatnosti, na kojoj se
temelje statističke metode.
Za razumijevanje vjerojatnosti neophodna su znanja iz matematičke logike i
teorije skupova na kojima se temelje izračunavanja vjerojatnosti.
4.1 Izvod iz matematike
Matematika je teorijska znanost koja proučava brojčane odnose (aritmetika,
algebra, infinitezimalni račun) i prostorne oblike (geometrija). Fizički se zakoni
najsažetije opisuju matematičkim formulama – matematičkim modelima (opisi a ne
objašnjenja). Pri formiranju matematičkih modela tehnoloških procesa, zbog
složenosti (Y = f(X) ili X = f(t), gdje je X = {x1 , x2 , ... , xn }), mora se u analizama
razlučiti bitno i nebitno, usredotočiti na bitno a zanemariti nebitno.
Za savladavanje gradiva PPiOPTP potrebna su znanja samo iz elementarne
matematike, ali matematička spretnost uvelike olakšava/ubrzava izračunavanja.
zaokruživanje:
23,2472  1,1 = 26
23,2472  1,05 = 24,4
23,2472  1,15 = 26,7
23,2472  1,100 = 25,57
348 300  48 300 48
48




5
minuti  sati:
60
60
60 60
60
7! 1 2 3 4 5 6 7

 6 7  42
faktorijeli:
5!
1 2 3 4 5
Planiranje i obradu rezultata pokusa olakšavaju znanja iz matematičke logike i
teorije skupova. Korištenjem simbolike matematičke logike i teorije skupova
postiže se preciznost i sažetost izlaganja.
4.1.1 Matematička logika
Iskaz – logički izraz (rečenica) koji ima smisla i može biti točan ili netočan:
8 > 4 – točan iskaz
5 < 8 – netočan iskaz
Iskazi se označavaju slovima p, q, r, …, točan iskaz s 1, netočan s 0:
8>4=p p=1
5<8=q q=0
Iskazi se povezuju logičkim operatorima: , , , , , koji se čitaju i imaju
značenja:
p  q – p i q (konjunkcija) – iskaz je točan ako su oba iskaza p i q točni
p  q – p ili q (disjunkcija) – iskaz je točan ako je jedan od iskaza p i q točan
p  q – iz p slijedi q (implikacija) – iskaz je netočan ako iskaz p točan a iskaz
q netočan
p  q – p ako q (ekvivalencija) – iskaz je točan ako su oba iskaza p i q točna ili
oba netočna
p
– ne p (negacija) – iskaz je točan ako je iskaz p netočan
4.1.1 Matematička logika -
p
q
p
q
pq
pq
pq
pq
1
1
0
0
1
1
1
1
1
0
0
1
0
1
0
0
0
1
1
0
0
1
1
0
0
0
1
1
0
0
1
1
2
4.1.2 Teorija skupova
Skup obuhvaća n elemenata (u granicama: 0  n  ) i osnovni je pojam u
matematici. Skup je poznat ako su poznata pravila, ograničenja i svojstva na
temelju kojih se mogu odrediti svi njegovi elementi.
Skupovi se obilježavaju velikim slovima (A, B, …, Y, Z), elementi skupova
malim slovima (a, b, …, y , z), a pripadnost elemenata skupu se obilježava sa:
 – pripada – x  A – se čita “element x pripada skupu A",
 – ne pripada – x  A – se čita “element x ne pripada skupu A“
Prazan skup (n = 0) označava se sa Ø.
Elementi skupova se opisuju na dva načina:
(a) odvajaju se zarezima i obuhvaćaju vitičastom zagradom:
A = {1, 2, 3, 4, 5, 6, 7, 8, 9} ili B = {a, e, i, o, u}
(b) u vitičastoj se zagradi navodi oznaka elementa, dvotočka i uvjeti pripadnosti
odvojeni zarezima:
C = {x: x paran broj, x > 0} ili D = {y: y slovo engleske abecede, y je suglasnik}
Zarez se čita kao "i", a dvotočka kao "pri čemu je". Prema tome, skup A obuhvaća
elemente 1, 2 i 3 i 4 i 5 i 6 i 7 i 8 i 9, a skup C obuhvaća elemente x pri čemu je x
paran broj i x veći od nule.
4.1.2 Teorija skupova Pored simbolike matematičke logike, u teoriji skupova se koriste oznake:
 – sa značenjem: za svako
 – sa značenjem: postoji
Na primjer:
(x  ) (y  ) 3x – 5y = 0
čita se: za svaki element x koji pripada skupu realnih brojeva () postoji element
y, koji također pripada skupu realnih brojeva, s kojim se može ispuniti uvjet
određen jednadžbom 3x – 5y = 0
Zapisi sa simbolima
teorije skupova
x  A (y  A)
Značenje
element x pripada (y ne pripada) skupu A
AB
skup je A podskup skupa B; (x) x  A  x  B
AB
unija skupova A i B; A  B = {x: x  A  x  B}
A B
presjek skupova A i B; A  B = { x: x  A  x  B}
A\B
razlika skupova A i B; A\B = { x: x  A  x  B}
AC
komplement skupova A i B; AC = { x: x    x  A}
gdje je:  – univerzalni skup koji obuhvaća sve aktualne skupove.
2
4.1.2 Teorija skupova Za pojašnjenja su u teoriji skupova korisni Vennovi dijagrami:
Zakoni algebre skupova:
(idempotentnost)
AA=A
(A  B)  C = A  (B  C)
AB=BA
A  (B  C) = (A  B)  (A  C)
AØ=A
A =
A A=A
(asocijativnost)
(A  B)  C = A  (B  C)
(komutativnost)
A B=B A
(distributivnost)
A  (B  C) = (A  B)  (A  C)
(identitet)
A =A
A Ø=Ø
3
4.1.2 Teorija skupova Zakoni algebre skupova se također lako pojašnjavaju s Vennovim dijagramima.
Na primjer, zakon distributivnosti:
A  (B  C) = (A  B)  (A  C)
Osobito su važni skupovi brojeva:
prirodni brojevi
cijeli brojevi
racionalni brojevi
realni brojevi
() – n, n  1; {1, 2, …}
() – z, z  0; {…, –2, –1, 0, 1, 2, …}
() –  = {:m, n}
() –  =   {x: x iracionalni broj, –  x  }
4
4.1.2 Teorija skupova Skup realnih brojeva () obuhvaća skup racionalnih () i iracionalnih brojeva.
Skup racionalnih brojeva () obuhvaća skup cijelih brojeva (), koji obuhvaća
skup prirodnih brojeva ().
Svi se realni brojevi () mogu prikazati na brojnom pravcu s dvije istaknute
točke: prva je 0, koja određuje ishodište, druga 1, koja određuje jediničnu duljinu.
Skup se kompleksnih brojeva () ne može prikazati na jednom brojnom pravcu.
Iracionalni brojevi () – ne mogu se izraziti s razlomkom cjelobrojnog brojnika i
nazivnika, odnosno decimalnim brojem s konačnim brojem znamenki, ali imaju
odgovarajuće točke na brojnoj osi (na primjer: , , …).
5
4.2 Vjerojatnost
Slučajni pokusi – usprkos ponavljanja pokusa svaki put na isti način, zbog
djelovanja nekontroliranih vanjskih utjecaja – poremećaja, ne dobivaju se isti
rezultati (temperatura u peći za taljenje metala, glavna sila rezanja nožem na
tokarskom stroju, napon zavarivanja).
Prevelik intenzitet poremećaja može onemogućiti izvođenje zaključka iz rezultata
provedenog pokusa.
Rezultat slučajnog pokusa naziva se ishodom.
S–
A–
prostor uzorka – skup svih mogućih različitih ishoda
slučajni događaj – jednočlani ili višečlani podskup skupa S
Kao prvi problem se javlja prebrojavanje broja elemenata prostora uzorka i
slučajnog događaja.
4.2.1 Prostor uzorka
U opisivanju prostor uzorka koristi se simbolika teorije skupova.
Prostor uzorka ovisi o cilju analize:
1. ako se ispituje debljina komada od polimera: S = {:  > 0}, [] = mm
2. ako se zna da je debljina čeličnog lima između 1 i 2 mm: S = {: 1 <  < 2},
[] = mm
3. kada se sortiraju noževi za tokarenje: S = {m, s, v} (mali, srednji, veliki)
4. kada se ispituje ispravnost senzora: S = {d, n} (da – ispravan, ne – neispravan)
5. ako se ispituje ispravnost dvodijelnog sklopa: S = {dd, dn, nd, nn}
6. kada se za dvobojnu oznaku biraju trake u tri boje (crveno, bijelo, plavo):
 bez zamjene, redoslijed važan: S = {ab, ac, ba, bc, ca, cb}
 bez zamjene, redoslijed nije važan: S = {ab, ac, bc}
 sa zamjenom, redoslijed važan: S = {aa, ab, ac, bb, ba, bc, cc, ca, cb}
 sa zamjenom, redoslijed nije važan: S = {aa, ab, ac, bb, bc, cc}
"Sa zamjenom" podrazumijeva ponavljanja jednakih ishoda (aa, bb, cc), a
"redoslijed važan" podrazumijeva ponavljanje istog ishoda u drugom
redoslijedu elemenata (ab, ac, ba, bc, ca, cb).
4.2.1 Prostor uzorka U složenijim slučajevima se formira stablo izbora. Na primjer, bira se vozilo
1. s motorom od 60 ili 77 KW
2. sa i bez ABS-a (anti-lock braking system – sustav za sprječavanje blokiranja
kotača pri kočnicama)
3. sa ili bez klimatizacije
4. s crvenim, sivim ili plavim sjedalima
5. u srebrnoj, bijeloj ili crnoj boji karoserije.
Pravilo množenja – ako se postupak izbora odvija u k koraka, uz oi opcija u
svakom koraku, broj je mogućih ishoda:
k
n =  oi
i=1
Za prethodni je primjer izbora vozila: n = 2222 = 36.
2
4.2.1 Prostor uzorka Permutacije
Za permutacije:
(a) broj elemenata slučajnog događaja jednak je broju različitih elemenata uzorka
(b) bez zamjene (kada se iz uzorka uzme jedan element uzorak se ne nadopunjuje)
(c) redoslijed važan
broj je mogućih ishoda:
Pn = n! = n
n -1 n - 2 
2 1
gdje je: n – broj elemenata u uzorku (i u slučajnom događaju).
Za uzorak S = {a, b, c} broj je mogućih slučajnih događaja:
P = 3! = 321 = 6.
Provjera: abc, acb, bac, bca, cab, cba – uključeni svi elementi, bez zamjene
redoslijed važan.
Isti se rezultat dobiva i s pravilom množenja:
1. u prvom koraku su moguće tri opcije: a,b,c
2. u drugom su koraku preostale dvije opcije (jedna je već izvučena): a,b a,c b,c
3. u trećem koraku je preostala samo jedna opcija (dvije su već izvučene): a b c
k
n = o  3 2 1 6
i=1
i
3
4.2.1 Prostor uzorka -
Permutacije
Ako se izmijeni uvjet (a): broj je elemenata slučajnog događaja (r) manji (veći ne
može biti) od broja elemenata u uzorku (n):
Prn =
n!
 n - r !
Za uzorak S = {1,2,3,4,5,6,7,8,9} mogućih je slučajnih događaja s četiri elementa:
n!
8!
8 7 6 5 4!
Prn =


 1680
4!
 n  r !  8  4 !
Isti se rezultat dobiva i s pravilom množenja:
k
n =  oi  8 7 6 5  1680
i=1
Ako uzorak sadrži više jednakih elemenata (a, b, c) u različitim količinama (, , ,):
Pn =
n!
! ! !
Za uzorak S = {a,a,b,b} mogućih je slučajnih događaja s četiri elementa:
n!
4!
4 3 2 1
Prn =


6
 !  ! 2! 2! 2 1 2 1
• Provjera: aabb, abab, abba, baab, baba, bbaa
4
4.2.1 Prostor uzorka Kombinacije
Za kombinacije:
(a) broj elemenata slučajnog događaja je manji od broja elemenata uzorka
(b) bez zamjene (kada se iz uzorka uzme jedan element uzorak se ne nadopunjuje)
(c) redoslijed važan
broj je mogućih ishoda:
n
n!
Cnr =   =
 r  r! n - r !
gdje je: n – broj elemenata u uzorku
r – broj elemenata u slučajnom događaju.
Za uzorak S = {a,b,c,d} mogućih je slučajnih događaja s tri elementa:
n!
4!
4 3 2 1
Cnr =


4
r!  n  r ! 3!  4  3 ! 3 2 1 1
Provjera: abc, abd, acd, bed
n!
4!
4 3 2 1
Prn =


 24
1
 n  r !  4  3 !
Provjera: abc, acb, abd, adb, acd, adc, bac, bca, bad, bda, bcd, bdc, ...
5
4.2.2 Vjerojatnosti
mogućih ishoda
Subjektivna vjerojatnost jednog od mogućih ishoda (A) je:
0  P(A)  1 (jedinična)
0  P(A)  100 (postotna)
i određuje se na temelju prosudbe. Ako je:
(a) P(A) = 0
– ishod A se ne može pojaviti,
(b) 0 < P(A) < 1 – ishod A se može ali neće uvijek pojaviti i
(c) P(A) = 1
– ishod A će uvijek pojaviti.
Ako je P(A) = 0,5 ista je mogućnost pojavljivanja i nepojavljivanja ishoda A.
Umjesto jediničnih vjerojatnosti: 0  {P(A)}  1, [P(A)] = –, često se navode i
postotne: 0  {Pp(A)}  100, [Pp(A)] = %  Pp(A) = 100 P(A).
4.2.2 Vjerojatnosti mogućih ishoda Klasična vjerojatnost:
P(A) 
m
n
gdje je: m – broj povoljnih ishoda
n – broj svih mogućih ishoda
Statistička vjerojatnost:
m
n n
P(A)  lim
Statistička se vjerojatnost praktično aproksimira relativnom frekvencijom:
P(A) 
gdje je: MA –
n
–
MA
N
broj elemenata skupa s obilježjem A (u statističkom skupu
elemenata) ili broj obilježja A (u statističkom skupu obilježja)
ukupni broj elemenata skupa ili obilježja
5
4.3 Opisna statistika
U provedbi pokusa, usprkos ponavljanja istih mjerenja na isti način dobivaju se
različite vrijednosti veličina. Mjerene se veličine nazivaju slučajnim veličinama:
konstantne (sila rezanja pri tokarenju osovine, napon zavarivanja limova oplate kotla):
y =  +  (pri ponavljanju mjerenja se dobivaju različite vrijednosti)
gdje je: C – konstanta (istinita vrijednost varijable)
 – slučajni poremećaj (može povećati ili smanjiti vrijednost veličine)
promjenljive s vremenom (sila rezanja pri tokarenju osovine, napon zavarivanja
limova oplate kotla):
y = f(t) +  (tijekom praćenja procesa se dobivaju različite vrijednosti)
gdje je: t – vrijeme (istinita vrijednost varijable)
promjenljive s vanjskim utjecajem (sila rezanja pri tokarenju osovine, napon
zavarivanja limova oplate kotla):
y = f(x) +  (tijekom praćenja procesa se dobivaju različite vrijednosti)
gdje je: x – vanjski utjecaj (postavljena ili mjerena – slučajna veličina)
4.3 Opisna statistika Primjeri navedeni u zagradama naglašavaju ovisnost pristupa varijablama o
cilju analize – napon zavarivanja je konstantan U = U0 V, mijenja se s
vremenom U = f(t) ili sa strujom zavarivanja U = f(I).
Razvijenim sustavom za praćenje procesa zavarivanja snimljeni su napon,
struja i zvuk zavarivanja metala taljivom elektrodom u zaštitnom plinu.
Učestalost je uzorkovanja napona i struje zavarivanja 10 kHz, zvuka 44,1 kHz.
Proces je praćen 6 s (zabilježeno skoro 750 000 vrijednosti veličina), a na
dijagramima su za interval od 0,2 s prikazani: (a) napon i struja zavarivanja, (b)
zvuk zavarivanja.
2
4.3 Opisna statistika Znanja iz statistike tijekom pripreme pothvata značajno pomažu inženjerima u
prikupljanju podloga te modeliranju, simuliranju i optimiranju procesa.
U rješavanju inženjerskih problema statistika utvrđuje i primjenjuje postupke:
Podaci su kvalitativna i kvantitativna svojstva stanja i procesa, a mogu biti:
(a) primarni, ako su dobiveni provedbama eksperimenata (promatranjima) i
(b) sekundarni, ako su prikupljeni iz ostalih izvora podloga.
Statistika obrađuje statističke skupove:
3
4.3 Opisna statistika Statistički skupovi jedinki obuhvaćaju aktualne istovrsne jedinke (zaposlenici,
osovine, aparati za zavarivanje), određene:
a statistički skupovi vrijednosti obilježja obuhvaćaju podatke o statističkim
skupovima jedinki (plaće zaposlenika, hrapavosti osovina, naponi zavarivanja).
Populacija obuhvaća cijeli skupa, a uzorak njegov odabrani dio.
Statističko obilježje (skraćeno, obilježje) je pokazatelj promatranog svojstva jedinki
skupa, koje varira od jedinke do jedinke, prostorno i/ili vremenski.
Vrijednosti se obilježja određuju mjerenjima – posrednim usporedbama s
odgovarajućim etalonima. Redoslijed kvalitativnih nominalnih obilježja (boja vozila:
crvena, bijela, plava, …) proizvoljan je, a redoslijednim se obilježjima mogu pridružiti
redni brojevi (matematičke operacije besmislene). Diskretno obilježje može poprimiti
konačan broj vrijednosti a kontinuirano obilježje beskonačan.
4
4.3 Opisna statistika Frekvencije opisuje brojeve jednakih vrijednosti obilježja skupa – jedne ili više
jedinki.
Apsolutna pojedinačna frekvencija – broj jednakih vrijednosti obilježja (fj).
relativna pojedinačna jedinična frekvencija:
pj 
relativna pojedinačna postotna frekvencija:
fj
pj 
n
fj
n
100
gdje je: n – broj jedinki
Kumulativne su frekvencije:
apsolutna:
relativna jedinična:
relativna postotna:
Fj   fj
Pj  pj
Pj  pj 100
5
4.3 Opisna statistika U velikom industrijskom pogonu radi veći broj istovrsnih strojeva. Bilježenjem broja
kvarova po danu tijekom 200 dana formirana je tablica:
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Ukupno
Redni broj
Broj kvarova Xj 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
200
Frekvencija fj 1 2 8 13 20 18 27 34 28 12 13 10 7 1 1 2 1 0 0 2
Jedinke su dani, uzorak obuhvaća 200 dana. Obilježje je broj kvarova, mjerna je
skala diskretna (vrijednosti obilježja su potpune – točne).
Histogram frekvencija (apsolutne pojedinačne)
Poligon frekvencija (apsolutne pojedinačne)
6
4.3 Opisna statistika Poligon frekvencija (relativne postotne)
Kumulativni poligon frekvencija (postotne)
Mjerenjem zatezne čvrstoće čelika (Rm) dobivene su vrijednosti.
285 341 323 300 313 294 305 317 286 312 267 316 300 298 312 319 296
Rm
284 293 298 322 292 267 305 299 275 318 304 298 301 282 309 297 313
2
N/mm 296 323 305 307 289 307 396 342 310 336 286 320 290 323 288 306
Jedinke su eksperimentalne normirane epruvete izrađene od ispitivanog čelika,
uzorak obuhvaća 50 epruveta. Obilježje je zatezna čvrstoća, mjerna je skala
kontinuirana (vrijednosti obilježja nisu potpune – tri značajne znamenke).
7
4.3 Opisna statistika Točkasti grafici – rezultat svakog mjerenja prikazan je s po jednom točkom pored
brojne osi.
Poligon frekvencija (apsolutne pojedinačne)
Kumulativni poligon frekvencija (postotne)
7
4.3 Opisna statistika U novije se vrijeme koriste i SL (Stem/stablo and/i Leaf/list) prikazi:
285 341 323 300 313 294 305 317 286 312 267 316 300 298 312 319 296
Rm
284 293 298 322 292 267 305 299 275 318 304 298 301 282 309 297 313
N/mm2 296 323 305 307 289 307 396 342 310 336 286 320 290 323 288 306
fi
2
1
7
11
11
9
5
1
2
0
0
0
0
1
Rm-1,2
26
27
28
29
30
31
32
33
34
35
36
37
38
39
Rm-3
77
5
2456689
02346678889
001445556779
022336789
02333
6
12
6
Rm-1,2 – prva i druga znamenka brojčanog iznosa
Rm-3 – treća znamenka brojčanog iznosa
8
4.3.1 Srednja vrijednost
obilježja
Aritmetička sredina,  ili x :
populacija:
uzorak:
1 N
   xi
N i1
1 n
x   xi
n i1
gdje je: N – broj jedinki u populaciji,
n – broj jedinki u uzorku,
x – vrijednost obilježja.
Potrebno je utvrditi tvrdoću alata po Rockwellu. Mjerenjem su dobivene vrijednosti:
HRC
60
59
60
59
61
60
60
58
60
60
62
61
60
59
60
58
60
59
61
60
59
60
60
61
60
1 25
HRC 
 HRCi
25 i1
S Excel naredbom AVERAGE(A1:A25) dobiva se srednja vrijednost obilježja HRC
59,88. Prema tome, tvrdoća je alatnog čelika HRC = 60.
4.3.1 Srednja vrijednost obilježja Medijan (centralna vrijednost), Me – položajna srednja vrijednost vrijednost obilježja
s istim brojevima jedinki manjih i većih vrijednosti od medijana.
Mod (dominantna vrijednost), M – položajna srednja vrijednost vrijednost obilježja s
najvećom frekvencijom.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 Ukupno
Redni broj
Broj kvarova Xj 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22
200
Frekvencija fj 1 2 8 13 20 18 27 34 28 12 13 10 7 1 1 2 1 0 0 2
1 n
x   x i  9,97  10
n i1
Me = 10 (34, 89, 77) M = 8
285 341 323 300 313 294 305 317 286 312 267 316 300 298 312 319 296
Rm
284 293 298 322 292 267 305 299 275 318 304 298 301 282 309 297 313
2
N/mm 296 323 305 307 289 307 396 342 310 336 286 320 290 323 288 306
1 n
x   xi  305,3  305
n i1
Me = 304,5 (304 i 305 24, 24)
M = 298 (3 i 305 3)
2
4.3.2 Raspršenost
vrijednosti obilježja
izraz
populacija:
RSP  xMax  xmin
raspon
N
suma kvadrata
uzorak:
SK p    x i   
2
i1
varijanca
standardna devijacija
koeficijent varijabilnosti
1 N
2
    xi   
N i1
2
1 N
2

x




 i
N i1

Vp 
100

1 n
2
s    xi  x 
n i1
2
n
SK u    x i  x 
i1
Vu 
s
100
x
1 n
2
s
 xi  x 

n i1
2
4.4 Inferencijalna
statistika
4.4.1 Testiranje hipoteze
s jednim uzorkom
4.4.2 Testiranje hipoteze
za dva uzorka
4.4.3 Regresijska analiza
4.4.4 Spektrogram
frekvencija