OBRADA REZULTATA MERENJA U (BIO)HEMIJI
Download
Report
Transcript OBRADA REZULTATA MERENJA U (BIO)HEMIJI
Универзитет у Београду – Хемијски факултет
Катедра за Аналитичку хемију
Oбрада резултата мерења
Школска 2013/14. година
ОБРАДА РЕЗУЛТАТА МЕРЕЊА
[У (БИО)ХЕМИЈИ]
Задатак курса:
Да вас оспособи да
Своје експерименталне резултате
изражавате на правилан начин,
Из добијених података извучете што
је могуће више корисних
информација,
Донесете исправне закључке.
Циљ курса је да студента упозна са
основним методама статистичке обраде
резултата мерења у хемији
Исход: студент оспособљен да:
• разуме изворе несигурности мерења
• оцени тачност и прецизност резултата хем. анализе
• своје резултате исправно групише, табеларно и
графички прикаже
• упоређује резултате применом параметријских
тестова
• користи линеарну регресиону анализу
• користи PC за статистичку обраду и приказ резултата
PRIMER 1
Izvršena je analiza deset uzoraka rude nikla sa
različitih lokaliteta jednog budućeg rudnika.
Nađeno je da u uzorcima rude ima 4,0%,
3,7%, 2,7%, 2,6%, 2,6%, 2,6%, 2,5%, 0,9%,
0,9% i 0,3% nikla. Srednja vrednost ovih deset
merenja je 2,3%. (I. Gutman: Obrada rezultata
merenja u hemiji, Kragujevac, 2000.)
RUDNIK? Da, ako u rudi ima više od 2% Ni.
OBAZRIVO!
Možemo
jedino
sa
95%
verovatnoćom tvrditi da sardžaj
nikla u rudi prelazi 1,4%.
Primer 2:
Prilikom analize krvi dve grupe ljudi
(prva je kontrolna, a druga je grupa
obolelih od reumatoidnog artritisa)
nađene su sledeće koncentracije
tiola u krvi (mM):
kontrolna: 1,84;1,92;1,94; 1,92;
1,85;1,91;2,07
reumatoidna: 2,81;4,06;3,62; 3,27;
3,27;3,76.
Da li je jedan od simptoma artritisa
povećan sadržaj tiola u krvi?
Primer 3:
U dve laboratorije određivan je sadržaj nitrata u pijaćoj vodi i
dobijeni su sledeći rezultati:
Koncentracija nitrata
(mg/dm3)
Lab. 1
Lab. 2
51,0
52,8
51,3
53,0
51,6
53,5
50,9
52,6
50,5
52,8
52,0
53,8
Maksimalna dozvoljena količina nitrata u pijaćoj vodi po
propisima EU je 50 mg/dm3. Da li se može tvrditi da sadržaj
nitrata u ovoj vodi premašuje MDK vrednost?
Stanica Montparnas, Pariz, 22.10.1895.
Greške u hemijskoj analizi mogu da imaju
ozbiljne posledice:
kontrola kvaliteta industrijskih
proizvoda
postavljanje dijagnoze bolesti i
određivanje terapije
određivanje opasnog otpada i zagađenja
razrešavanje krivičnih dela
E: Statistics
F: Statistique
N: Statistik
status, -us, m. (lat.) = stanje
Обрада бројчаних података ради јаснијег
приказивања
Настала из практичних потреба и проблема
свакодневног живота (примитивни пописи)
Касније развијена као грана примењене
математике
Данас: део опште научне методологије
XVII век:
немачка “Универзитетска статистика”
(систематизација података о становништву
и привреди у циљу вођења државне политике)
енглеска “Политичка аритметика”
(научно сазнање о друштву; откривање
законитости у понашању посматраних појава)
крај XVIII – почетак XIX века:
интензивнији развој
Зашто нам је потребна статистика?
Праћење стручне и научне литературе
Обрада експерименталних резултата
ДЕСКРИПТИВНА СТАТИСТИКА
Закључивање од посебног ка општем
ИНФЕРЕНЦИЈАЛНА СТАТИСТИКА
Планирање истраживања (експеримента)
Table 1. Parameters of descriptive statistics
Honey type
Variable
Statistics
Acacia (n = 167)
Linden (n = 11)
Sunflower (n = 23)
16.12
17.35
17.98
16.48 ± 1.3
17.41 ± 2.5
18.07 ± 1.5
Range
13.90 - 20.57
13.41 - 22.48
15.50 - 20.63
Median
0.14
0.67
0.32
0.16 ± 0.067
0.64 ± 0.1
0.31 ± 0.1
Range
0.10 - 0.69
0.30 - 0.76
0.19 - 0.55
Median
4.08
4.63
3.39
Mean ± SD
4.07 ± 0.26
4.56 ± 0.4
3.49 ± 0.3
Range
3.49 - 5.85
3.98 - 5.40
3.17 - 4.14
Median
11.20
13.00
25.65
Mean ± SD
11.64 ± 2.5
14.93 ± 5.7
27.16 ± 7.1
Range
7.80 - 29.60
8.20 - 26.20
11.00 - 42.70
Median
-14.49
-10.35
-16.90
-14.47 ± 2.4
-10.10 ± 2.8
-16.50 ± 3.0
(-27.21)–(-8.77)
(-14.85)–(-5.02)
(-22.77)–(-10.67)
Median
Moisture
Mean ± SD
Electrical conductivity
Mean ± SD
[mScm-1]
pH
Free acidity
[meq/kg ]
Optical rotation
[α 20]
Mean ± SD
Range
Our studies
Collected 380 honey samples of different botanical and geographical origin
40.00
2.50
Acacia
2.00
30.00
20.00
10.00
Sunflower
1.00
Polyfloral
Electrical conductivity
Maltose
Isomaltotriose
gent+tur
Melesitose
Isomaltose
Saccharose
0.00
Trechalose
Specific optical rotation
pH
Moisture
Fructose
Glucose
Free acidity
-20.00
1.50
0.50
0.00
-10.00
Linden
Our studies
PCA Principal component analysis – sugar profile
0.6
5
Melezitose
4
0.4
Maltose
Loadings on PC 2 (19.30%)
Scores on PC 2 (19.30%)
3
2
1
0
-1
Scores on PC 2 (19.30%)
Robinia pseudoacacia
Tilia cordata
Polyfloral
Helianthus annuus
95% Confidence Level
-2
-3
-4
-5
-5
0
5
0.2
Sacarose
0
Trehalose
-0.2
Fructose
-0.4
Glucose
-0.6
10
-0.8
-0.6
Scores on PC 1 (32.84%)
Honey type
Isomaltotriose
Isomaltose
Gentiobiose+turanose
-0.4
-0.2
0
0.2
0.4
0.6
Loadings on PC 1 (32.84%)
Melezitose
Glucose
Fructose Gentiobiose+Turanose
Acacia (Robinia pseudoacacia)
1.33
17.93↓
28.89
1.05
0.58
Linden (Tilia cordata)
1.50
24.66
35.52→
2.01→
1.45→
Sunflower (Heliantus annuus)
0.45↓
21.73
26.81
←0.37
←0.20
Polyfoloral
1.13
19.50
28.96
1.00
0.62
0.8
Isomaltose
1
“Jedino statistički obrađeni podaci mogu imati naučnu
vrednost.”
TAČNO, ALI
Statistička obrada NE GARANTUJE naučnu
vrednost podataka
“Statistika može biti samo pomoć, ali nikada zamena
za zdrav razum”
(Blalock)
“POČEVŠI OD PRAKTIČNOG HEMIČARA,
KOJI SAMO VRŠI HEMISKE ANALIZE, PA DO
ČISTIH TEORETIČARA KOJI U HEMIJU
UVODE NOVE HIPOTEZE I OTKRIVAJU
NOVA POLJA ZA ISTRAŽIVANJA, SVAKI
HEMIČAR IMA DA RAČUNA, DA VRŠI
IZRAČUNAVANJA BILO POMOĆU PROSTIH
ARITMETIČKIH
RADNJA,
BILO
SA
KOMPLIKOVANIJIM
RAČUNSKIM
INSTRUMENTOM KOJI DAJU RAZNE
PARTIJE TEORISKE MATEMATIKE”.
(Mihajlo Petrović, Spomenica Lozanića, Beograd,
1922.)
~ 1960:
компјутеризација инструменталних метода
тзв. “експлозија података” у хемији
хемометрија
(примена математичких метода на
хемијске податке)
1972: уведен назив (Wold и Kowalski)
1974: интернационално хемометријско друштво
1975: опис научне дисциплине
Серија конференција;
Журнали ...
Journal of Chemical Information and Computer Sciences,
Analytical Chemistry,
Chemometrics and Intelligent Laboratory Systems,
Journal of Chemometrics, …
Hemometrija je hemijska disciplina
koja koristi matematiku, statistiku i
formalnu logiku radi:
a) planiranja (dizajniranja) ili odabira
optimalnih eksperimentalnih
postupaka;
b) obezbeđivanja maksimuma
relevantih hemijskih informacija
analizom hemijskih podataka, i
c) dobijanja znanja o hemijskim
sistemima (D. L. Massart).
2013 – Међународна година статистике
ЛИТЕРАТУРА
Ivan Gutman, Obrada rezultata hemijskih merenja,
PMF, Kragujevac, 2000.
J. C. Miller and J. N. Miller, Statistics and Chemometrics
for nalytical Chemistry, Pearson Education, Harlow,
2000, 2005, 2010
ONO ŠTO VAS NAJVIŠE ZANIMA
Nastavnik: Dušanka Milojković-Opsenica
lab. 547 / II C
Konsultacije: ?
Asistenti: dr Jelena Trifković,
dr Filip Andrić, lab. 552,
Finalni ispit – pismeni (praktični)
Ocena: Predavanja 10 + vežbe 20 +
kolokvijum 10 + ispit 60
ZNAČAJNE CIFRE
merenje = poređenje veličine koja se meri sa
nekom standardnom, referentnom veličinom
l = 1,237 cm
Ovakav zapis u sebi sadrži nekoliko
informacija:
1. merni uređaj je podeljen na stote delove
centimetra
2. dužina objekta se prostire iza 1,23 cm za
7/10 delova razdaljine između 1,23 i 1,24 cm
3. apsolutna nesigurnost ovog merenja iznosi
0,001 cm
Apsolutna i relativna nesigurnost
Rezultate merenja (analize) treba izražavati
samo značajnim ciframa
Značajnim ciframa se nazivaju sve cifre od
prve sleva, različite od nule, do poslednje
zapisane cifre sdesna, pri čemu se nule koje
n
slede iz množioca 10 ne uzimaju u obzir.
Brojevi: 0,00104; 0,104; 1,04; 104 i 1,04×10
su brojevi sa po tri značajne cifre.
4
ZAOKRUGLJIVANJE BROJEVA
1. ako je cifra koju treba odbaciti manja od
5, prethodna cifra se ne menja;
2. ako je cifra koju treba odbaciti veća od 5,
prethodnu cifru treba uvećati za jedan;
3. ako je cifra koju treba odbaciti jednaka 5
i bar jedna od cifara koje iza nje slede
različita od nule kao u slučaju 2;
4. ako je cifra koju treba odbaciti jednaka 5,
a sve cifre koje slede (ako ih ima) jednake
nuli, onda se razlikuju dva slučaja: ako je
prethodna cifra parna kao u slučaju 1,
a ako je neparna kao u slučaju 2.
Primer. Zaokrugliti na tri decimale sledeće brojeve:
2,97628; 0,0175; 1,436501; 6,7185; 4,9996.
nikada se zaokrugljivanje ne vrši
sekvencijalno
Primer:
Broj 4,1748 zaokrugljen na tri cifre postaje 4,17.
Ne treba na osnovu pete cifre (8) zaokrugliti
četvrtu sa 4 na 5, pa zatim istim postupkom doći
do broja 4,18.
Sabiranje i oduzimanje
Apsolutna nesigurnost rezultata ne sme da bude manja
od najnesigurnije vrednosti koja podleže sabiranju,
odnosno oduzimanju.
Primer. 12,2 + 0,365 + 1,04 = 13,605 13,6
Primer.
4,16×10-3 + 1,724×10-1 + 3,86×10-4
treba prevesti u:
0,0416×10-1 + 1,724×10-1 + 0,00386×10-1 = 1,76946×10-1
1,769×10-1
Množenje i deljenje:
Relativna nesigurnost rezultata treba da bude
jednaka
onoj
koju
ima
komponenta
sa
najvećom relativnom nesigurnošću
proizvod i količnik treba da sadrže onoliko
značajnih cifara koliko i član sa najmanjim
brojem značajnih cifara
128,6 · 0,069 = 8,8734
0,1
(100) 0,0008(0,08%)
128,6
0,001
(100) 0,014(1,4%)
0,069
Apsolutna nesigurnost proizvoda
je 8,8734·0,014 = 0,124, pa rezultat
treba zaokrugliti do 8,9.
128,6 : 0,069 = 1863,768116
1863,768116 · 0,014 = 26
nesigurnost na mestu desetica
rezultat treba zapisati u obliku 1,86×103.
Drugo pravilo:
128,6 : 0,069 = 1863,768116 1,9×103
(broj sa dve značajne cifre)
Dobijeni rezultat, ne računajući predznak i mesto zareza,
manji od “ograničavajućeg broja”
u dobijenom rezultatu treba zadržati još jednu cifru
128,6 : 0,069 = 1863,768116 1,9×103
19 < 69 rezultat je 1,86×103
Treba razlikovati
eksperimentalne vrednosti od
tzv. “čistih brojeva”:
62,31 62,47
62,39
2
Logaritmovanje
Rezultat treba da sadrži onoliko cifara
desno od decimalnog zareza
koliko ima značajnih cifara broj čiji se
logaritam traži.
Npr. log 3,67×10-3 = -2,435;
log 3,67×10-13 = -12,435;
log 3,67×10
-33
= -32,435.
Stepenovanje i korenovanje
Rezultat
treba
da
ima
onoliko
značajnih cifara
koliko ima i osnova ili broj pod
korenom
Npr.: 23,152= 535,9225 ≈ 535,9
7,3520 = 2,7114571 ≈ 2,7115
PREGLED GREŠAKA U HEMIJSKOJ ANALIZI
brza i pouzdana analitička kontrola
nemoguće potpuno eliminisanje grešaka pri hemijskoj analizi
značajno određivanje veličine i orijentacije grešaka
pouzdanost rezultata
hemičar
(analitičar):
- pouzdano izvršavanje odgovarajuće analize
- odabir odgovarajućeg postupka
- ocena dobijenih rezultata
Iskustvo ili statistika?
GREŠKE KOJE PRATE HEMIJSKU
ANALIZU
Greška = razlika između prave i izmerene
(izračunate) vrednosti
Na osnovu uticaja na rezultat analize:
Slučajne (neodređene): uvek se javljaju; obično
male; ne iskrivljuju konačni rezultat u odnosu na
tačnu vrednost;
uzroci nepoznati; matematički model raspodele
Sistematske (određene): uvek iskrivljuju rezultat;
uslovljene analitičkim postupkom (smanjena preciznost
aparata, pogrešno rukovanje, nečistoća reagenasa);
Matematika nemoćna!
Grube: obično GREŠKE ANALITIČARA
(izbor metode, čuvanje uzoraka, izračunavanje);
jako iskrivljuju krajnji rezultat;
Primena statistike
PRECIZNOST I TAČNOST REZULTATA
HEMIJSKE ANALIZE
Precizni =
Tačni =
rezultati paralelnih određivanja se
međusobno dobro slažu
oni koji se slažu sa stvarnim
sadržajem određivane komponente
(ne podležu nekoj sistematskoj grešci)
C ili D?
APSOLUTNE I RELATIVNE GREŠKE
Apsolutnu grešku treba uvek procenjivati u
odnosu na apsolutnu vrednost rezultata sa
kojim stoji u odnosu.
d ( x) x
x d (x)
x
e( x )
d ( x)
Procenti ili promili
Omogućava poređenje tačnosti rezultata
x
1 e( x )
za e 1
Prava vrednost najčešće nije poznata
x
x
y x1 x2
y a x
x x x
d ( y)
e( y)
y
d ( y) d ( x1 ) d ( x2 )
d ( y ) a d ( x)
x1
y x1 x2 ili y
x2
e( y) e( x)
d ( y) e( y) y
d ( y) f ( x) d ( x)
e( y) e( x1 ) e( x2 )
RELATIVNA GREŠKA KRAJNJEG
REZULTATA HEMIJSKE ANALIZE
merenje određene mase uzorka (x1)
analitički postupak parametar (x2)
p = k (x2/x1)
k nije prava konstanta
p = x3 k’(x2/x1)
1
p x1 x 2 x 3 x j
j
Maksimalna
vrednost
Greške procedure > greške merenja
e( x )
d ( x)
x
e(x) ako: d(x) i x
Npr. ako se 0,50 g izmeri sa preciznošću od 0,2 mg,
relativna greška je e = (0,2/500)x100 = 0,04%.
Za merenje 25 mg sa istom e,
mora d da bude: 0,04 = (d/25)x100 d = 0,01 mg.
preciznije vage od analitičkih
Problem smanjivanja relativne greške krajnjeg razultata
treba rešavati preciznijim merenjem parametara x1 i x2,
a ne povećanjem njihove vrednosti.
Reliabilnost (pouzdanost) i
reproduktibilnost (ponovljivost) rezultata
hemijske analize
Reproduktibilnost = stabilnost preciznosti
nema univerzalnog recepta za eliminisanje
svih grešaka za sve analitičke metode
SREĐIVANJE PODATAKA
Grupisanje podataka
Prikazivanje podataka:
Tabeliranje
Grafičko prikazivanje
GRUPISANJE PODATAKA
Cilj: učiniti podatke preglednijim
Veoma važno: obezbeđuje vrednost
drugih statističkih postupaka
Osnovna pravila:
Sveobuhvatnost
Sistematičnost
Određenost
Postupak: podaci se grupišu u razrede
(intervale, grupe, grupne intervale)
međusobno jednake po veličini
Određivanje R = Xmax – Xmin
utvrđivanje širine grupnog intervala, w
Širina razreda zavisi od n:
R
w
Za n = 30 – 400:
n
R
Za n > 400: w
20
Važno:
Malo w veliki broj grupnih intervala
detaljnije informacije ALI slabija preglednost
w broj intervala
preglednost detaljnost informacija
CILJ: PREGLEDNA I DOBRA INFORMACIJA
Prvi interval mora da sadrži Xmin;
može da počne nulom
Poslednji interval mora da sadrži Xmax
Donja granica intervala:
treba da bude deljiva sa w
za jedinicu mere je veća od gornje
granice prethodnog intervala
jednake je preciznosti kao gornja
granica i eksperimentalni rezultati
FREKVENCIJA (UČESTALOST), f =
broj jedinica posmatranja koje pripadaju
jednom razredu
apsolutna i relativna f
pojedinačna (parcijalna) i kumulativna
DISTRIBUCIJA FREKVENCIJA (Raspodela
učestalosti) = prikaz raspoređivanja jedinica
statističkog skupa po grupama (razredima)
Primer:
Raspodela frekvencija oboljevanja 17 pacijenata
u periodu od 6 meseci:
Meseci
0,0 – 1,0
1,1 – 2,0
2,1 – 3,0
3,1 – 4,0
4,1 – 5,0
5,1 – 6,0
Ukupno
Apsolutna frekvencija
Relativna frekvencija (%)
Pojedinačna Kumulativna Pojedinačna Kumulativna
4
4
23,5
23,5
6
10
35,3
58,8
3
13
17,6
76,4
2
15
11,8
88,2
1
16
5,9
94,1
1
17
5,9
100,0
17
/
100,0
/
Statističke serije =
sređeni podaci
statističkog skupa
- atributivne
- numeričke (jedinice posmatranja uređene
u odnosu na numeričko obeležje)
PRIKAZIVANJE PODATAKA
brz i lak uvid u prikupljene i grupisane
podatke radi dalje stat. obrade
TABELIRANJE = pregledno prikazivanje
prethodno grupisanih podataka tabelom
Tabela mora da sadrži:
redni broj
naslov
šemu (maksimalno prilagođenu
sadržaju)
izvore podataka
TABELA MORA DA BUDE:
pregledna – ograničen broj redova i
kolona
jasna i razumljiva – oznake u
predkoloni i zaglavlju precizne i detaljne
potpuna – svaka rubrika popunjenja
brojem ili odgovarajućim znakom
tehnički pravilna – po obliku, veličini i
odnosu rubrika prilagođena sadržaju
(veličina brojeva, znakova i opisa)
GRAFIČKO PRIKAZIVANJE PODATAKA
"Crtež vredi koliko i hiljadu reči"
(kineska poslovica)
- Poređenje veličina jasnije
- Upadljivije razlike i odnosi među veličinama
Obično slika ilustruje (ne zamenjuje) tabelu!
Grafički prikaz pomoću:
• oznaka i simbola
kartogrami
simbolički crteži
• geometrijskih oblika
dijagrami
DIJAGRAMI
tačkasti (korelacioni)
linijski (poligon f, kriva f, štapićasti)
površinski (stubičasti, histogram f, kružni)
prostorni (stereogram)
Histogram – serija pravougaonika;
- površinski dijagram (dve dimenzije)
- apscisa: grupni intervali, ordinata: frekvencija
Poligon – linijski dijagram
- apscisa: grupni intervali, ordinata: frekvencija
- Spaja tačke sredina grupnih intervala i frekvencija
u izlomljenu, poligonalnu liniju
Хистограм расподеле апсолутних фреквенција
8
број студената
7
6
5
4
3
2
1
0
6,90-7,49
7,50-8,09
8,10-8,69
8,70-9,29
9,30-9,89
9,90-10,49
6.
36.
89
6.
97.
49
7.
58.
09
8.
18.
69
8.
79.
29
9.
39.
89
9.
910
.4
10
9
.5
-1
1.
09
број студената
Полигон рсподеле апсолутнох
фреквенција из примера 1.
8
7
6
5
4
3
2
1
0
просек
Štapićasti dijagram
- Linijski dijagram
- Visina štapića odgovara f
Kružni dijagram – grafički prikaz strukture pojave
(odnos delova prema celini)
- površinski dijagram:
P kruga = pojava u celini,
P isečaka = delovi celine
-Ugaoni sistem, veličina isečka određena vel. ugla
(100% = 360º, tj. 1% = 3,6º)
Kružni i štapićasti dijagram
More
7
10.1
12
6.8
30.43%
10
3.3
8.70%
2
4
0.00%
0
4
2.3
58.70%
13
4.5
1.2
84.78%
100.00%
100.00%
0
Kružni dijagram
0
6
Frequency
8
10
Cumulative %
12
14
16
Distribucija frekvencija
Interval
Frekvencija
f
Masa (g)