diskriminační analýza - HomeL - Vysoká škola báňská

Download Report

Transcript diskriminační analýza - HomeL - Vysoká škola báňská

Vysoká škola báňská – Technická univerzita Ostrava
DISKRIMINAČNÍ
ANALÝZA
Marcela Rabasová
Katedra matematiky a deskriptivní geometrie
Obsah:
1. Diskriminační analýza (DA)
1.1. Deskriptivní diskriminační analýza (DDA)
- Kanonická (Fisherova) diskriminační analýza (FDA)
1.2. Predikční diskriminační analýza (PDA)
- Logistická regrese (LR)
- Normální diskriminační analýza (NDA)
- Směs normálních rozdělení (MMND)
2. Aplikace diskriminační analýzy
2.1. Popis analyzované problematiky
2.2. Predikce konverze a nalezení jejích
rizikových faktorů
2.3. Porovnání dlouhodobého přežívání
otevřené a laparoskopické techniky
M.Rabasová, VŠB-TU Ostrava
1. Diskriminační analýza
- vícerozměrná statistická metoda, používaná v případě, kdy
je zpracovávaný soubor členěn do dvou nebo více skupin,
přičemž vlastnosti každé jednotky souboru jsou popsány
hodnotami několika nezávislých veličin
Nechť vícerozměrná jednofaktorová analýza rozptylu vede
k zamítnutí hypotézy o shodě vektorů středních hodnot v H
skupinách (tzn. p sledovaných veličin X1, …, Xp závisí na
daném faktoru). Nakolik je potom příslušnost jednotky ke
skupině ovlivněna právě těmito veličinami?
Tento směr závislosti zkoumá diskriminační analýza.
Primární úloha DA (R. A. Fisher, 30. léta 19. století) - zkoumat
schopnost sledovaných proměnných odlišit od sebe jednotlivé
skupiny. Často pak DA směřuje k vytvoření pravidla pro
klasifikaci jednotlivých jednotek.
M.Rabasová, VŠB-TU Ostrava
1. Diskriminační analýza
Aplikace DA (např. v biologii, medicíně, archeologii,
technických oblastech)
1.Při kontrole jakosti či spolehlivosti lze u výrobků změřit
několik kvantitativních proměnných (rozměry, hmotnost,
hustotu, …), poté je podrobit určité zátěži a sledovat, zda
obstojí nebo ne. K předpovědi chování dalších výrobků při
zátěži je již nemusíme této zátěži vystavovat (často přitom
totiž dochází k jejich znehodnocení), a výsledek zkoušky
odhadnout na základě toho, jak dopadly jiné výrobky
s podobnými parametry, což nám umožní klasifikační pravidlo
odvozené z dat naměřených u testovací skupiny objektů.
M.Rabasová, VŠB-TU Ostrava
1. Diskriminační analýza
2. Uchazeči o určitou profesi jsou podrobeni testům, jejichž
bodová ohodnocení představují příslušné kvantitativní
proměnné. Následně je zjišťována jejich úspěšnost ve
zvoleném oboru. Za předpokladu souvislosti výsledků testu
a úspěšnosti osob ve výběrovém souboru lze u dalších
adeptů z výsledků testu usuzovat o jejich budoucím
úspěchu.
3. Ve výběrovém souboru pacientů jsou pro několik
diagnostikovaných chorob zjišťovány výsledky různých
laboratorních testů. U nových pacientů se pak může lékař
na základě výsledků těchto testů přiklonit k určité diagnóze
či způsobu léčby.
M.Rabasová, VŠB-TU Ostrava
1. Diskriminační analýza
Dvě základní funkce DA:
1.
určení vlivu sledovaných veličin na odlišení jednotek
jednotlivých skupin (deskriptivní diskriminační analýza)
2.
sestavení klasifikačního pravidla pro zařazení jednotek s
neznámou skupinovou příslušností (predikční
diskriminační analýza)
M.Rabasová, VŠB-TU Ostrava
1.1. Deskriptivní diskriminační analýza (DDA)
Kanonická (Fisherova) diskriminační analýza (FDA)
R. A. Fisher (1890-1962)
 statistik
 biolog
 genetik
M.Rabasová, VŠB-TU Ostrava
1.1. Deskriptivní diskriminační analýza
Princip FDA: Uvažujme náhodný výběr s rozsahem n, který
je členěn do H skupin s rozsahy nh, h = 1 ... H. Nechť každý
objekt souboru je charakterizován p-rozměrným náhodným
vektorem X = (X1, …, Xp)T , jehož realizací je vektor
pozorování x = (x1, ..., xp)T. Označme:
xi
… vektor p hodnot náhodných veličin X1, …,
Xp zjištěných u i-té jednotky
xih
… vektor p hodnot náhodných veličin X1, …,
Xp zjištěných u i-té jednotky v h-té skupině,
n
1
… vektor výběrových průměrů,
x   xi
n i1
1
xh 
nh
nh
x
i 1
ih
… vektor výběrových průměrů v h-té skupině
M.Rabasová, VŠB-TU Ostrava
1.1. Deskriptivní diskriminační analýza
H
nh
T   (x ih  x)(x ih  x) T
h 1 i 1
H
nh
H
nh
… celková variabilita
původních proměnných
E   (x ih  x h )(x ih  x h ) T … vnitroskupinová variabilita
h 1 i 1
původních proměnných
B   (xh  x)(xh  x)T
… meziskupinová variabilita
původních proměnných
h 1 i 1
Pro libovolnou lineární kombinaci Y = bTx původních
proměnných X1, …, Xp, kde bT = (b1, …, bp) je vektor
parametrů, určíme míru její meziskupinové resp. vnitroskupinové variability jako QB (Y )  bT Bb resp. QE (Y )  bT Eb.
M.Rabasová, VŠB-TU Ostrava
1.1. Deskriptivní diskriminační analýza
Cíl FDA: Najít takovou lineární kombinaci Y = bTx
původních p proměnných, která by nejlépe ze všech
separovala uvažované skupiny v tom smyslu, že její
vnitroskupinová variabilita bude co nejmenší a
meziskupinová variabilita co největší, tzn. aby bylo
maximalizováno tzv. Fisherovo diskriminačníh kritérium:
QB (Y ) bT Bb  ozn . 
F
 T
 

Řešení:
QE (Y ) b Eb 

- derivací F podle b získáme soustavu: (BE1  I)b  0
1
- má netriviální řešení, pokud: det(BE  I)  0
- řešením jsou char. čísla 1  2  ...  r matice BE-1
- charakteristický vektor b1 odpovídající 1 maximalizuje F
- b1 se volí tak, aby: b1T Eb 1 /(n  H )  1,
1 pak vyjadřuje míru meziskupinové variability veličiny Y1
M.Rabasová, VŠB-TU Ostrava
1.1. Deskriptivní diskriminační analýza
První diskriminant (první kanonická proměnná): Y1  b x
- v případě členění souboru do dvou skupin stačí pro
vyjádření celkové variability původních p proměnných
- geometrický význam - projekce bodů p-rozměrného
prostoru na přímku, zachovávající rozdíly mezi skupinami
T
1
Diskriminační skóre i-té jednotky xi: y1i  c1  b xi
T
(c1  b1 x, x ... vektor výběrových průměrů)
T
1
Vektor skupinových centroidů y1 : y1h  c1  b xh , h  1,2
- ty lze použít pro klasifikaci jednotek do H skupin tak, že se
jednotka s neznámou příslušností zařadí do té skupiny, ke
které má nejblíž ve smyslu vzdálenosti od skupinového
centroidu
T
1
M.Rabasová, VŠB-TU Ostrava
1.1. Deskriptivní diskriminační analýza
Klasifikace objektů do tří skupin pomocí dvou kanonických
proměnných:
kk
M.Rabasová, VŠB-TU Ostrava
1.1. Deskriptivní diskriminační analýza
Určení vlivu k-té původní proměnné Xk na separaci skupin:
- normované koeficienty charakteristického vektoru b1 :

1
b 
1
Fb 1
nH
(F … diag. matice s odmocninami diag. prvků matice E)
- korelační koeficienty mezi kanonickou proměnnou a
původními proměnnými:
1
a1 
F 1Eb 1
nH
- větší absolutní hodnota daného koeficientu znamená
větší význam příslušné proměnné pro diskriminaci
- znaménko korelačního koeficientu udává, zda s
rostoucími hodnotami původní proměnné kanonická
proměnná roste nebo klesá
M.Rabasová, VŠB-TU Ostrava
1.2. Predikční diskriminační analýza (PDA)
Hlavní cíl:
- zařazení objektů neznámého původu do předem
vymezených skupin
Testovací skupina → Rozhodovací pravidlo
Metody:
 logistická regrese
 normální diskriminační analýza
 směs normálních rozdělení
M.Rabasová, VŠB-TU Ostrava
1.2. Predikční diskriminační analýza
Mějme:
n testovacích objektů rozdělených do dvou skupin – 0 a 1
Označme:
Y … náhodnou veličinu vyjadřující příslušnost
nezařazeného objektu k dané skupině, H(Y) = {0,1}
Yi … náhodnou veličinu vyjadřující příslušnost i-tého
objektu výběru k dané skupině, i = 1 … n, H(Yi) = {0,1}
X … p-rozměrný náhodný vektor naměřených znaků u
nezařazeného objektu
Xi … p-rozměrný náhodný vektor naměřených znaků u
i-tého objektu výběru, i = 1 … n
M.Rabasová, VŠB-TU Ostrava
1.2. PDA – I. Model logistické regrese
I. MODEL LOGISTICKÉ REGRESE
Předpokládejme, že: P(Yi  1 Xi  xi ) 
P(Yi  0 Xi  x i ) 
e
e
 0  βT x i
 0  βT x i
1
,
1
e
 0  βT x i
1 ,
(β0, βT)T …neznámý, (p+1)-dimenzionální vektor parametrů
…odhadneme na základě známých hodnot Xi a Yi
u n testovacích objektů.
0 βT x
e
Odhad funkce π(x):  (x)  P(Y  1 X  x) 
0 βT x
e
1
Rozhodovací pravidlo:  (x)  0,5 → objekt zařazen do sk.1
M.Rabasová, VŠB-TU Ostrava
ˆ0 , βˆ
1.2. PDA – I. Model logistické regrese
Odhady parametrů logistického modelu:
místo neznámých parametrů β0, β v praxi musíme použít
jejich odhady ˆ0 , βˆ , které získáme metodou maximální
věrohodnosti. Ta vede na soustavu rovnic, která se řeší
iteračně.
Ověřování předpokladů modelu:
model logistické regrese neklade žádné podmínky na
rozdělení náhodných vektorů X1, …, Xn, ale předpokládá
velmi specifický tvar pravděpodobnosti P(Y = 1 | X = x),
což vyžaduje ověření vhodným statistickým testem, např.
Hosmerovým-Lemeshowovým.
M.Rabasová, VŠB-TU Ostrava
1.2. PDA – II. Model normální diskriminační analýzy
II. MODEL NORMÁLNÍ DISKRIMINAČNÍ ANALÝZY
Předpokládejme, že: P(Yi  1)    (0,1) ,
P(Yi  0)  1   ,
a nezávislé p-rozměrné náhodné vektory Xi, i = 1 … n, mají
v h-té skupině normální rozdělení N p (μh , Σ), h = 0, 1
 , μ1 , μ 2 a Σ … neznámé parametry
Rozhodovací pravidlo – lineární diskriminační funkce:
1 T 1
1 T 1
T 1
x Σ μ1  μ1 Σ μ1  ln   x Σ μ 0  μ 0 Σ μ 0  ln(1   )
2
2
T
1
→ objekt zařazen do sk.1
M.Rabasová, VŠB-TU Ostrava
1.2. PDA – II. Model normální diskriminační analýzy
Odhady parametrů modelu lineární diskriminační analýzy:
místo neznámých parametrů  , μ1 , μ 2 a Σ v praxi užíváme
ˆ , které
jejich maximálně věrohodné odhady ˆ, μ
ˆ 0 , μˆ 1 a Σ
získáme jako jejich výběrové protějšky
Porušení předpokladů modelu:
 vícerozměrná normalita → použít logistickou regresi
 homoskedasticita → použít kvadratickou diskriminační
funkci
Rozhodovací pravidlo – kvadratická diskriminační funkce:
1 T 1
1 T 1
T
1
x Σ1 x  x Σ1 μ 1  ln Σ1  ln   x Σ 0 x  xT Σ 01μ 0  ln Σ 0  ln(1   )
2
2
→ objekt zařazen do sk.1
M.Rabasová, VŠB-TU Ostrava
1.2. PDA – III. Model směsi normálních rozdělení
III. MODEL SMĚSI NORMÁLNÍCH ROZDĚLENÍ
- používán v situacích, kdy u skupiny n testovacích objektů
není známá jejich skupinová příslušnost
- nechť náhodné vektory X1, …, Xn, mají rozdělení N p (μ1 , Σ)
1 

s pravděpodobností
a rozdělení
s pravděp.
N p (μ0 , Σ)
- jejich hustotu rozdělení lze tedy vyjádřit vztahem:
g( x)  g1 (x)  (1   ) g0 (x)
(gi … hustota rozdělení N p (μi , Σ),i  0,1)
1, X i  N p (μ1 , Σ)
- zavedu-li náhodné veličiny Yi, i =1..n : Yi  
0, X i  N p (μ 0 , Σ)
převedu tento model na model normální diskriminační
analýzy a klasifikaci jednotek s neznámou skupinovou
příslušností můžu založit na stejné diskriminační funkci
M.Rabasová, VŠB-TU Ostrava
1.2. PDA – Volba vhodného modelu
Volba vhodného diskriminačního modelu:
 Neznáme-li zařazení učících objektů do skupin,
použijeme model směsi normálních rozdělení.
 Pokud toto zařazení známe a můžeme předpokládat
normalitu rozdělení v obou skupinách, dáme přednost
modelu normální diskriminační analýzy. V případě shody
kovariančních matic pak použijeme lineární
diskriminační funkci, v opačném případě kvadratickou.
 Ve všech ostatních případech použijeme model
logistické regrese.
M.Rabasová, VŠB-TU Ostrava
1.2. PDA – Vyhodnocení účinnosti diskriminace
Vyhodnocení účinnosti diskriminace:
Měřítkem kvality diskriminace je pravděpodobnost úspěšné
klasifikace jednotek neznámého původu. Její odhad získáme:
 metodou resubstituce - aplikuje klasifikační pravidlo na ty
jednotky, na jejichž základě bylo vytvořeno (není nestranný)
 metodou „holdout“ - datový soubor rozdělíme na dvě
části, jednu použijeme pro odvození diskriminačního kritéria
a druhou pro jeho ověření (nestranný odhad)
 křížovou kontrolou správnosti - diskriminační kritérium je
postupně odhadnuto na základě údajů o všech jednotkách
souboru s výjimkou i-té, i = 1, 2, …, n, a následně zjištěno,
zda byla tato jednotka s užitím kritéria zařazena správně, či
nikoli (odhad je téměř nestranný)
M.Rabasová, VŠB-TU Ostrava
2. Aplikace diskriminační analýzy
2.1. Popis analyzované problematiky



Zdrojová data - údaje o 1175 pacientech, kteří byli v letech
2001-2009 operováni ve Fakultní nemocnici Ostrava
v oblasti kolorekta
Kolorektální chirurgie - chirurgie zabývající se chorobami
tlustého střeva a konečníku (u 82% případů jde o
kolorektální karcinom)
Operační techniky - otevřená (klasická)
- laparoskopická
M.Rabasová, VŠB-TU Ostrava
2.1. Popis analyzované problematiky
Laparoskopie
M.Rabasová, VŠB-TU Ostrava
1.Úvod
M.Rabasová, VŠB-TU Ostrava
2.1. Popis analyzované problematiky

Klady:
menší operační stres + příznivější pooperační průběh
(nižší spotřeba analgetik, rychlejší rekonvalescence,
kratší doba hospitalizace = nižší finanční náklady)

Zápory:
možné komplikace při zakládání kapnoperitonea a
zavádění prvního trokaru, rizika kaponperitonea
samotného, vliv extrémního polohování pacientů, delší
operační časy,
riziko konverze (změna již započatého laparoskopického
výkonu na otevřený) - delší operační čas, větší krevní
ztráta, častější pooperační komplikace, delší doba
hospitalizace
M.Rabasová, VŠB-TU Ostrava
2.1. Popis analyzované problematiky
 Cíl:
̵ správná volba operační techniky pro konkrétního
pacienta
 Prostředky:
- objektivní porovnání výsledků obou operačních
technik,
- nalezení rizikových faktorů konverze a
pooperační morbidity a mortality,
- tvorba spolehlivých modelů pro jejich predikci
̵
̵
̵
̵
̵
 Nástroj: diskriminační analýza
M.Rabasová, VŠB-TU Ostrava
2.1. Popis analyzované problematiky




Zdrojová data:
údaje o 1175 pacientech chirurgického oddělení
Fakultní nemocnice Ostrava, kteří zde v letech 20012009 podstoupili operaci kolorekta
záznamy pacientů: zdravotní stav před operací (BMI,
krevní tlak, atd.), typ operační techniky, údaje
popisující průběh operace, pooperační vývoj a
případné komplikace
Použité programy :
MS Excel 2003, Delphi 7, SPSS verze 18 (PASW
Statistics 18.0), NCSS 2004
M.Rabasová, VŠB-TU Ostrava
2.2. Predikce konverze a nalezení jejích
rizikových faktorů
 Cíl: predikce konverze a nalezení jejích rizikových faktorů
 Data: údaje 649 pacientů, kteří byli v letech 2001-2009
operováni laparoskopicky
 Potenciální rizikové faktory konverze:
 pohlaví, body mass index (BMI), ASA klasifikace (ASA),
stadium, počet předchozích operací (PPO) a závažnost
operačního výkonu (ZOV)
 Použité metody:
 logistická regrese, normální diskriminační analýza
M.Rabasová, VŠB-TU Ostrava
2.2. Predikce konverze a nalezení jejích rizikových faktorů
Nalezení rizikových faktorů konverze metodou FDA:
Vícerozměrná analýza rozptylu:
MANOVA Tests Section
Term(DF)
Test Statistic
A(1):operační technika
Wilks' Lambda
Hotelling-Lawley Trace
Pillai's Trace
Roy's Largest Root
pohlaví
BMI
ASA
stadium
PPO
ZOV
M.Rabasová, VŠB-TU Ostrava
Test
Value
0,972022
0,028783
0,027978
0,028783
0,680151
17,349559
3,667450
0,939861
0,388159
15,122816
DF1
DF2
6
6
6
6
1
1
1
1
1
1
642
642
642
642
647
647
647
647
647
647
Prob
F-Ratio Level
3,08
3,08
3,08
3,08
2,93
0,87
6,52
0,52
0,64
5,26
0,005582
0,005582
0,005582
0,005582
0,087270
0,351829
0,010894
0,469587
0,424262
0,022119
(0,05)
Reject
Reject
Reject
Reject
Accept
Accept
Reject
Accept
Accept
Reject
2.2. Predikce konverze a nalezení jejích rizikových faktorů
Korelační koeficienty mezi kanonickou proměnnou a
původními proměnnými:
Function 1
ASA
ZOV
pohlaví
BMI
PPO
stadium
,592
-,531
,397
-,216
-,185
,168
Tabulka : Korelační koeficienty mezi
kanonickou proměnnou a původními proměnnými
Proměnné s největším vlivem na případnou konverzi:
ASA klasifikace,
závažnost operačního výkonu
M.Rabasová, VŠB-TU Ostrava
2.2. Predikce konverze a nalezení jejích rizikových faktorů
Vytvoření modelu pro predikci konverze:
I. MODEL LOGISTICKÉ REGRESE
Riziko konverze R:
ln
R
 2,990  0,789 x1  0,046 x2  0,595 x3  0,013 x4  0,296 x5  0,160 x6
1 R
x1 - hodnota proměnné pohlaví,
x2 - hodnota proměnné BMI,
x3 - hodnota proměnné ASA klasifikace,
x4 - hodnota proměnné stadium,
x5 - hodnota proměnné PPO,
x6 - hodnota proměnné ZOV
M.Rabasová, VŠB-TU Ostrava
2.2. Predikce konverze a nalezení jejích rizikových faktorů
I. MODEL LOGISTICKÉ REGRESE
Klasifikační tabulka:
Observed
Predicted
skupina
Percentage
Correct
0
1
Step 1
skupina
0
595 0
100,0
1
54
0
,0
Overall Percentage
91,7
Tabulka: Klasifikační tabulka pro model logistické regrese
Hosmer-Lemeshowův test:
Step
Chi-square df Sig.
1
10,315
8
,244
Tabulka : Hosmer-Lemeshowův test
M.Rabasová, VŠB-TU Ostrava
2.2. Predikce konverze a nalezení jejích rizikových faktorů
II. MODEL NORMÁLNÍ DISKRIMINAČNÍ ANALÝZY
Koeficienty lineárních diskriminačních funkcí:
skupina
0
1
pohlaví
2,274
1,576
BMI
1,234
1,273
ASA
2,811
2,269
stadium
1,395
1,384
PPO
,527
,810
ZOV
1,550
1,726
(Constant)
-25,759
-26,359
Tabulka : Koeficienty lineárních diskriminačních funkcí
Lineární diskriminační funkce pro nultou (první) skupinu:
LDF0 (x)  2,274x1  1,234x2  2,811x3  1,395x4  0,527x5  1,550x6 - 25,759
LDF1 (x)  1,576x1  1,273x2  2,269x3  1,384x4  0,810x5  1,726x6 - 26,359
M.Rabasová, VŠB-TU Ostrava
2.2. Predikce konverze a nalezení jejích rizikových faktorů
Klasifikační tabulka:
surgical_
Technique
Original
Count
%
Cross-validated
Count
%
Predicted Group Membership
0
1
Total
0
369
226
595
1
16
38
54
0
62,0
38,0
100,0
1
29,6
70,4
100,0
0
369
226
595
1
23
31
54
0
62,0
38,0
100,0
1
42,6
57,4
100,0
62,7% of original grouped cases correctly classified.
61,6% of cross-validated grouped cases correctly classified.
Tabulka: Klasifikační tabulka pro model NDA
M.Rabasová, VŠB-TU Ostrava
2.3. Porovnání dlouhodobého přežívání
otevřené a laparoskopické techniky
 Data: údaje 850 pacientů s diagnózou kolorektálního



karcinomu, kteří byli operováni v letech 2001-2009
Závěry předchozí, nerandomizované studie: laparoskopická
technika je významně lepší než otevřená v případě operací
karcinomu v oblasti kolon, v oblasti rekta jsou obě techniky
ekvivalentní
Cíl naší studie: ověřit věrohodnost těchto závěrů tzv.
pseudorandomizací - aplikací tendenčních skóre
Použité metody:
Kaplan-Meierova metoda,
Breslowovův a Mantel-Coxův (log-rank) test,
logistická regrese
M.Rabasová, VŠB-TU Ostrava
2.3. Porovnání dlouhodobého přežívání otevřené a laparoskopické
techniky
Tendenční skóre
̵představena Rosenbaumem a Rubinem v roce 1983
̵užití v nerandomizovaných studiích (léčebný postup není
pacientům určen náhodně), kde se může stát, že ve skupině
pacientů operovaných jednou technikou je větší podíl
rizikových pacientů, než je tomu u techniky jiné, a při
porovnání výsledků těchto metod bychom na tento fakt měli
brát zřetel
̵řeší problém „nesourodosti“ porovnávaných skupin pacientů
̵umožňují provést užší výběr „srovnatelných“ pacientů
̵zajistí alespoň jistý stupeň randomizace
̵eliminují vliv přidružených faktorů na výsledky analýzy
̵počítána logistickou regresí
M.Rabasová, VŠB-TU Ostrava
2.3. Porovnání dlouhodobého přežívání otevřené a laparoskopické
techniky
Vyhodnocení výsledků operací v oblasti kolon
̵500 pacientů (202 mužů, 298 žen; 26-97 let)
̵Sledované údaje: datum operace, datum poslední kontroly,
informace, zda pacient zemřel či nikoliv
Overall Comparisons
Chi-Square df
Sig.
Log Rank (Mantel-Cox)
8,510
1
,004
Breslow (Generalized Wilcoxon)
5,637
1
,018
Test of equality of survival distributions for the different levels of
surgery_technique.
M.Rabasová, VŠB-TU Ostrava
2.3. Porovnání dlouhodobého přežívání otevřené a laparoskopické
techniky
Pseudorandomizace pomocí tendenčních skóre:
̵
hledisko stejnorodosti porovnávaných skupin pacientů:
tendence pacientů k pooperační mortalitě (úmrtí)
̵
rizikové faktory pooperační mortality zjištěné FDA:
věk, BMI, ASA klasifikace, ICHS, DM, a stádium nádoru
̵
̵
model logistické regrese vyjádřil riziko pooperační mortality
R vztahem:
ln
̵
̵
R
 3,789  0,020 x1  0,048 x2  0,105 x3  0,539 x4  0,407 x5  1,014 x6
1 R
tendenční skóre:
logistickou regresí vypočtené riziko pooperační mortality
M.Rabasová, VŠB-TU Ostrava
2.3. Porovnání dlouhodobého přežívání otevřené a laparoskopické
techniky
̵
̵
každému pacientu ze skupiny 1 (laparoskopické operace)
byl přiřazen pacient ze skupiny 0 (otevřené operace) se
stejným skóre (pokud takový pacient existoval)
užší výběr - 366 pacientů (2 skupiny srovnatelné ve smyslu
tendence pacientů k pooperační mortalitě)
Overall Comparisons
Chi-Square df
Sig.
Log Rank (Mantel-Cox)
,124
1
,724
Breslow (Generalized Wilcoxon)
,449
1
,503
Test of equality of survival distributions for the different levels of
surgery_technique.
M.Rabasová, VŠB-TU Ostrava
2.3. Porovnání dlouhodobého přežívání otevřené a laparoskopické
techniky
Vyhodnocení výsledků operací v oblasti rekta
̵
309 pacientů (201 mužů, 108 žen; 33-84 let)
Overall Comparisons
Chi-Square df
Sig.
Log Rank (Mantel-Cox)
,041
1
,839
Breslow (Generalized Wilcoxon)
,458
1
,498
Test of equality of survival distributions for the different levels of
surgery_technique.
M.Rabasová, VŠB-TU Ostrava
2.3. Porovnání dlouhodobého přežívání otevřené a laparoskopické
techniky
̵
̵
Po aplikaci tendenčních skóre (pravděpodobnost
pooperační mortality)
200 pacientů (2 skupiny srovnatelné ve smyslu tendence
pacientů k pooperační mortalitě)
Overall Comparisons
Chi-Square df
Sig.
Log Rank (Mantel-Cox)
,083
1
,774
Breslow (Generalized Wilcoxon)
,323
1
,570
Test of equality of survival distributions for the different levels of
surgery_technique.
M.Rabasová, VŠB-TU Ostrava
2.3. Porovnání dlouhodobého přežívání otevřené a laparoskopické
techniky
Výsledky studie:
 U operací kolorektálního karcinomu se obě operační
techniky – laparoskopická a otevřená, neliší v délce
přežívání ani u operací v oblasti kolon, ani u operací v
oblasti rekta
 Předchozí studie, která vyhodnotila dobu přežívání u
laparoskopických operací v oblasti kolon jako významně
delší než u operací otevřených neřešila problém
randomizace, závěry naší studie lze tedy považovat za
validnější
M.Rabasová, VŠB-TU Ostrava
Literatura

•
•
•
•

•
•
•
Normální diskriminační analýza
Hebák, P., Hustopecký, J., Jarošová, E. a Pecáková, I. Vícerozměrné statistické metody
[1]. Praha: Informatorium, 2004. ISBN 80-7333-025-3.
Huberty, C.J. a Olejnik S. Applied MANOVA and Discriminant Analysis. New York: Wiley
Interscience, 2006. ISBN 0-471-46815-0.
Neil H.T. Applied Multivariate Analysis. New York: Springer-Verlag, 2002. ISBN 0-38795347-7.
Kachigan, S.K. Multivariate Statistical Analysis. New York: RADIUS PRESS, 1991. ISBN
0-942-15491-6.
Logistická regrese
Hebák, P., Hustopecký, J., Pecáková, I. et al. Vícerozměrné statistické metody [3]. Praha:
Informatorium, 2007. ISBN 80-7333-039-3.
Hosmer, D.W. a Lemeshow, S. Applied Logistic Regression. New York: WileyInterscience, 2000. ISBN 0-471-35632-8.
Komárek, A. Porovnání tří modelů. Praha, 2000. Diplomová práce. Univerzita Karlova v
Praze, Matematicko-fyzikální fakulta.
M.Rabasová, VŠB-TU Ostrava

•
•

•
•
•
Směs normálních rozdělení
Everitt, B.S. a Hand, D.J. Finite Mixture Distributions. London: Chapman and Hall, 1981.
ISBN 0-412-22420-8.
Titterington, D.M., Smith, A.F.M. a Makov, U.E. Statistical Analysis of Finite Mixture
Distributions. New York: John Wiley, 1985. ISBN 0-471-90763-4.
Analýza přežívání
Hosmer, D., Lemeshow, S. a May, S. Applied Survival Analysis, Second Edition.
Hoboken: Wiley Series in Probability and Statistics, 2008. ISBN 978-0-471-75499-2.
Cox, D.R. a Oakes, D. Analysis of Survival Data. London: Chapman and Hall, 1984. ISBN
0-412-24490-X.
Kaplan, E.L. a Meier, P. Nonparametric estimation from incomplete observations. Journal
of the American Statistical Association. 1958, 53, 457-481.
M.Rabasová, VŠB-TU Ostrava
Děkuji za pozornost
M.Rabasová, VŠB-TU Ostrava