Transcript lekce1

1 Úvod
Cíle:
1.
2.
3.
4.
5.
Vysvětlíme co je mnohorozměrná analýza a k čemu jsou
dobré její aplikace.
Vymezíme specifické techniky mnohorozměrné analýzy.
Určíme pro jaké úkoly jsou vhodné jednotlivé techniky.
Diskutujeme podstatu měření, typy proměnných a vztah k
mnohorozměrným technikám.
Popisujeme koncepční a statistické aspekty mnohorozměrné
analýzy.
1
Analýza kvantitativních dat
Základní informace:
1.
2.
3.
4.
5.
Povinnosti – úkoly, prezentace, zkouška
Sylabus
Literatura – viz dále
Související kurzy JSM031 a JSM152
Organizace kurzu
2
Literatura
•
•
Geiser, Ch. Data analysis with MPlus. Guilford Press. 2013
Byrne, B. Structural equation modeling with MPlus. 2012
•
Hendl J. Přehled statistických metod zpracování dat. 2.vyd. Praha: Portál,
2009.
• Hebák, P. a kol. Vícerozměrné statistické metody 1-3. Praha : Informatorium,
2004.
• Urbánek T. (2000): Strukturální modelování v psychologii. Psychologický ústav
AV ČR a Nakladatelství Pavel Křepela, Brno.
• Tarling, R. 2009: Statistical modeling for social researchers. Routledge.
• Norusis. 2005. SPSS 13. Statistical procedures companion. Prentice Hall.
• StatSoft, Inc. (2004). Electronic Statistics Textbook. Tulsa, OK: StatSoft.
http://www.statsoft.com/textbook/stathome.html
Další nepřeberné množství knih a článků a WWW stránek (články budou průběžně
doporučovány)
3
Co je mnohorozměrná analýza?
•
Co to je? Mnohorozměrná analýza dat
(Multivariate Data Analysis ) = jsou všechny
statistické metody, které simultánně analyzují
více proměnných měřených na jedincích nebo
objektech sledování.
•
Proč je používat?
 Měření
 Explanace & predikce
 Testování hypotéz
4
Základní koncepty mnohorozměrné analýzy
•
•
•
•
•
Proměnná
Škály měření
 Nemetrické
 Metrické
Mnohorozměrná měření
Chyba měření
Druhy technik
5
Typy dat a škál měření
Data
Nemetrická
nebo
Kvalitativní
Nominální
škála
Ordinální
škála
Metrická
nebo
Kvantitativní
Interval.
škála
Poměr.
škála
6
Škála měření
•
•
Nemetrické škály
o Nominální – označení číslem nemá vztah k žádné velikosti.
o Ordinální – existuje řazení.
Metrické škály
o Intervalové– má vlastnosti ordinální škály a jsou zde stejné
diference mezi jednotlivými body škály.
o Poměrové – má vlastnosti intervalové škála+přirozená nula.
Poznámka: Typ škály je mnohdy kritický při určování správné
statistické techniky
7
Chyba měření
•
•
•
Všechny proměnné jsou zatížen nějakou
chybou. Jaké jsou zdroje chyb?
Chyba měření = zkresluje pozorovaný vztah a
znehodnocuje výsledky analýzy.
Výzkumníci používají součtové škály a
vytvářejí kompositní reprezentace konceptů.
8
Chyba měření
Při posuzování chyb měření si všímáme dvou
charakteristik měření:
• Validita = stupeň, jak dobře měří proměnná to,
co má měřit.
• Reliabilita = stupeň, jak postup měří spolehlivě
(bez náhodné chyby).
9
Statistická významnost a síla testu
•
•
•
Chyba I. druhu. Hodnota  je pravděpodobnost zamítnutí
nulové hypotézy za předpokladu, že ona platí.
Chyba II. druhu. Hodnota  je pravděpodobnost nezamítnutí
nulové hypotézy za předpokladu, že ona neplatí.
Síla testu nebo-li 1- je pravděpodobnost zamítnutí nulové
hypotézy za předpokladu, že ona neplatí.
Nezamítne H0
Zamítne H0
H0 platí
H0 neplatí
1-

Chyba II. druhu

Chyba I. druhu
1-
Síla
10
Síla je určena třemi faktory:
Velikostí účinku (ES): aktuální hodnota efektu
(např. rozdíl mezi průměry nebo velikost korelace
mezi proměnnými).
• Alfa (): nasadíme malou hodnotu, čím menší tak
zmenšujeme sílu. Typicky  = 0.05.
• Velikost výběru: jak rozsah výběru se zvětšuje, tak
se zvětšuje síla. Při velkých výběrech i malou
odchylku hodnotíme jako statisticky významnou.
•
11
Na obrázku je vztah mezi silou (Y) a velikostí
výběru (X)
12
Síla testu, statistická významnost, nesprávné
užívání
•
•
Literatura : částečně viz Hendl
Článek: Soukup 2010
(http://archiv.soc.cas.cz/articles/cz/73/Data-avyzkum.html#artID413) a pomůcky na
http://samba.fsv.cuni.cz/~soukup/stat_vyznamno
st_clanek/
13
Typy mnohorozměrných technik
•
Techniky analýzy závislostí: proměnná nebo více
proměnných se považují za závisle proměnné.
Vysvětlují se pomocí množiny nezávislých
proměnných.
o
o
o
o
o
o
Mnohonásobná regrese
Mnohonásobná diskriminační analýza
Logitová/logistická regrese
Mnohonásobná analýza rozptylu a kovariance
Kanonická korelační analýza
Strukturální modelování (SEM)
14
Typy mnohorozměrných technik
•
Techniky pro hledání podobností (interrelací) bez
rozlišení na závislé a nezávislé proměnné, více
proměnných.
o
o
o
o
Metoda hlavních komponent a faktorová analýza
Shluková analýza
Mnohorozměrné škálování
Korespondenční analýza
15
Výběr technik mnohorozměrné
analýzy
1. Jaký typ vztahu se zkoumá– závislosti nebo
interrelace?
2. Vztah závislosti: Kolik proměnných se predikuje?
 Jaká je škála proměnných závisle proměnných?
 Jaká je škála nezávisle proměnných?
3. Interdependence: Zkoumáme vztahy (podobnosti)
mezi proměnnými, respondenty nebo objekty?
16
Mnohonásobná regrese
Jednoduchá metrická
závisle proměnná
predikovaná několika
nezávisle proměnnými
(metrickými).
Bude v kurzu JSM 034
17
Diskriminační analýza
Nemetrická (nominální) závisle
proměnná je predikována několika
metrickými nezávisle proměnnými.
18
Logistická regrese
Jednoduchá závisle nemetrická proměnná je
predikovaná několika metrickými nezávisle
proměnnými . Tato technika je podobná
diskriminační analýze, ale výpočty jsou trochu
jiné, podobné regresi.
Bude v kurzu JSM 034
19
MANOVA
Několik metrických proměnných je
predikováno několika kategoriálními
nezávisle proměnnými (nemetrickými).
20
Kanonická korelační analýza
Několik metrických závisle proměnných je
predikováno několika metrickými
nezávisle proměnnými.
21
Strukturální modelování (SEM)
Hodnotí se několik provázaných závislostí,
vychází se ze dvou modelů:
1. Strukturální model
2. Model měření
Bude v kurzu JSM 034
22
Faktorová analýza
. . . . Analyzují se struktury vztahů
mezi velkou množinou proměnných, aby
bylo možno určit společné faktory. De facto
hledáme podobné proměnné. (viz JSB 029 a
JSM031)
23
Shluková analýza
. . . . Skupina objektů (respondenti,
produkty, firmy atd.) se analyzuje pomocí měr
vzdáleností a určují se kategorie objektů
(shluky). De facto hledáme podobné případy.
(viz JSM 031)
24
Mnohorozměrné škálování
. . . Identifikují se nerozpoznané dimenze,
které diferencují objekty zájmu pomocí:
• podobností nebo
• preferencí
Opět hledáme podobné případy (viz JSM
031)
25
Korespondenční analýza
. . . Používá nemetrická data a vyhodnocuje
lineární nebo nelineární vztahy, aby bylo
možné nalézt asociace mezi objekty a určit
popisné charakteristiky objektů.
Hledáme vazby mezi řádky a sloupci
kontingenční tabulky (viz JSM 152).
26
Pokyny pro provedení mnohorozměrné
analýzy
•
•
•
•
•
•
Určujeme věcné a statistické významnosti
Velikost souboru určuje výsledek (nadto
potřebujeme zpravidla dostatečně velká
data)
Poznáváme data
Hledáme úsporný popis
Posouzení chyb a opomenutí
Validizace výsledků
27
Strukturovaný přístup k MA při tvoření
modelu
Fáze 1: Určíme výzkumný problém, cíle
a mnohorozměrnou techniku
Fáze 2: Navrhneme plán analýzy
Fáze 3: Vyhodnotíme předpoklady techniky
Fáze 4: Odhadujeme parametry modelu
a vyhodnocujeme kvalitu proložení
Fáze 5: Interpretujeme získané výsledky
Fáze 6: Validizujeme získaný model
Poznámka: Často zpracováváme sekundárně data, pak
odpadá bod 2.
28