Dimension redusointitekniikat - Aalto

Download Report

Transcript Dimension redusointitekniikat - Aalto

Dimension redusointitekniikat
Esitys 7
Kirjan kpl 3.4
28.09.2011
Tero Jokinen
Työn saa tallentaa ja julkistaa Aalto-yliopiston avoimilla verkkosivuilla. Muilta osin kaikki oikeudet pidätetään.
Sisältö
•
•
•
•
•
•
Kotitehtävät
Faktorimallit
Tilastolliset kalibrointistrategiat
Faktorimallien regressioanalyysi
Pääkomponenttianalyysi
Matlab-esimerkki
Kotitehtävä
Johdatus dimension redusointiin
• Mielenkiinnon kohteena on ilmiö, jota kuvataan suurella
joukolla muuttujia
• Johtopäätöksien teko helpottuu mikäli suuri joukko
muuttujia voidaan korvata pienemmällä joukolla uusia
muuttujia
• Uusien muuttujien tulee säilyttää mahdollisimman suuri
osa alkuperäisiin muuttujiin liittyvästä vaihtelusta
Faktorimallit
Faktorimallit
(kirja s. 103)
Tilastolliset kalibrointistrategiat
(kirja s. 105)
Faktorimallien regressioanalyysi
Pääkomponenttianalyysi (PCA)
• Tavoitteena korreloivan datan dimension redusointi
etsimällä sopiva määrä korreloimattomia
lineaarikombinaatioita jotka selittävät suurimman osan
alkuperäisen datan vaihtelusta
• Huom! PCA ei muodosta tilastollista mallia vaan on
pikemminkin datan rotatointitekniikka
• Voidaan käyttää faktorimallien faktorien
muodostamisessa
Pääkomponenttianalyysi (PCA)
Pääkomponenttianalyysi (PCA)
Pääkomponenttianalyysi
• Vasemmalla X ja oikealla Y
Pääkomponentit faktoreina
Pääkomponentit faktoreina
Matlab-esimerkki
• Muodostetaan faktorimalli
pääkomponentteja
käyttäen
• Data X kuvassa
Matlab-esimerkki
Matlab-esimerkki
Matlab-esimerkki
• Validointi toisella datalla (samat jakaumat)
• Yhdellä faktorilla
Matlab-esimerkki
• Yksi faktori ja a
Matlab-esimerkki
• Kaksi faktoria ja a
Kotitehtävä