Transcript Presentatie
Blogs
Annette Ficker
Tim Oosterwijk
Opdrachtgever: Matthieu Jonckheere
Begeleider: Maria Vlasiou
Opbouw presentatie
Probleemstelling
Elementen
Opbouw model
Situaties
Toetsen
Regressie
Conclusie
Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
2
Blogs
Onze definitie van een blog
Plaats op het internet
Omgekeerd chronologische volgorde
Subjectieve (vaak persoonlijke) inhoud
Communicatie vanuit twee kanten
Doet er stiekem niet toe
Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
3
Probleemstelling
Ontwikkel een model dat de populariteit
van een gegeven blog kan beschrijven en
voorspellen
Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
4
Elementen
Het aantal bezoekers
Het aantal unieke bezoekers
Het aantal links naar het blog
Het aantal links vanuit het blog
De gemiddelde lengte van de shortest path
Het aantal bookmarks
Het aantal trackbacks
Het aantal verschillende landen waar de bezoekers
vandaan komen
Probleemstelling –
Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
5
Waarom
Deze elementen zijn volgens
literatuuronderzoek gerelateerd aan
populariteit
Aantal andere ook, maar om
uiteenlopende redenen niet gebruikt in
model
Probleemstelling –
Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
6
Opbouw model
Werk per aspect
Splits meetdata chronologisch in tweeën
Gebruik een voor die data geschikte
statistische toets om significante wijziging
te detecteren
Indien aanwezig: lineaire regressie
Puntentotaal berekenen
Probleemstelling – Elementen –
Opbouw model – Situaties – Toetsen – Regressie – Conclusie
7
Meetdata
Chronologische volgorde
Gelijkmatige verdeling
Probleemstelling – Elementen –
Opbouw model – Situaties – Toetsen – Regressie – Conclusie
8
Wat gaan we doen?
Opsplitsen in twee delen
Statistische toets: verandering
gemiddelde?
Regressie
Probleemstelling – Elementen –
Opbouw model – Situaties – Toetsen – Regressie – Conclusie
9
Welke statistische toets?
Aanname: onafhankelijkheid meetdata
Intuïtie: Afhankelijkheid
Maar: grote wereld met “Small World
Property”
Plausibele aanname
Probleemstelling – Elementen – Opbouw model –
Situaties – Toetsen – Regressie – Conclusie
10
Welke statistische toets?
Nagaan: beide steekproefmonsters
normaal verdeeld?
Aan de hand van CLS (>60)
Anders: Shapiro-Wilks toets
Probleemstelling – Elementen – Opbouw model –
Situaties – Toetsen – Regressie – Conclusie
11
Welke statistische toets?
Indien niet beide normaal verdeeld:
Uitschieters verwijderen m.b.v. vuistregel
Wilcoxon Rank-Sum toets
Probleemstelling – Elementen – Opbouw model –
Situaties – Toetsen – Regressie – Conclusie
12
Welke statistische toets?
Indien beide normaal verdeeld:
Uitschieters eruit halen m.b.v. algoritme
Opnieuw normale verdeling toetsen!
Indien beide normaal verdeeld:
Nagaan: variantie beide
steekproefmonsters gelijk?
Aan de hand van F-toets
Probleemstelling – Elementen – Opbouw model –
Situaties – Toetsen – Regressie – Conclusie
13
Welke statistische toets?
Indien gelijke variantie:
Two sample t-test with equal variance
Indien ongelijke variantie:
Two sample t-test with unequal variance
Probleemstelling – Elementen – Opbouw model –
Situaties – Toetsen – Regressie – Conclusie
14
FlowChart
Probleemstelling – Elementen – Opbouw model –
Situaties – Toetsen – Regressie – Conclusie
15
Tussensamenvatting
Acht elementen: per element bekijken
Meetdata chronologisch in tweeën
Statistische toets vergelijkt gemiddelden
Hebben nu bepaald welke statistische
toets wanneer gebruikt dient te worden
Probleemstelling – Elementen –
Opbouw model – Situaties – Toetsen – Regressie – Conclusie
16
Werking statistische toetsen
Uit te leggen:
Centrale Limiet Stelling
Shapiro-Wilks toets
F-toets
t-toets met gelijke variantie
t-toets met ongelijke variantie
Wilcoxon Rank-Sum toets
… saai! Verslag en literatuur!
Probleemstelling – Elementen – Opbouw model – Situaties –
Toetsen – Regressie – Conclusie
17
Wat nu?
Significant verschil gemiddelden
gedetecteerd
Lineaire regressie toepassen!
Richtingscoëfficiënt grove indicator
verandering
Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen –
Regressie – Conclusie
18
Lineaire regressie
Gegeven verzameling meetpunten
Vind kromme die er zo goed mogelijk bij
past
Minimaliseren kwadratische verschillen
Lineaire regressie: y=ax+b
Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen –
Regressie – Conclusie
19
Lineaire regressie
Richtingscoëfficiënt positief: stijging!
Richtingscoëfficiënt negatief: daling…
Indien niet door statistische toets heen
gekomen: richtingscoëfficiënt 0
Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen –
Regressie – Conclusie
20
Puntensysteem
Het aantal unieke bezoekers 5
Het aantal links naar het blog 5
De gemiddelde lengte van de shortest path 3
Het aantal bezoekers 2
Het aantal bookmarks 2
Het aantal links vanuit het blog 1
Het aantal trackbacks 1
Het aantal verschillende landen waar de
bezoekers vandaan komen 1
Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie –
Conclusie
21
Werking
Indien statistische toets verschil en
positieve richtingscoëfficiënt: optellen
Indien statistische toets verschil en
negatieve richtingscoëfficiënt: aftrekken
Indien statistische toets geen verschil:
niks
Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie –
Conclusie
22
Criterium
Indien puntentotaal > 10: stijging
populariteit
Indien puntentotaal < -10: daling
populariteit
Anders: geen significante wijziging
Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie –
Conclusie
23
Klaar!
Acht aspecten: per aspect bekijken
Chronologisch meetdata in tweeën
Statistische toets daarvoor geschikt
checkt significante wijziging gemiddelden
Indien ja: lineaire regressie indicator
Punten toekennen / aftrekken
Criterium: 10 punten
Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie –
Conclusie
24
Einde presentatie
Vragen?
Annette Ficker
Tim Oosterwijk