Transcript Presentatie

Blogs
Annette Ficker
Tim Oosterwijk
Opdrachtgever: Matthieu Jonckheere
Begeleider: Maria Vlasiou
Opbouw presentatie
Probleemstelling
 Elementen
 Opbouw model
 Situaties
 Toetsen
 Regressie
 Conclusie

Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
2
Blogs

Onze definitie van een blog





Plaats op het internet
Omgekeerd chronologische volgorde
Subjectieve (vaak persoonlijke) inhoud
Communicatie vanuit twee kanten
Doet er stiekem niet toe
Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
3
Probleemstelling

Ontwikkel een model dat de populariteit
van een gegeven blog kan beschrijven en
voorspellen
Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
4
Elementen








Het aantal bezoekers
Het aantal unieke bezoekers
Het aantal links naar het blog
Het aantal links vanuit het blog
De gemiddelde lengte van de shortest path
Het aantal bookmarks
Het aantal trackbacks
Het aantal verschillende landen waar de bezoekers
vandaan komen
Probleemstelling –
Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
5
Waarom
Deze elementen zijn volgens
literatuuronderzoek gerelateerd aan
populariteit
 Aantal andere ook, maar om
uiteenlopende redenen niet gebruikt in
model

Probleemstelling –
Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie
6
Opbouw model
Werk per aspect
 Splits meetdata chronologisch in tweeën
 Gebruik een voor die data geschikte
statistische toets om significante wijziging
te detecteren
 Indien aanwezig: lineaire regressie
 Puntentotaal berekenen

Probleemstelling – Elementen –
Opbouw model – Situaties – Toetsen – Regressie – Conclusie
7
Meetdata
Chronologische volgorde
 Gelijkmatige verdeling

Probleemstelling – Elementen –
Opbouw model – Situaties – Toetsen – Regressie – Conclusie
8
Wat gaan we doen?
Opsplitsen in twee delen
 Statistische toets: verandering
gemiddelde?
 Regressie

Probleemstelling – Elementen –
Opbouw model – Situaties – Toetsen – Regressie – Conclusie
9
Welke statistische toets?
Aanname: onafhankelijkheid meetdata
 Intuïtie: Afhankelijkheid
 Maar: grote wereld met “Small World
Property”
 Plausibele aanname

Probleemstelling – Elementen – Opbouw model –
Situaties – Toetsen – Regressie – Conclusie
10
Welke statistische toets?
Nagaan: beide steekproefmonsters
normaal verdeeld?
 Aan de hand van CLS (>60)
 Anders: Shapiro-Wilks toets

Probleemstelling – Elementen – Opbouw model –
Situaties – Toetsen – Regressie – Conclusie
11
Welke statistische toets?

Indien niet beide normaal verdeeld:
Uitschieters verwijderen m.b.v. vuistregel
 Wilcoxon Rank-Sum toets

Probleemstelling – Elementen – Opbouw model –
Situaties – Toetsen – Regressie – Conclusie
12
Welke statistische toets?

Indien beide normaal verdeeld:



Uitschieters eruit halen m.b.v. algoritme
Opnieuw normale verdeling toetsen!
Indien beide normaal verdeeld:
Nagaan: variantie beide
steekproefmonsters gelijk?
 Aan de hand van F-toets

Probleemstelling – Elementen – Opbouw model –
Situaties – Toetsen – Regressie – Conclusie
13
Welke statistische toets?
Indien gelijke variantie:
 Two sample t-test with equal variance

Indien ongelijke variantie:
 Two sample t-test with unequal variance

Probleemstelling – Elementen – Opbouw model –
Situaties – Toetsen – Regressie – Conclusie
14
FlowChart
Probleemstelling – Elementen – Opbouw model –
Situaties – Toetsen – Regressie – Conclusie
15
Tussensamenvatting
Acht elementen: per element bekijken
 Meetdata chronologisch in tweeën
 Statistische toets vergelijkt gemiddelden
 Hebben nu bepaald welke statistische
toets wanneer gebruikt dient te worden

Probleemstelling – Elementen –
Opbouw model – Situaties – Toetsen – Regressie – Conclusie
16
Werking statistische toetsen

Uit te leggen:







Centrale Limiet Stelling
Shapiro-Wilks toets
F-toets
t-toets met gelijke variantie
t-toets met ongelijke variantie
Wilcoxon Rank-Sum toets
… saai! Verslag en literatuur!
Probleemstelling – Elementen – Opbouw model – Situaties –
Toetsen – Regressie – Conclusie
17
Wat nu?
Significant verschil gemiddelden
gedetecteerd
 Lineaire regressie toepassen!
 Richtingscoëfficiënt grove indicator
verandering

Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen –
Regressie – Conclusie
18
Lineaire regressie
Gegeven verzameling meetpunten
 Vind kromme die er zo goed mogelijk bij
past
 Minimaliseren kwadratische verschillen
 Lineaire regressie: y=ax+b

Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen –
Regressie – Conclusie
19
Lineaire regressie
Richtingscoëfficiënt positief: stijging!
 Richtingscoëfficiënt negatief: daling…
 Indien niet door statistische toets heen
gekomen: richtingscoëfficiënt 0

Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen –
Regressie – Conclusie
20
Puntensysteem








Het aantal unieke bezoekers 5
Het aantal links naar het blog 5
De gemiddelde lengte van de shortest path 3
Het aantal bezoekers 2
Het aantal bookmarks 2
Het aantal links vanuit het blog 1
Het aantal trackbacks 1
Het aantal verschillende landen waar de
bezoekers vandaan komen 1
Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie –
Conclusie
21
Werking
Indien statistische toets verschil en
positieve richtingscoëfficiënt: optellen
 Indien statistische toets verschil en
negatieve richtingscoëfficiënt: aftrekken
 Indien statistische toets geen verschil:
niks

Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie –
Conclusie
22
Criterium
Indien puntentotaal > 10: stijging
populariteit
 Indien puntentotaal < -10: daling
populariteit
 Anders: geen significante wijziging

Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie –
Conclusie
23
Klaar!
Acht aspecten: per aspect bekijken
 Chronologisch meetdata in tweeën
 Statistische toets daarvoor geschikt
checkt significante wijziging gemiddelden
 Indien ja: lineaire regressie indicator
 Punten toekennen / aftrekken
 Criterium: 10 punten

Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie –
Conclusie
24
Einde presentatie
Vragen?
Annette Ficker
Tim Oosterwijk