Transcript Presentatie
Blogs Annette Ficker Tim Oosterwijk Opdrachtgever: Matthieu Jonckheere Begeleider: Maria Vlasiou Opbouw presentatie Probleemstelling Elementen Opbouw model Situaties Toetsen Regressie Conclusie Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 2 Blogs Onze definitie van een blog Plaats op het internet Omgekeerd chronologische volgorde Subjectieve (vaak persoonlijke) inhoud Communicatie vanuit twee kanten Doet er stiekem niet toe Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 3 Probleemstelling Ontwikkel een model dat de populariteit van een gegeven blog kan beschrijven en voorspellen Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 4 Elementen Het aantal bezoekers Het aantal unieke bezoekers Het aantal links naar het blog Het aantal links vanuit het blog De gemiddelde lengte van de shortest path Het aantal bookmarks Het aantal trackbacks Het aantal verschillende landen waar de bezoekers vandaan komen Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 5 Waarom Deze elementen zijn volgens literatuuronderzoek gerelateerd aan populariteit Aantal andere ook, maar om uiteenlopende redenen niet gebruikt in model Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 6 Opbouw model Werk per aspect Splits meetdata chronologisch in tweeën Gebruik een voor die data geschikte statistische toets om significante wijziging te detecteren Indien aanwezig: lineaire regressie Puntentotaal berekenen Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 7 Meetdata Chronologische volgorde Gelijkmatige verdeling Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 8 Wat gaan we doen? Opsplitsen in twee delen Statistische toets: verandering gemiddelde? Regressie Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 9 Welke statistische toets? Aanname: onafhankelijkheid meetdata Intuïtie: Afhankelijkheid Maar: grote wereld met “Small World Property” Plausibele aanname Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 10 Welke statistische toets? Nagaan: beide steekproefmonsters normaal verdeeld? Aan de hand van CLS (>60) Anders: Shapiro-Wilks toets Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 11 Welke statistische toets? Indien niet beide normaal verdeeld: Uitschieters verwijderen m.b.v. vuistregel Wilcoxon Rank-Sum toets Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 12 Welke statistische toets? Indien beide normaal verdeeld: Uitschieters eruit halen m.b.v. algoritme Opnieuw normale verdeling toetsen! Indien beide normaal verdeeld: Nagaan: variantie beide steekproefmonsters gelijk? Aan de hand van F-toets Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 13 Welke statistische toets? Indien gelijke variantie: Two sample t-test with equal variance Indien ongelijke variantie: Two sample t-test with unequal variance Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 14 FlowChart Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 15 Tussensamenvatting Acht elementen: per element bekijken Meetdata chronologisch in tweeën Statistische toets vergelijkt gemiddelden Hebben nu bepaald welke statistische toets wanneer gebruikt dient te worden Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 16 Werking statistische toetsen Uit te leggen: Centrale Limiet Stelling Shapiro-Wilks toets F-toets t-toets met gelijke variantie t-toets met ongelijke variantie Wilcoxon Rank-Sum toets … saai! Verslag en literatuur! Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 17 Wat nu? Significant verschil gemiddelden gedetecteerd Lineaire regressie toepassen! Richtingscoëfficiënt grove indicator verandering Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 18 Lineaire regressie Gegeven verzameling meetpunten Vind kromme die er zo goed mogelijk bij past Minimaliseren kwadratische verschillen Lineaire regressie: y=ax+b Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 19 Lineaire regressie Richtingscoëfficiënt positief: stijging! Richtingscoëfficiënt negatief: daling… Indien niet door statistische toets heen gekomen: richtingscoëfficiënt 0 Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 20 Puntensysteem Het aantal unieke bezoekers 5 Het aantal links naar het blog 5 De gemiddelde lengte van de shortest path 3 Het aantal bezoekers 2 Het aantal bookmarks 2 Het aantal links vanuit het blog 1 Het aantal trackbacks 1 Het aantal verschillende landen waar de bezoekers vandaan komen 1 Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 21 Werking Indien statistische toets verschil en positieve richtingscoëfficiënt: optellen Indien statistische toets verschil en negatieve richtingscoëfficiënt: aftrekken Indien statistische toets geen verschil: niks Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 22 Criterium Indien puntentotaal > 10: stijging populariteit Indien puntentotaal < -10: daling populariteit Anders: geen significante wijziging Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 23 Klaar! Acht aspecten: per aspect bekijken Chronologisch meetdata in tweeën Statistische toets daarvoor geschikt checkt significante wijziging gemiddelden Indien ja: lineaire regressie indicator Punten toekennen / aftrekken Criterium: 10 punten Probleemstelling – Elementen – Opbouw model – Situaties – Toetsen – Regressie – Conclusie 24 Einde presentatie Vragen? Annette Ficker Tim Oosterwijk