Logfileanalyse Prof. Dr. Eduard Heindl Elemente einer Logfilezeile IP-Adresse des Clients Identität des Clientrechners (normalerweise nicht verfügbar) Identität des Benutzers (nur bei Authentifikation verfügbar) Sekundengenauer Zeitpunkt des.
Download ReportTranscript Logfileanalyse Prof. Dr. Eduard Heindl Elemente einer Logfilezeile IP-Adresse des Clients Identität des Clientrechners (normalerweise nicht verfügbar) Identität des Benutzers (nur bei Authentifikation verfügbar) Sekundengenauer Zeitpunkt des.
Logfileanalyse Prof. Dr. Eduard Heindl Elemente einer Logfilezeile IP-Adresse des Clients Identität des Clientrechners (normalerweise nicht verfügbar) Identität des Benutzers (nur bei Authentifikation verfügbar) Sekundengenauer Zeitpunkt des Abrufs (Serverzeit) Erste Zeile der http Clientanfrage Status der Serverantwort Dateigröße in Bytes Combined Log Format Referer, letztes Dokument im Browser des Besucher Domain von der die Seite abgerufen wurde Browser des Besuchers Betriebssystem des Besuchers 217.81.42.213 - - [01/Apr/2002:15:04:16 +0200] GET / HTTP/1.1 200 25432 www.heindl.de http://www.google.de/search?q=heindl+Internet+A G&hl=de&btnG=Google-Suche&meta=lr%3Dlang_de Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1) Warum Kennziffern Websites müssen sich lohnen Nur gute Websites lohnen sich Kundengerechte Websites sind gute Websites Controlling der Kundenzufriedenheit durch Kennziffern Klassische Webstatistik Messgröße Problem Umsatz Nur bei reinen E-Shops sinnvoll PageViews (PV) Abhängig von der Auffindbarkeit Sitzungsdauer Abhängig von Internetanbindung Hits Abhängig vom Webdesign Anforderung an Kennziffern Aussagekräftig Unabhängig von Zusatzbefragung Einfach zu ermitteln Keine aufwendige Technik Überschaubare Fehlerquellen Statistisch signifikant Auch auf Einzeldokumente anwendbar Pageimpression AdImpression "AdImpressions sind der messbare Werbemittelkontakt. Sie bezeichnen die Anzahl der von den Clients der Nutzer abgerufenen (requested) Werbemittel vom Server eines Werbeträgers oder anderen AdServers." (dmmv) Pageimpression PI Eine Internetseite im Browser ~ AdImpression Pageview PV Abruf einer HTML Seite vom Server (nicht Aussagekräftig) Frame Frameseiten haben weniger PI als PV Usersession Usersession = Visit Visit Zusammenhängender Nutzungsvorgang, Besuch auf der Internetsite View Time Nutzungsdauer, keine exakte Definition verfügbar (dmmv) Erkenntnisse aus Abweichungen Flut der Anfragen Marketingerfolg Beispiel einer Marketingkampagne mit 60.000 Werbebriefen Seitentypen Entry-, Brücken- und Exitpage In-Out Analyse Exit-Page Normale Ursachen Letzte Seite in einem Bestellprozess Linkliste, Angebot eines wichtigen externen Links Struktureller Abschluss etwa Z im Lexikon Newsseite Seite zum Ausdrucken Glossar Kanalwechsel, z.B. Ansprechpersonen, Kontaktformular Exit-Page Problematische Ursachen Keine internen Links vorhanden Frameunterseiten, die isoliert gesehen werden (Externer Einstieg) Lange Ladezeit Seite hat unerwarteten Inhalt Layout problematisch z.B. zu kleine Schrift Unübliches Datenformat, z.B. Postscript Berechnung der Kennziffern Nützliche Kennziffern Kennziffer Bedeutung In/PV Einstiegseite/Seitenabruf Suchmaschinen, Externe Links Out/PV Letzte Seite/Seitenabruf Seitenqualität, Ladezeitprobleme Only/PV Einzige Seite/Seitenabruf Suchmachinentext, Seiteninhalt Neue Kennziffer: Fav/PV Annahmen: Gute Seiten werden von Besuchern in die Favoriten aufgenommen (unter Netscape: Bookmark) Je häufiger von verschiedenen Besuchern ein Favorit gesetzt wird, um so besser das Dokument Favicon im Browser Das Favicon Das File „favicon.ico“ wird immer vom Webbrowser (IE5 und höher) vom Webserver angefordert, wenn der Besucher ein Lesezeichen setzt. Favicon/Seitenabruf: Kennziffer, die ermittelt, ob ein Besucher Interesse an der Webseite (Website) hat. Messverfahren Im Logfile werden alle Serveranfragen protokolliert, auch der Faviconabruf Logfileauswertung mit Statistikprogramm (z.B. websuxess) Bestimmung der Abrufe des Files „favicon.ico“ Zeitabhängig Seitenbezogen Technische Probleme Netscape und Gecko Browser rufen das File favicon.ico bei jedem Seitenabruf auf -> Filtern auf IE-Browser Favicon wird immer aus dem lokalen Verzeichnis geholt -> File in allen Verzeichnissen abspeichern Bezugsseite kann nur durch Pfadanalyse ermittelt werden (rechenaufwendig) Tageszeitabhängigkeit Bestimmung des Faviconabrufs, relativ zu den Seitenaufrufen Je später der Abend, um so wahrscheinlicher wird ein Lesezeichen gesetzt Websitequalität Analyse Relaunch www.tuebingen.com Favicon/Besucher Vorher ~1% Fav/PV Nachher ~2% Fav/PV Relaunch war erfolgreich Webseitenqualität Die Top Seiten Auswertung Website Solarserver.de Zeitraum: 1. Quartal 2003 Datenbasis: Ca. 1.000.000 Seitenaufrufe Lehre: Branchenverzeichnis ist beliebt Suchmaschinen Relevante Suchmaschinen Relevante Suchworte Nutzung der Suchmaschinen Externe Links Quelle der Besucherströme Suchmaschinen Externe Links Favoriten E-Mails Manuelle Eingabe Favoriten Lesezeichen = Bookmark = Favorit Bei Explorer: Abruf des Files favicon.ico Achtung: Netscape 7 ruft das File immer ab Pfadverfolgung Wenig gleiche Pfade Lange Pfade von Interesse Analyse nach Zielelementen Einzelauswertung mühsam Pfadlänge Längere Besuche sind wünschenswert Grund der längeren Pfade verstehen Pogosticking vermeiden Zieldokumente Jede Website hat Targetdokumente Bestellabschluss Newsletterabo Relevante Hyperlinks Robotsfile Immer wenn eine Suchmaschine kommt wird das File robots.txt abgerufen Ladezeit Zuerst wird das HTML-File geladen Bilder werden in der Reihenfolge im HTML Text nachgeladen Anzahl der abgerufenen Bilder gibt Einblick über Besucherverhalten Fehleranalyse Datenquelle Statistik Signifikanz Grosse Ereigniszahl Längere Zeiträume Einfache Betrachtung Abhängigkeiten erkennen Schiefe Statistik - Ursachen Suchrobots nicht herausgefiltert Sonderfunktion im Browser nötig Viele Nutzer außerhalb der Zielgruppe (z.B. Mitarbeiter, Sprachraum) Sitzungslänge falsch eingeschätzt Serverfehler falsch einbezogen (404-Fehlerseiten) Proxyserver Bildschirmauflösung Automatische Verknüpfung von Seiten (Frames) Änderung von Dokumentadressen (Seitenumzug) Inhalt – URL Relation falsch interpretiert Proxyserver Normalerweise mit Meldung 304 zu erkennen Abhängig von HTTP Version Abhängig von Proxyeinstellung Lokaler Cache wird nicht erkannt Pseudobesucher Interne Besucher (Startseite) Robots Downloads Linkchecker Störer (DDOS) Hacker Frameeinblendungen Sitedownload Dynamische Seiten Erzeugung durch Content Management System Erzeugung durch Shopsoftware Besucherindividuell Profilabhängig Dynamische Seiten Besuchszeiten Tagesverlauf Wochenverlauf Jahresverlauf Monat? Sehr viele Sondereffekte! Zyklenvergleich Statuscode Status aus dem HTTP Header 200 – alles ok 300 – kleine Umleitung 400 – „dumme Frage“ 500 – Server kaputt IVW Informationsgemeinschaft zur Feststellung der Verbreitung von Werbeträgern e.V. Registrierte Websites werden analysiert Jeder kann die Resultate abrufen Relativ teuer Nützlich für alle Banner-Werbetreibenden www.Alexa.com Service aus den USA Arbeitet mit Browserplugin Analyse fremder Websites möglich Teilweise schiefe Statistik Nur ähnliche Websites vergleichbar Alexa - IVW Problematik der Alexaabfrage Seitenzähler ASP- Webstatistik Beispiel Hitbox Trends Alle Bevölkerungsgruppen nutzen das Web Die durchschnittliche Nutzungsdauer wächst Die Internetzugänge werden schneller (DSL) Wachsende Bereitschaft zu Online Transaktionen Leistungsfähige Endgeräte Moderne Browser Multimediale Rechner Höhere Bildschirmauflösung Erfahrene Internetnutzer „Heavy User“ Vielen Dank für Ihre Aufmerksamkeit Weitere Informationen: http://webuser.hs-furtwangen.de/~heindl/om-2007ws.html