Open Source im professionellen Einsatz

Newsletter abonnieren
Seite durchsuchen

HEFTARCHIV | NEWS | E-BIBLIOTHEK | VIDEO | BLOGS | WHITEPAPER | EVENTS | ACADEMY | ABO | SHOP

user friendly

  Home  »  Heft & Abo  »  Heftarchiv  »  2007  »  09  »  Für Durchblick sorgen  

RSS-Feed der aktuellen News von Linux-Magazin Online Folgen Sie Linux-Magazin Online auf Twitter
Diesen Artikel druckenDiesen Artikel weiterempfehlen Diesen Artikel kommentieren Newsletter abonnieren
Share/Bookmark

Log-Analyzer für Apache im Vergleich

Für Durchblick sorgen

von Peter Kreußel
Erschienen im Linux-Magazin 2007/09

Wer die Besucher seiner Webseiten zählen und wissen will, woher sie kommen oder wie lange sie bleiben, findet diese Informationen im Apache-Log - theoretisch, denn niemand kann mit den kryptischen Zeilen dort etwas anfangen. Webalizer oder Awstats bereiten die Daten grafisch auf.

Wer wissen möchte, wie sein Produkt ankommt, muss teure Marktanalysen bezahlen - es sei denn, er bietet Webseiten an. Dann geben bereits die Logfiles des Webservers Aufschluss über Besucherzahlen, Verweildauer, die beliebtesten Seiten und darüber, wie Besucher sich am häufigsten durch die Site bewegen. Doch die Daten, die Apache mitschreibt, sind überaus deutungsbedürftig:

192.168.1.117 - - [25/Jul/2007:13:15:05+0200] "GET /epi/index_library.hp?rs=getFiles&rsargs[]=u39&rsargs[]=1&rsrd=1185362099011 HTTP/1.1" 200 141 "http://192.168.1.90/epi/index_library.php" "Mozilla/5.0 (X11; U; Linux i686; de; rv:1.8.1.5) Gecko/20070713 Firefox/2.0.0.5"

Jede Zeile im Accesslog des Servers berichtet unter anderem über die IP des Besuchers, den Befehl, den sein Browser an den Webserver gerichtet hat, sowie welchen Browser und welches Betriebssystem er benutzt. Selbst wer die Zeilen im Accesslog zu deuten versteht, ist wegen ihrer schieren Zahl auf eine Software angewiesen, die solche Rohdaten statistisch verarbeitet.

Log-Analyzer - etwa Webalizer und dessen Forks Webalizer Xtended und Stone Step Webalizer sowie Awstats - verwandeln die schwer verdaulichen Apache-Logs in übersichtliche Balkengrafiken, die sich auch in Meetings präsentieren lassen. Außer diesen Programmen, die sich darauf konzentrieren, den Traffic zu analysieren, stellt die Bitparade noch zwei Programme vor, die nicht nach der Quantität der Zugriffe fragen. Pathalizer und Visitors stellen die Bewegungen der Besucher auf der Site grafisch dar.

E Webalizer & Co.

Der Open-Source-Klassiker Webalizer ([1], Abbildung 1) liegt als Binary vor, das beim Aufruf neben optionalen Parametern den Pfad zum Accesslog des Webservers erwartet. Als Ausgabe erzeugt der Log-Analizer HTML-Seiten mit eingebundenen Grafiken. Erfolgt der Aufruf von Webalizer regelmäßig über einen Cronjob, lassen sich die aktuellen Statistiken über den Webserver ohne Konsolenzugriff auf den Server-Rechner abrufen. Da das unter [1] erhältliche Static Binary ohne weitere Konfiguration mit der Apache-Access-Logdatei arbeitet, ist der seit 2002 nicht mehr weiterentwickelte Webalizer nach wie vor die schnellste Methode, um eine Besucherstatistik zu erzeugen.


Abbildung 1: Veteran mit deutlich sichtbarer Altersschwäche: Features wie zum Beispiel das Ausfiltern von Suchmaschinen-Bots sowie eine Analyse der Aufenthaltsdauer der Besucher fehlen.

Die Einstiegsseite von Webalizer schlüsselt den Traffic eines Jahres nach Monaten auf. Die Software differenziert dabei zwischen Hits (Anfragen an den Webserver), Files (Anzahl der übertragenen Dateien inklusive Grafiken), Pages (Anzahl der ausgelieferten Seiten) und den Visits (Anzahl der Besucher mit unterschiedlicher IP). Außerdem überwacht der Monitor die Antwortcodes des Servers: Gibt es Einträge mit 404-Rückgabewert, deutet dies auf ungültige Links innerhalb der Seite hin.

Die Jahrestabelle enthält Links auf die Statistiken der einzelnen Monate. Webalizer kennzeichnet die Tabellenspalten farbig und zeichnet Balkengrafiken. Leider gibt es keine Wochenübersicht, sodass es dem Benutzer überlassen bleibt, die Traffic-Einbrüche den Samstagen oder Sonn- und Feiertagen zuzuordnen. Außerdem weist Webalizer die Top 10 und Top 30 der Seiten aus, inklusive des Traffic, der auf deren Konto geht.

Überwacht

Den Verlauf des typischen Besuchs einer Webseite erfasst Webalizer nur über eine Top-8-Liste der Einstiegs- und Ausstiegsseiten. Die Einstiegsseite gibt, zusammen mit der Top-30-Liste der Referrer - also der Herkunftsseite, die der Browser angibt -, Auskunft darüber, welche Seiten über die Suchmaschinen besonders viele Besucher angezogen haben.

Bei der Referrer-Liste ist zu bedenken, dass ihre Werte vom Browser der Besucher stammen und unzuverlässig sind. Nicht alle Browser machen diese Angabe, unter Umständen schaltet auch der Benutzer die Übermittlung ab. Das gilt auch für die Top 5 der User Agents, also der Informationen über Browser und Betriebssystem. Auch hier können Besucher die Statistik verzerren. Beim Opera-Browser etwa lässt sich der Rückgabewert des User Agent leicht auf einen beliebigen Wert einstellen.

Sie können diesen Artikel als PDF für 99 Cent kaufen. Klicken Sie dazu einfach auf eine der beiden Bezahloptionen Paypal oder ClickandBuy.


Diesen Artikel druckenDiesen Artikel weiterempfehlen Diesen Artikel kommentieren Newsletter abonnieren
Share/Bookmark
Ähnliche Artikel
Der Inhalt zählt Wiki-Software im Test
Insektenforscher Fehler- und Änderungsmanagement mit Bugzilla
Daten am Mann SQL-Selects in Javascript mit Public SQL
Austria Open Auflösung des (schweren) Winterrätsels
Besser nachlesen Logfile-Auswertung mit Log2timeline
Draufsicht Geschäftsprozesse mit Nagios überwachen
Whitepaper
Daten Migration - Eine Publikation von Bloor Research

Datenmigrationsprojekte überschreiten häufig das Budget, neigen zu Verzögerung und werden unter Umständen komplett abgebrochen. Bloor Research ist eines der weltweit führenden IT-Forschungs-, Analyse- und Beratungsunternehmen und wird in dem vorliegenden White Paper die wichtigsten Aspekte dieser Problematik näher beleuchten. Ferner werden praktische Empfehlungen für erfolgreiche Migrationsprojekte gegeben, die Sie auf Ihr nächstes Projekt übertragen können.

Download PDF (Registrierung erforderlich)
Open Source Datenintegration in der Praxis: Fallstudien und Anwendungsbeispiele

Über die letzten Jahre hinweg haben sich Open Source Lösungen als fester Bestandteil des gesamten Datenintegrationsmarktes etabliert. Viele Unternehmen haben bereits das Open Source Modell für Ihre Datenintegrationsprojekte aufgegriffen. Das vorliegende White Paper illustriert anhand ausgewählter Fallstudien und Anwendungsbeispiele die Implementierung von Open Source Datenintegration in der Praxis und benennt die daraus resultierenden Vorteile.

Download PDF (Registrierung erforderlich)
Kommentare (1)
von
heiner einer,
21.09.2008 22:46
Internet Explorer oder was?
Das ist jetzt nicht wahr das die Seite nur im Internet Explorer korrekt dargestellt wird und ich im Firefox rechts und links scrollen muß???