Archiv der Kategorie: Open Source

Piwik Videos: Einführung und Installation

Das Piwik Team hat zwei Videos veröffentlicht.

Das erste Video gibt einen Überblick über die Möglichkeiten von Piwik und ist besonders für Leute geeignet, die sich über Piwik informieren möchten.

Falls das Interesse mit dem ersten Video geweckt wurde zeigt das zweite Video die Installation von Piwik auf einem gehosteten System.

Die beiden Videos sind auf englisch, ich kann sie aber jedem empfehlen, der sich über Piwik informieren möchte oder bereits mit dem Gedanken spielt Piwik einzusetzen.

Piwik 1.9 mit Transitions

Piwik LogoGestern hat das Piwik-Team den Release 1.9 veröffentlicht. Die aus meiner Sicht herausragende Neuerung ist die Transitions-Ansicht.

Bei der Transitions-Ansicht handelt es um eine Grafik, aus der man einfach lesen kann, von wo ein Besucher einer Seite kam und wohin er wieder verschwand, nachdem er die Seite besucht hatte. Ein Beispiel ist im Screenshot der Transitions ersichtlich. In der Mitte ist dabei die Seite mit den nackten Zahlen. Auf der linken Seite wird angegeben von wo der Besucher gekommen ist, aufgeteilt in interne Seiten, Suchmaschinen, andere Webseiten und direkte Zugriffe. Einer dieser Ströme kann dabei detaillierter betrachtet werden. Auf der rechten Seite wird angegeben, wohin der Benutzer verschwunden ist, nachdem er die Seite besucht hatte. Die internen Seiten werden auch wieder detailliert angezeigt. Zudem wird unterhalb der Seite auch noch angegeben, wie oft die Seite neu geladen wurde.

Folgende Features wurden ebenfalls hinzugefügt:

  • Site Search:
    Es kann nun auch verfolgt werden, mit welchen Suchbegriffen in der lokalen (Webseite-Internen) Suche gesucht wurde.
  • GeoIP:
    Die geografische Lokalisierung erlaubt es nun auch, die Regionen und Städte zu erfassen und auszuwerten.
  • Es kann ausgewählt werden, wie viele Werte in einem Graphen angezeigt werden sollen.

Zudem wurden in den 15 geschlossenen Tickets auch Fehler behoben und Sicherheitslücken geschlossen.

Version 1.8.4 von Piwik veröffentlicht

Piwik LogoGestern hat das Piwik-Team den Release 1.8.4 veröffentlicht. Hauptänderung ist eine starke Performance-Verbesserung für Webseiten mit mittlerem bis hohem Verkehrsaufkommen.

Optimierung
Es wurde eine Optimierung vorgenommen, die den Speicherverbrauch von Piwik um bis zu 50% verringert und die Zeit, um die Reports zu erstellen, um bis zu 40% reduziert. Dies besonders bei Webseiten, die ein mittleres oder hohen Verkehrsaufkommen aufweisen.

Verbesserungen beim User Interface

  • Vereinfachter Ablauf bei verlorenem Passwort.
    Der Ablauf, um bei einem verlorenen oder vergessenen Passwort ein neues Passwort zu erhalten wurde vereinfacht, ohne die Sicherheit zu beeinträchtigen.
  • Schönere Icons und Grafiken
    Die Grafiken und Icons wurden überarbeitet, so dass sie schöner aussehen. Ein Beispiel kann im zugehörigen Blog-Artikel angeschaut werden.
  • Vergleich von mehreren Webseiten.
    Falls man mit einer Piwik-Installation mehrere Webseiten analysiert kann man über das All-Websites Dashboard die Webseiten miteinander vergleichen.
  • Abgebrochene Einkäufe im E-Commerce Log
    Falls man eine E-Commerce Seite betreibt und Anbindung an Piwik entsprechend vorgenommen hat kann man nun auch die abgebrochenen Einkäufe in Piwik analysieren und so mögliche Problempunkte des Shops erkennen.

Insgesamt wurden 23 Tickets geschlossen. Der Ausblick auf die Features der folgenden Versionen ist auch sehr vielversprechend, besonders auf die Transitions und die detailliertere Auswertung der GeoIP freue ich mich.

Piwik in Version 1.8.3 erschienen

Piwik LogoMitte Monat ist der Release 1.8.3 von Piwik veröffentlicht worden. Trotz des kleinen Versionssprungs sind einige Neuerungen und Verbesserungen enthalten.

Versand von Reports über SMS
Über das PlugIn „MobileMessaging“ können Reports als SMS versandt werden. Zur Zeit ist aber nur die Schnittstelle zu einem SMS-Anbieter in UK implementiert, deshalb habe ich die Funktionalität selber noch nicht ausprobiert. Aber vielleicht kommen in Zukunft weitere Anbieter/Schnittstellen hinzu.

Neuer Report „Besucher nach Wochentag“
Anhand des Besucher-Graphen konnte man meist schon erahnen, ob die Webseite eher an Wochenenden oder an Werktagen besucht wurde. Mit dem neuen Report wird diese Information nun klar ersichtlich.

Optimierungen und Verbesserungen bei der Benutzbarkeit
Neben einigen Performance-Verbesserungen wurde auch am User Interface gearbeitet. So haben die Widgets nun einen Refresh-Button erhalten, um die Daten erneut zu laden. Und der Auswahl-Dialog für die Periode zeigt nun direkt an, welcher Zeitraum ausgewählt (z.B. die gewünschte Woche) ist.

Es wurden für diesen Release 46 Tickets geschlossen.

Piwik in Version 1.8.2 erschienen

Es ist schon einige Zeit her, aber ich möchte trotzdem noch auf die neuen Piwik-Releases hinweisen.
Release 1.8 ist Anfangs Juni erschienen. Darin wurden 83 Tickets geschlossen. In den gleich anschliessend erschienen Releases 1.8.1 und 1.8.2 wurden nochmals 7 bzw. 1 Ticket geschlossen

Hier die wichtigsten Neuerungen der Releases 1.8.x:

  • Historische Ansicht der Daten
    Auf jeder Datenzeile (z.B. ein Keyword) kann nun mit einem Klick der Verlauf der Werte für diesen Eintrag begutachtet werden. So kann man z.B. verfolgen, wie sich die Zugriffe über ein Keyword entwickelt haben oder ob ein Browser an weniger verwendet wird.
  • Mehrere Datenzeilen vergleichen
    Die oben beschriebene Ansicht kann auch mit mehreren Datenzeilen verwendet werden. So können z.B. die Werte zweier Browser oder zweier Keywords verglichen werden.
  • Mehrere konfigurierbare Dashboards
    Es können zusätzliche Dashboards erzeugt werden, die den eigenen Wünschen angepasst werden können. Es können dabei alle Widgets eingesetzt werden.
  • Neue Reports:
    • Broswer Marktanteile (ohne Versionsnamen)
    • Vergleich Desktop – Mobile
    • Einstiegsseiten (Entry Page Titles)
    • Ausstiegsseiten (Exit Page Titles)
  • DoNotTrack Support
    Das HTTP-Header-Feld DoNotTrack wird unterstützt und ist per Default aktiviert.

Detailierte Beschreibungen und Beispielbilder zu den Neuerungen sind im Piwik Blog zu finden. Es wurden aber noch weitere Features implementiert sowie Fehler behoben. Diese sind auch im Blog beschrieben bzw. im Changelog aufgeführt.

Piwik in Version 1.7.1 erschienen

Schlag auf Schlag geht es weiter, 10 Tage nach dem Release 1.7 ist schon die Version 1.7.1 von Piwik veröffentlicht worden.

In diesem Release wurde ein neues Feature eingebaut: Man kann nun in jedem Report auswählen, wie viele Einträge in der Liste erscheinen. Die dabei gewählten Werte werden gespeichert, so dass beim nächsten Besuch wieder die gewünschte Anzahl angezeigt wird.

In den 15 abgearbeiteten Tickets wurden neben dem oben erwähnten neuen Feature auch Fehler behoben.

Achtung: Das Update hat zur Folge, dass das archive.php Script neu einen Parameter verlangt, wenn es aus einem cronjob gestartet wird. Ein bereits eingerichteter cronjob muss deshalb angepasst werden.

Piwik in Version 1.7 erschienen

Vier Monate nach dem Release 1.6 ist die Version 1.7 von Piwik veröffentlicht worden.

Aus meiner Sicht eine der wichtigsten Neuerungen sind die Grafiken, die nun in den generierten HTML- und PDF- Reports möglich sind.

Es wurden aber auch neue Auswertungen zur Verfügung gestellt, wie z.B. der Loyalty report oder der Recency report.

Die Darstellung des Dashboards kann nun konfiguriert werden. So kann die Darstellung z.B. zwei- oder vierspaltig sein anstelle der standardmässigen drei Spalten.

In den 99 abgearbeiteten Tickets wurden neben den verschiedenen Neuerungen und Verbesserungen auch Fehler behoben und Sicherheitslücken geschlossen.

An dieser Stelle einmal ein grosses Dankeschön an das Piwik Team und allen anderen, die zu Piwik beigetragen haben!

Wieviel sind 72 Brontobytes?

In einer Pressemeldung in der iX zum Dateisystem GlusterFS bin ich über die maximalen Grösse von 72 Brontobytes gestolpert. Bronto(-bytes) hatte ich bis anhin noch nie gehört. Als offizieller SI-Einheitenpräfix existiert dieser Begriff (noch) nicht, weitere Recherchen ergaben aber, dass es sich um das Präfix für 1027 (oder auch hier) handelt.
Solche unvorstellbar grossen Zahlen schreien nach einem Vergleich, um sie fassbarer zu machen.

Die zur Zeit grössten erhältlichen Festplatten fassen 4 Terabyte. Somit müssten wir 18 * 1015 Festplatten einsetzen um das Dateisystem an das Limit zu bringen:

(72 * 1027) / (4 * 1012) = 18 * 1015

Wenn wir nun Server einsetzen, in denen wir auf einer Bauhöhe von 2 Units 12 Festplatten benutzen können und ein herkömmliches Rack mit 42 Units einsetzen können wir in einem Rack 21 Server einsetzen. Das Rack benötigt eine Standfläche von 0,6 m2. Dann benötigen wir für alle Racks (Seite an Seite und Tür an Tür) 42 * 106 km2 Standfläche:

(18 * 1015) / (12 * 21) * 0.6 m2 = 42 * 1012 m2 = 42 * 106 km2

Die Schweiz hat eine Fläche von ca. 42’000 km2. Daraus folgt, dass wir 1000 mal die Fläche der Schweiz benötigen würden, um alle Server aufzustellen.

Europa hat eine Fläche von 10,18 * 106 km2. Demzufolge wäre mehr als 4 mal die Fläche von Europa nötig für alle Server.

Zur Zeit wäre das Ausreizen des Dateisystems also noch ein Platzproblem, auch bei einem durchgängig vierstöckigen Rechenzentrum würde ganz Europa durch das Rechenzenter bedeckt.

Piwik in c’t 4/2012

Die aktuelle c’t (Ausgabe 4/2012) beinhaltet den Artikel „Tiefen-Analyse“ zum Thema Web-Analytics. Er behandelt zum einen Google Analytics, stellt aber auch verschiedene komerzielle und freie Alternativen vor, unter anderem auch Piwik. Daneben werden aber auch noch Heatmap-Dienste und -Programme vorgestellt. Dabei handelt es sich um Auswertungen, auf welche Elemente der Webseite die Benutzer am Häufigsten klicken. So können Schwachstellen der Webseite (z.B. schlecht erkennbare Links oder Elemente, die von Benutzern als Links wahrgenommen werden, aber keine Links sind) noch besser erkannt werden.
Der Artikel ist keine umfassende Marktanalyse und auch kein detaillierter Test, gibt aber einen guten Überblick über verschiedene Dienste und spricht auch die Datenschutzproblematik an.

Google Analytics vs. Piwik vs. Advanced Web Statistics

… oder „Traue keiner Statistik, die Du nicht selber gefälscht hast!“

Ich habe die Zugriffe auf meine Webseite und mein Blog mit Google Analytics zählen und analysieren lassen. Um die Daten nicht mehr der „Datenkrake“ anzuvertrauen habe ich ich nach einer Alternative umgeschaut und bin mit Piwik fündig geworden.

Auf verschiedenen Webseiten wurden die Dienste auch schon verglichen, z.B. von Alexander Langer, bei hackthenet.de und Tobsolution.

Ich wollte die Daten über einen Monat mit beiden Diensten aufzeichnen lassen und dann die Resultate vergleichen, um zu schauen ob ich Piwik als Ersatz für Google Analytics einsetzen kann. Zudem wollte ich die Daten mit den Zahlen von Advanced Web Statistics vergleichen, die von Hostpoint für meine Seiten erfasst werden.

Hier die Daten der letzten zwei Monate (April und Mai 2010):

 

April 2010

 

Mai 2010

Kriterium

AWStats

Google Analytics

Piwik

 

AWStats

Google Analytics

Piwik

Besucher

1059

946

1003

 

1024

868

947

Zugriffe

13048

     

12383

   

Browser

Firefox

8412

655

663

 

7114

561

583

IE

3117

192

214

 

3450

186

218

Chrome

478

41

40

 

531

47

48

Opera

791

40

72

 

794

45

63

Safari

151

13

13

 

308

22

22

Mozilla

96

3

 

149

4

SeaMonkey

2

1

 

2

2

Andere

3

 

37

1

11

Betriebssystem

Windows 7

3484

319

323

 

3194

264

276

Windows Vista

1288

85

88

 

1367

97

97

Windows XP

7001

463

513

 

6713

432

489

Windows 2000

175

8

7

 

94

4

4

Windows Server 2003

118

8

8

 

135

12

13

Linux

642

41

43

 

462

34

33

MacOS

265

20

20

 

295

21

21

Andere

45

2

1

 

106

4

14

Auflösungen

1280×1024

 

244

282

   

221

260

1680×1050

 

171

182

   

132

149

1920×1080

 

138

140

   

102

105

1920×1200

 

99

98

   

70

69

1280×800

 

70

68

   

84

95

1440×900

 

45

51

   

57

55

1024×768

 

45

49

   

55

55

1600×1200

 

37

33

   

38

45

1366×768

 

16

15

   

17

10

1400×1050

 

13

13

   

9

             

Suchmaschinen

Google

516

423

374

 

553

427

437

Bing

 

1

1

       

Ecosia

   

1

       

AllTheWeb

1

1

1

       

Yahoo!

11

     

2

   

Swik

7

     

11

   

Scroogle

1

           

Yandex

1

     

2

   

search

         

4

 

Conduit.com

           

2

ICQ

           

2

Andere Unbek.

       

9

   

Als Erstes fallen die stark unterschiedlichen Werte zwischen der statischen Methode (Advanced Web Statistics) und den dynamischen Methoden auf. Dies ist ganz stark auf die Methode zurückzuführen, da bei Google Analytics und Piwik nur die Seiten gezählt werden, die auch den entsprechenden Tracking-Code beinhalten. Advanced Web Statistics zählt zum Beispiel auch die Zugriffe auf die Administrations-Seiten des CMS, die durch die dynamischen Methoden nicht gezählt werden, da sie auch nicht relevant sind.

Advanced Web Statistics erfasst zudem die Browser pro Zugriff, das heisst es werden auch die Zugriffe auf die Bilder, CSS etc. in die Statistik miteinbezogen, was die stark unterschiedlichen Werte erklärt.

Wie schon andere (z.B. Fabian Letscher oder beim web.dev.blog) festgestellt haben, unterscheiden sich die Werte zwischen Google Analytics und Piwik teilweise stark voneinander. Während sich Unterschiede zwischen den Tagen noch mit unterschiedlichen Zeitzonen erklären lassen kann über die anderen Unterschiede nur spekuliert werden.

Möglicherweise werden nicht alle Search-Bots erkannt bzw. werden die Browser anders erkannt (andere Keywords in der Browser-Kennung). Was noch auffällig (wenn vielleicht auch nur zufällig) ist, sind die besseren Werte für Google Chrome gegenüber Opera bei Google Anlaytics, währenddessen bei Piwik (und im Verhältnis gerechnet auch bei Advanced Web Statistics) Opera bessere Werte erreicht. Ein Schelm, wer böses dabei denkt…

Was auch noch auffällt ist die starke Streuung der Suchmaschinen, welche als Quellen für die Besuche angegeben sind.

Fazit:
Die Verhältnisse zwischen den Werten (z.B. Browser-Verteilung, Auflösung etc.) sind bei den drei Statistiken in etwa gleich, was für mich die relevanteste Aussage ist. Welche Statistik nun „stimmt“ kann nicht abschliessend geklärt werden, da die Berechnungskriterien nicht transparent sind. Das Google aber sowohl Browser als auch Statistik liefert hinterlässt aber mindestens ein Fragezeichen bei der „Wahrheit“ der Statistik.