… oder „Traue keiner Statistik, die Du nicht selber gefälscht hast!“
Ich habe die Zugriffe auf meine Webseite und mein Blog mit Google Analytics zählen und analysieren lassen. Um die Daten nicht mehr der „Datenkrake“ anzuvertrauen habe ich ich nach einer Alternative umgeschaut und bin mit Piwik fündig geworden.
Auf verschiedenen Webseiten wurden die Dienste auch schon verglichen, z.B. von Alexander Langer, bei hackthenet.de und Tobsolution.
Ich wollte die Daten über einen Monat mit beiden Diensten aufzeichnen lassen und dann die Resultate vergleichen, um zu schauen ob ich Piwik als Ersatz für Google Analytics einsetzen kann. Zudem wollte ich die Daten mit den Zahlen von Advanced Web Statistics vergleichen, die von Hostpoint für meine Seiten erfasst werden.
Hier die Daten der letzten zwei Monate (April und Mai 2010):
|
April 2010
|
|
Mai 2010
|
Kriterium
|
AWStats
|
Google Analytics
|
Piwik
|
|
AWStats
|
Google Analytics
|
Piwik
|
Besucher
|
1059
|
946
|
1003
|
|
1024
|
868
|
947 |
Zugriffe
|
13048
|
|
|
|
12383
|
|
|
Browser
|
Firefox
|
8412
|
655
|
663
|
|
7114
|
561
|
583
|
IE
|
3117
|
192
|
214
|
|
3450
|
186
|
218
|
Chrome
|
478
|
41
|
40
|
|
531
|
47
|
48
|
Opera
|
791
|
40
|
72
|
|
794
|
45
|
63
|
Safari
|
151
|
13
|
13
|
|
308
|
22
|
22
|
Mozilla
|
96
|
3
|
|
|
149
|
4
|
|
SeaMonkey
|
|
2
|
1
|
|
|
2
|
2
|
Andere
|
3
|
|
|
|
37
|
1
|
11
|
Betriebssystem
|
Windows 7
|
3484
|
319
|
323
|
|
3194
|
264
|
276
|
Windows Vista
|
1288
|
85
|
88
|
|
1367
|
97
|
97
|
Windows XP
|
7001
|
463
|
513
|
|
6713
|
432
|
489
|
Windows 2000
|
175
|
8
|
7
|
|
94
|
4
|
4
|
Windows Server 2003
|
118
|
8
|
8
|
|
135
|
12
|
13
|
Linux
|
642
|
41
|
43
|
|
462
|
34
|
33
|
MacOS
|
265
|
20
|
20
|
|
295
|
21
|
21
|
Andere
|
45
|
2
|
1
|
|
106
|
4
|
14
|
Auflösungen
|
1280×1024
|
|
244
|
282
|
|
|
221
|
260
|
1680×1050
|
|
171
|
182
|
|
|
132
|
149
|
1920×1080
|
|
138
|
140
|
|
|
102
|
105
|
1920×1200
|
|
99
|
98
|
|
|
70
|
69
|
1280×800
|
|
70
|
68
|
|
|
84
|
95
|
1440×900
|
|
45
|
51
|
|
|
57
|
55
|
1024×768
|
|
45
|
49
|
|
|
55
|
55
|
1600×1200
|
|
37
|
33
|
|
|
38
|
45
|
1366×768
|
|
16
|
15
|
|
|
17
|
10
|
1400×1050
|
|
13
|
13
|
|
|
9
|
|
…
|
|
|
|
|
|
|
|
Suchmaschinen
|
Google
|
516
|
423
|
374
|
|
553
|
427
|
437
|
Bing
|
|
1
|
1
|
|
|
|
|
Ecosia
|
|
|
1
|
|
|
|
|
AllTheWeb
|
1
|
1
|
1
|
|
|
|
|
Yahoo!
|
11
|
|
|
|
2
|
|
|
Swik
|
7
|
|
|
|
11
|
|
|
Scroogle
|
1
|
|
|
|
|
|
|
Yandex
|
1
|
|
|
|
2
|
|
|
search
|
|
|
|
|
|
4
|
|
Conduit.com
|
|
|
|
|
|
|
2
|
ICQ
|
|
|
|
|
|
|
2
|
Andere Unbek.
|
|
|
|
|
9
|
|
|
Als Erstes fallen die stark unterschiedlichen Werte zwischen der statischen Methode (Advanced Web Statistics) und den dynamischen Methoden auf. Dies ist ganz stark auf die Methode zurückzuführen, da bei Google Analytics und Piwik nur die Seiten gezählt werden, die auch den entsprechenden Tracking-Code beinhalten. Advanced Web Statistics zählt zum Beispiel auch die Zugriffe auf die Administrations-Seiten des CMS, die durch die dynamischen Methoden nicht gezählt werden, da sie auch nicht relevant sind.
Advanced Web Statistics erfasst zudem die Browser pro Zugriff, das heisst es werden auch die Zugriffe auf die Bilder, CSS etc. in die Statistik miteinbezogen, was die stark unterschiedlichen Werte erklärt.
Wie schon andere (z.B. Fabian Letscher oder beim web.dev.blog) festgestellt haben, unterscheiden sich die Werte zwischen Google Analytics und Piwik teilweise stark voneinander. Während sich Unterschiede zwischen den Tagen noch mit unterschiedlichen Zeitzonen erklären lassen kann über die anderen Unterschiede nur spekuliert werden.
Möglicherweise werden nicht alle Search-Bots erkannt bzw. werden die Browser anders erkannt (andere Keywords in der Browser-Kennung). Was noch auffällig (wenn vielleicht auch nur zufällig) ist, sind die besseren Werte für Google Chrome gegenüber Opera bei Google Anlaytics, währenddessen bei Piwik (und im Verhältnis gerechnet auch bei Advanced Web Statistics) Opera bessere Werte erreicht. Ein Schelm, wer böses dabei denkt…
Was auch noch auffällt ist die starke Streuung der Suchmaschinen, welche als Quellen für die Besuche angegeben sind.
Fazit:
Die Verhältnisse zwischen den Werten (z.B. Browser-Verteilung, Auflösung etc.) sind bei den drei Statistiken in etwa gleich, was für mich die relevanteste Aussage ist. Welche Statistik nun „stimmt“ kann nicht abschliessend geklärt werden, da die Berechnungskriterien nicht transparent sind. Das Google aber sowohl Browser als auch Statistik liefert hinterlässt aber mindestens ein Fragezeichen bei der „Wahrheit“ der Statistik.