Analytics Spam – so geht man damit um

Copyright @ istock / grinvalds
Spam-Aufrufe in Google Analytics können mitunter eine nervige Angelegenheit sein. Nachdem es sich um „unechten“ Traffic handelt, sehen die Daten, die generiert werden, zwar nett aus, aber das war’s auch schon. Eine richtige Auswertung der Analytics Daten ist dank „not-provided“ etc. schon mühsam genug, da brauchen wir nicht auch noch Fake-Aufrufe, die unsere Daten zusätzlich verfälschen. Also: Wie kann dem Spam Einhalt geboten werden?
Was ist Google Analytics Spam?
Bekommt eine Seite viele Aufrufe, die nicht über einen authentischen User generiert werden, dann ist das Spam. Es gibt hierbei verschiedene Arten von Spam, die man unterscheiden sollte:
Der Referral Spam
Das Interessante am Referral Spam ist, dass die Website nie tatsächlich aufgerufen wird, sondern hier einfach der Google Analytics Trackingcode einer Seite auslöst wird. Das funktioniert über das Google Analytics Measurement Protocol, mit dem man Nutzerdaten direkt an die Google Analytics Server schicken kann. Das machen sich die Spammer zunutze, um ihre eignen Spam-Daten zu schicken. Der größte Teil des Analytics Spam stammt von solchen Referrals.
Beispiele für Referral Spam:
website-analytics.online / referral
us12.campaign-archive2.com / referral
hi-com.de / referral
playerindex.de / referral
localhost:9999 / referral
Der Crawler Spam
Bei Crawler Spam wird eine Domain tatsächlich besucht. Einen Crawler kann man sich wie einen Bot (z.B. von Google) vorstellen, der die Seite besucht und dabei Daten, die denen eines normalen Users ähneln, hinterlässt. Crawler sind schwerer zu identifizieren, weil sie in den Daten oft wie legitime, verweisende Seiten aussehen.
Der „Sprach-Spam”
Spam kann an vielen verschiedenen Stellen auftauchen – beispielsweise über ein Keyword oder sogar als direkter Zugriff. Der neueste Trend ist „Sprach-Spam“.
Dabei wird anstatt einer bestimmten Sprache wie „de“ oder „en-us“ etwas Anderes angezeigt. Im Unterschied zu den vorher vorgestellten Spam-Maßnahmen, hat er aber eine vergleichsweise niedrige Bounce Rate und lange Verweildauer. Bei den üblichen Spam-Besuchen wird die Seite sehr oft aufgerufen und gleich wieder verlassen, weshalb die Absprungrate sehr hoch und die Verweildauer extrem kurz ist.

Und so wird man den Spam los
Es gibt zwei Schritte, die man abschließen muss, um sowohl seine historischen als auch die zukünftigen Daten zu bereinigen. Nicht jeder Schritt eignet sich für alle Arten von Analytics Spam. Und bevor man anfängt, an seinem Google Analytics Account herumzuschrauben, sollte man eine ungefilterte Ansicht behalten.
Referral Spam beseitigen
Wie oben bereits beschrieben funktioniert der Referall Spam, indem er einen Google Analytics Trackingcode simuliert. Nachdem Seiten, die hier aufgerufen werden, meistens nach dem Zufallsprinzip ausgewählt werden, wird bei der Übermittlung der Codes meistens ein falscher oder gar kein Hostname mitgeschickt.
Der Hostname ist normalerweise die URL der eigenen Website, daher kann man darüber sehr einfach den Filter setzen. Dieser schließt dann automatisch alle Zugriffe aus, bei denen kein Hostname gesetzt war oder bei denen ein falscher Hostname verwendet wurde.
Crawler Spam beseitigen
Crawler kann man entweder über Analytics blocken über die .htaccess Datei sperren. Sind die Bots in der .htaccess Datei gesperrt, können sie die Seite überhaupt nicht mehr ansurfen. Dies ist jedoch meistens sehr mühsam, da die Bots schnell und häufig abgeändert werden.
Wem es zu heikel ist, etwas an seiner .htaccess Datei zu ändern, kann die Crawler beispielsweise auch in Analytics gleich bei der Erstellung der neuen Datenansicht rausfiltern. Es gibt dafür noch weitere Möglichkeiten, aber diese ist eine der einfachsten.
Auf der Seite https://www.iab.com/guidelines/iab-abc-international-spiders-bots-list/ gibt es eine ausführliche Liste aller bekannter Bots, an welcher sich auch Google orientiert.
Sprach Spam beseitigen
Wenn die Sprache einmal aufgetaucht ist, kann man sie aus seinen historischen Daten nicht mehr entfernen. Um die falschen Sprach-Daten dennoch loszuwerden, können Segmente verwendet werden. In dem Segment wird die falsche Sprache als „enthält nicht“ angelegt und dann gespeichert.
Für jeden zukünftigen Sprach Spam kann man ebenfalls Filter verwenden. Der Filter, der sich in diesem Fall anbietet, entfernt alles, was mehr als zehn Silben hat, aus den Sprach-Daten. Die Sprach-Kürzel enthalten normalerweise nicht mehr als circa 6 Silben. Außerdem kann man alle Symbole ausschließen, die bei einer normalen Anfrage nicht vorkommen (z.B. Komma, Ausrufezeichen, usw.).
Fazit: Darum sollte Analytics Spam beseitigt werden
Der Ausschluss von Spam hat keine negativen Auswirkungen auf die Rankings, denn die spammigen Aufrufe haben auch keinen positiven Einflüsse. Die Absprungrate sieht zwar vielleicht nicht mehr so niedrig aus wie vorher. Allerdings erschien diese durch die Zugriffe ohnehin positiver als es durch normale User der Fall wäre. Und die normalen User sind schließlich diejenigen, für die wir eine Seite optimieren sollten. Also raus mit dem Spam und richte den Fokus lieber auf die tatsächlichen User Signale.
Keine Kommentare vorhanden