Was ist Referrer Spam?

Referrer Spam bekämpfen

Referrer Spam Grafik

Referrer Spam ist eine negative SEO Taktik. Diese Art von Spam ist bei den meisten Internetnutzern weniger bekannt, weil die meisten keine eigene Webseiten betreiben und jene, die vielleicht eine eigene Website haben, nicht immer das nötige technische Wissen haben, Referrer Spam zu erkennen. Der Schaden, der aber hierdurch entstehen kann, ist trotzdem nicht weniger gering.

Wie äußert sich Referrer Spam?

In den Server Logs und manchmal auch in den Google Analytics Daten, tauchen Webseiten als Referrer auf, bei denen kein wirklicher Link zur Seite gesetzt ist. Der Black-Hat SEO Spammer spekuliert darauf, dass dieser Referrer als Html-Link in den Statistik Logfiles des Servers für die Suchmaschinen sichtbar abgespeichert wird. Der Angreifer nutzt hierfür einen Bot/Crawler, dessen Referrer künstlich in die Internetadresse des Spammers verändert wurde und crawlt das Netz nach öffentlichen Serverlogfiles ab. Diese Spambots ignorieren die Robots.txt Datei. Schon bei diesem Vorgang werden die Spam-Links in den Serverlogfiles erzeugt. Vor kurzem wurde über das angebliche SEO-Tool semalt.com solche Attacken ausgeführt, wie  incapsula.com berichtete.

Bei den meisten Hosting-Angeboten sind die Serverlogfiles nicht öffentlich. Bei selbst verwalteten Servern kann das jedoch anders sein. Fakt ist, Referrer Spam verzerrt die Serverstatistik und nervt vor allem und kostet er dem Webmaster Arbeitszeit. Bei manchen Hostingangeboten kostet er sogar bares Geld, nämlich immer dann, wenn für den Traffic, den eine Seite erzeugt eine Gebühr anfällt. Deswegen suche ich mir immer einen Hostinganbieter mit einer Traffic-Flatrate für meine Webprojekte aus. Wer hier am falschen Ende spart, kann durch Referrer-Spam-Attacken nachher draufzahlen.

Warum findet Referrer Spamming statt?

Der Angreifer spekuliert darauf Links in den Statistik Logs, zu setzen. Der Black-Hat SEO möchte also durch die Webspam Links seine Suchmaschinenposition steigern. Vielleicht möchte er auch nur eine bestimmte Zielgruppe (Webadmins, Internetaffine) auf einen Service aufmerksam machen. Manche Verweislinks schaue ich auch aus Neugier an. Das werden sicherlich auch Andere machen.

Google wertet nicht nur die Links, die auf die eigene Seite zeigen, sondern auch die Webseiten auf die verwiesen wird. Wenn jetzt eine Domain auf zwielichtige oder gar illegale Seiten verweist, ist das für Google eine negatives Ranking Signal und kann zur Abstrafung führen. So liegt es also nahe, Referrer Spam-Attacken für Negative SEO zu missbrauchen. Der Angreifer möchte also die Opferseite in ein negatives Licht bei Google stellen. Google spricht hier von der Bad Neigborhood einer Domain.

Eine weiterer Grund könnte natürlich eine “Neagtiv-SEO-Attacke” sein, in dem negative User-Signale auf Seiten von Wettbewerbern erzeugt werden.  In Zeiten von Panda-Updates, ist das User-Verhalten wichtig um die Qualität einer Seite zu beurteilen.  Die Taktik ist folgende:

  1. Die Webmaster sehen einen Link als Referrer in ihrer Statistik und klicken vor Neugierde auf diesen Link
  2. Auf der Ziel Seite finden sie den Backlink zu ihrer Seite nicht und bouncen zurück.
  3. Google bekommt so ein schlechtes Signal durch den Google Chrome Browser, Toolbar oder durch Google Analytics mit
  4. Google misst eine sehr niedrige Verweildauer auf einer bestimmten Seite und bewertet die Qualität einer Seite weniger gut.

Was kann ich gegen Referrer Spam tun?

Im Fall der Fälle würde ich bei WordPress zusätzlich per Robots.txt das Verzeichnis wp-admin für den Googlebot sperren lassen. So kann auch die Ausgabe eines Links durch ein WordPress Plug-in zwar nicht verhindert werden, aber Google wertet diesen Link nicht, weil der Google Crawler dann einen Bogen um dieses Verzeichnis macht. Dann können geplagte Webmaster regelmäßig die Serverlogfiles leeren.Zusätzlich gibt es auch ein paar tolle Plugins für WordPress, mit denen ich bestimmte IPs oder ganze IP-Bereiche und Domainendungen sperren kann, dazu aber später mehr.

IP-Adressen, IP-Bereiche und Domainnamen per .htaccess ausschließen

Wer seinen Server vor Zugriffen schützen möchte, kann dies über die .htaccess tun. Das ist die ressourcensparendere Variante, denn ein zusätzliches WordPress Plugin kostet ja auch Speicher . Bevor wir jedoch aktiv werden können, müssen wir wissen mit wem wir es zu tun haben. Dafür habe ich Folgende Links unten aufgeführt.

Woher kommen meine Zugriffe/Referrer?

Mit utrace.de kann man den Ursprungsort eines Besuchers feststellen und über ripe.net kann man herausfinden welcher Provider der Besucher nutzt. Zudem werden hier auch die IP-Bereiche angezeigt, die der Provider des Benutzters nutzt. Das kann eine sehr nützlich Zusatzinfo sein.

https://www.utrace.de/

https://apps.db.ripe.net/search/

Alle Domains einer Server-IP herausfinden

Bevor ich gleich eine ganze IP-Sperre ist es ratsam zu schauen, in welcher Nachbarschaft sich die Spamdomain befindet. Mit yourgetsignal.com kann ich also herausfinden welche Domains eine bestimmte IP-Adresse verwenden. Ihr werdet staunen, wie viele weitere Webseiten die gleiche IP Adresse haben, und das müssen nicht immer Spamprojekte sein, sondern können auch wirklich sehr gute Seiten sein, von denen Ihr ein Link haben wollt.

https://www.yougetsignal.com/tools/web-sites-on-web-server/

Natürlich kann ich dieses Tool auch beim Linkbuilding nutzen, um zu schauen, ob man nicht vielleicht schon einen Link von einer Domain mit gleicher IP-Adresse bekommen hat. ;-)

 .htaccess Einträge

# Datei zum Regeln von IP-Bereichen
Order deny,allow
Deny from .doofedomain.ru
Deny from 46.119.
Allow from 146.52.75.230

Die Zeile “Order deny,allow” signalisiert dem Webserver, dass er bestimmte Zugriffe auf dem Server zulassen oder erlauben soll. Mit der Angabe “deny from” drückt man aus, das der Server einen Zugriff verwehren soll. Im oberen Beispiel werden alle Nutzer, die mit der Kennung “doofedomain.ru” surfen ausgesperrt.Auch alle Nutzer, die aus dem IP-Bereich “46.119.” kommen sehen die Webseite nicht mehr. Mit “allow from” kann ich eine positiv Liste aufbauen, in diesem Beispiel hat die IP-Adresse “146.52.75.230” vollen Zugriff auf die Seite.

Für die generelle Absicherung von HTML Seiten kann ich Folgendes eingeben. Zum Beispiel wenn bestimmte Webseiten nur in einem Firmennetz erreichbar sein sollen.

Order deny,allow
Deny from all

Allow from 192.168

Nur Surfer, die im Firmeneigenem Netz, deren IP Adressen mit den Nummern 192.168. anfangen, können die Webseite sehen.
Die Nutzung der .htaccess ist sehr effektiv und man sollte wissen, bevor man sie nutzt, dass man auch unschuldige Menschen von einer Webseite ausschließt. Nicht jeder Russe ist per se ein krimineller Spammer. Diesen Eindruck möchte ich jetzt nicht erwecken, von daher tendiere ich eher dazu meine Pappenheimer genau zusperren.

Webspam und Kommentarspam mit WP-Ban verhindern

Wem das alles zu technisch ist und sich nicht an die .htaccess selber wagt, dem kann ich für WordPress das Plugin WP-Ban empfehlen. Mit diesem Plugin kann ich über das WordPress Backend bestimmte IP-Adressen, IP-Bereiche, Domainnamen oder Top-Level-Domains (TLD), sperren. Das Ganze funktioniert bei mir ganz gut und als zusätzliches Gimmick wird dem Webmaster eine Statistik von verhinderten Webspam-Attacken, der jeweiligen IP-Adressen präsentiert. Nützlicher Nebeneffekt ist, wer Referrer Spam mit dem Ausschluss von IP-Bereichen bekämpft, kann sich auch vor unliebsamen Spamkommentaren schützen. Denn meistens nutzen die Black-Hat SEOs ja auch gleich Spamkommentare für Handwerk.

Nach oben scrollen