
Einleitung
Dieses wird ein längerer Artikel und wahrscheinlich regelmäßig upgedatet. Ich gehe davon aus, dass die Erfahrungen, die ich in den letzten anderthalb Jahren gemacht habe, nicht so ungewöhnlich sind und eventuell weiterhelfen können.
Um was es geht…
Auf meiner Seite befindet sich ein Artikel, der sich seit seinem Erscheinen einer hohen Zugriffszahl erfreut.
Es handelt sich um den dritten Teil eines dreiteiligen Artikels. In diesem schildere ich, was sich bereits auf der Webseite tat, und wie sie sich entwickeln wird.
Hier findet sich der Artikel: https://notsourban.com/das-alles-ist-erst-der-anfang-teil3
Der Inhalt ist wahrscheinlich nur dann interessant, wenn man mir beständig folgt, oder schon vertraut ist, mit dem was ich mache. Es ist ein Resumee und kurzer Ausblick. Für sich bringt der Artikel nicht viel. Er benötigt die beiden Teile davor. Das es viele Menschen gelesen habe, bezweifle ich. Ein großes Interesse daran wird ebenfalls nicht bestehen.
Es ist relativ normal, dass sogenannte Kommentarspammer die ersten sind, die meine Seiten, Beiträge und Artikel nach Angriffsflächen scannen. Ihr Anliegen ist es, innerhalb der Kommentar einen Link auf bestimmte Produkte zu hinterlassen.
Es wird dabei von folgender Logik ausgegangen: Je öfter ein Link auf Webseiten auftaucht, umso relevanter ist er für Google, und um so höher taucht er in der Suchmaschine auf. Schafft es also jemand, dass seine Seite mit seinem Produkt auf 1000 Webseiten verlinkt ist (und da ist es grundsätzlich egal, ob das in Kommentaren ist), dann taucht dieses Produkt/dieser Link prominent in den Suchmaschinen auf. Google hat hier schon verschiedene Mechanismen, um das zu verhindern, aber nicht alle greifen.
Früher beschränkten sich diese Kommentare rein auf den Link. Das ist aber sehr schnell zu durchschauen. Für Google, aber auch für die Webseiten-Betreiber*Innen. Ist nur ein Link in einem Kommentar, dann ist klar, es handelt sich wohl um Spam. Deswegen werden diese Kommentare mittlerweile mit sehr viel Text verkleidet. Meistens handelt es sich wahllos um Wikipedia-Texte oder Inhalte von anderen Blogs. Das heißt, der Link wird sinnlos innerhalb eines langen Textes eingefügt, und der Text als Kommentar unter einem Artikel platziert. Gelingt das einmal, also kommt es zu keiner Fehlermeldung, dann wird diese Seite bzw. dieser Artikel immer wieder genutzt.
Bei mir wurde ein Artikel also für ca. 36.000 Spam-Kommentare mit je 700 Wörter genutzt. Im Jahr. Das heißt, wenn ich mir den Quatsch anschaue, dann kann ich am Tag minutenlang durchscrollen, weil sich dann weit über 100 Kommentare da finden. Die Zahl ist nicht jeden Tag gleich, die Adressen der Absender ändern sich, die Schlagzahl ist also variabel.
Die Aussage von befreundeten Blogger*innen ist, dass ich das wahrscheinlich triggern würde, sonst käme es ja wohl nicht zu solchen hohen Zahlen. Das ist Humbug. Kein Mensch darf sich auf eine solche Diskussion einlassen. Man triggert sowas nicht. Die WordPress-Kommentarfunktion ist der Anziehungspunkt. WordPress selber bietet nur sehr rudimentäre Schutzfunktionen. Das hat auch mit dem Datenschutz zu tun. WordPress kann natürlich Kommentare verhindern bzw. erst nach ausdrücklicher Genehmigung freigeben. Das sollte man sowieso immer einstellen. Niemand sollte ohne ausdrückliche Genehmigung einen Erstkommentar hinterlassen können.
Was kann man dagegen tun?
Aber ansonsten empfiehlt es sich Akismet (nicht kompatibel mit der DSGVO) oder die AntiSpamBee zu nutzen. Beide Tools finden sich in dem Plugin-Verzeichnis von WordPress und können darüber installiert werden. Die Funktion solcher Tools ist in der Regel: Kommentare werden mit den internen Datenbanken und einem Algorithmus abgeglichen, ob ihre Herkunft, ihr Inhalt oder ihre Frequenz auf Spam schließen lassen. Dann werden sie, falls verdächtig als Spam kategorisiert, und entsprechend gekennzeichnet. Sie bleiben in WordPress ,für Besucher unsichtbar, vorhanden und können von den Seiten-Administratoren gelöscht oder freigegeben werden. Die 36.000 Kommentare wurden also nie veröffentlicht. Wären sie das, dann wäre meine Seite wahrscheinlich bei Google als problematisch eingestuft worden, weil sie permanent für Potenzmittel wirbt, obwohl sie andere Inhalte zum Thema hat (das nur so nebenbei).
Was kann man sonst noch tun?
Der Punkt ist: Setzt man solche Tools ein, dann verhindert man die Veröffentlichung dieser Kommentare. Das bedeutet, das Problem liegt im Maschinenraum der Webseite und Besucher und Suchmaschinen bekommen nichts mit. Damit ist man optisch im Reinen. Nerven tut es dennoch. Denn es verändert die Zugriffsstatistik dramatisch. Nun ist es zwar möglich, dieses Thema auszublenden und sich der +1000 Zugriffe pro Tag zu erfreuen, weil man sich populär wähnt, aber es handelt sich ja nicht um Menschen, die lesen, sondern um einen Server irgendwo am anderen Ende der Welt, der gerade mit Deiner Seite Geld verdient.
Während für deinen Provider oder Dich Kosten entstehen. Denn dein Traffic nimmt zu, ohne dass es tatsächlich von Vorteil ist. Dieser Traffic kann durchaus pro Tag bis zu 1 GB betragen. Was, je nach Seite, nicht viel ist, aber für kleine Blogger manchmal schon eine erstaunliche Menge. Das heißt 30 GB Traffic im Monat für Spam, 360 GB im Jahr. Hier läppert sich also etwas zusammen, dass unter Umständen – hochgerechnet auf viele tausend Seiten – ein Problem darstellt.
Wer nun glaubt, da gäbe es bestimmt ein Interesse (von Suchmaschinen, von Providern, Hostern etc.) diesem Einhalt zu gebieten, hat natürlich recht. Klar, das gibt es, aber das ist nicht so einfach. Aufgrund von nationalen und internationalen Datenschutzrechten verbietet es sich seinen Besuchern bis auf die Haustüre zu rücken. Das heißt, Metainformationen bis hinunter auf die IP-Adresse und andere Daten zur Bestimmung, wer wann und warum auf die Seite geht, darf man so einfach nicht mehr erheben. Somit bleibt es meist sehr unbestimmt, wo sich diese Spammer *Innen befinden.
Ich gehe zum Beispiel davon aus, dass mein Fanbase, die mich mit diesen Riesen-Kommentaren überdeckt, irgendwo in Asien sitzt, da ein großer Teil des Spams auch in fremdländischen Schriftzeichen und Sprachen ist. Beweisen kann ich es nicht, weil die zugänglichen Informationen, die ich erhalte, quasi gewürfelt sind. Keine einheitliche IP, keine einheitliche Mailadresse (sondern alle aus einem existenten Pool von wahrscheinlich mehreren Millionen).
Da es sich immer nur um eine Seite handelt, die angegriffen wird (obwohl sich diese Technik als sehr flexibel erweist), habe ich einfach mal den Permalink der Seite geändert. Das war eine nette Idee, allerdings ist bei mir eine Permalink-Weiterleitung integriert, damit es bei plötzlichen Änderungen der Links nicht zu Fehlern kommt. Das ist wichtig, notwendig und eigentlich ein Sicherheitsfeature. Hier fällt es mir in den Rücken. Ich kann die Seite für meine wildgewordenen Besucher aus dem Bereich der Robotik also nicht unsichtbar machen.
Was ich heute gemacht habe (27.05.2020)
Hier beginnt nun das Protokoll, dass ich in den nächsten Tagen, vielleicht Wochen und Monate weiterführe.
Ganz profan habe ich für genau diese eine Seite die Kommentarfunktion temporär ausgeschaltet. Erfahrungsgemäß werden jetzt die IT-Kolleg*innen in den fernen Landen mit einer Fehlermeldung konfrontiert.
Ich gehe davon aus, dass sie daraufhin meine Seite erneut scannen werden und neue Angriffspunkte suchen. Das wird wahrscheinlich automatisiert und sehr schnell passieren. Kommentarspammer*innen lesen in der Regel, nach meiner Einschätzung, RSS-Feeds mit und nutzen diese.
Ich habe auf meiner Seite zwei unterschiedliche RSS-Feeds. Einen für meine schriftlichen Beiträge, einen für meine Podcasts. Da sich die schriftlichen Beiträge in dem normalen, regulären WordPress-RSS-Feeds, der sofort offensichtlich ist, finden, werden nur diese angegriffen. Die Podcasts, die eigentlich genauso aufgebaut sind, aber einen anderen Feed benutzen, wurden noch nie mit Kommentarspam versehen. Ebenfalls ist auf jeder festen Seite von mir eine Kommentarmöglichkeit gegeben. Kein RSS-Feed für diese Seiten, kein Spam. Spam gibt es nur auf Seiten, die einen klar erkennbaren, logischen RSS-Feed haben, wie er auf WordPress üblich ist.
Werden neue Seiten veröffentlicht, dann wird die interne Verlinkung der Seite nach Relevanz gecheckt und eine Seite mit vielen Links bekommt die höchste Beachtung. Spammer*Innen haben ihr SEO-Wissen gepaukt und sind damit sicherlich sehr, sehr nahe an der Arbeit der Suchmaschinen.
Der Artikel, der bei mir im Focus stand (und seit heute keine Möglichkeit mehr für Kommentare hat) hatte – bedingt durch den Rückblick – wahrscheinlich die höchste Anzahl Links.
Update 27.05.2020:
Wenig Minuten nachdem die Kommentarfunktion in einem Artikel gesperrt wird, weicht man aus auf den nächsten. Entwickelt sich also zum Katz und Mausspiel.
Aktuell wurde angegriffen: https://notsourban.com/alles-was-ich-bis-jetzt-ueber-podcasts-weiss-und-vorher-nicht-mal-geahnt-habe-teil-2
Auch hier ist nun die Kommentarfunktion gesperrt.
Update 27.05.2020 (3 Stunden später)
Der Spam ist auf 0 gesunken. Jedoch nicht der Traffic. Das bedeutet, an besagten Artikeln wird immer noch angeklopft und getestet, ob es funktioniert.
Nun bleibt es spannend, ob und wann man auf der anderen Seite reagiert. Die Zugriffszahlen steigen wie gewohnt, die Frequenz bleibt bei beiden (bisher angegriffenen) Seiten. Der Einstieg scheint direkt. Jedoch findet sich kein Kommentar im Spamfilter.
Update 28.05.2020 (über 24 Stunden später)
Aktuell finden sich 5 (wahllos gestreute) Spamkommentare anderer Art (teilweise deutsch) in meinem Filter. Normal wären in diesem Zeitraum schon mehrere hundert Eintragungen zu finden. Traffic blieb weitgehend gleich, Last nahm allerdings ab.
Update 30.05.2020
Die Spam-Skripts sind noch nicht upgedatet, das heißt, ich habe in den letzten 48 Stunden lediglich 2 (!) Spam-Kommentare erhalten. Ich zeige euch mal, wie das grafisch aussieht. Jeder Punkt ist ein Tag.

(Ich halte euch auf dem Laufenden, was heute und in den nächsten Tagen passiert.)
One Reply to “36.000 Spam-Kommentare mit je 700 Wörtern”