Gestern htte ich die Sperre für automatisierten Spam eingebaut und über Nacht trägt sich der Casino-Spinner per Hand ein. Super.
Damit ist jetzt auch Schluß. Alle Kommentare in denen URLs sind, die Teilstrings enthalten, die in einer Blacklist, sind werden ignoriert.
Basta.
In Anlehnung an Pepinos http://www.pepilog.de/artikel/asp-automatic-spam-protector.htm ASP habe ich mal etwas ähnliches implementiert. Das sollte zumindest automatisierten Spam fernhalten.
Das ganze ist mit der "heißen Nadel" gestrickt. Wenn jemand einen Fehler entdeckt, bitte in die Kommentare schreiben.
Informativer Artikel zum Thema "Wiki-Spam" bei Telepolis: Universelle Anti-Spam-Lösung am Horizont?.
Da habe ich doch heute im Pepilog eine noch kürzere Variante gesehen. Unter der Überschrfift:
Spammer-Onanie
fand sich folgendes(für eine .htaccess)
# Spammer mit Proxy "pinappleproxy" auf sich selbst umleiten
RewriteCond %{HTTP:VIA} ^.+pinappleproxy
RewriteCond %{HTTP_REFERER} !=""
RewriteRule ^.* %{HTTP_REFERER} [R=301,L]
Da viele der Trackbackspammer den pinappleproxy-Proxy nutzen, macht man sich diesen Umstand zu nutzen und blockt das ganze einfach mittels .htaccess.
SetEnvIfNoCase X-AAAAAAAAAAAA 1 spammer=yes
SetEnvIfNoCase Via pinappleproxy spammer=yes
SetEnvIfNoCase Referer yelucie.com spammer=yes
SetEnvIfNoCase Referer crescentarian.net spammer=yes
deny from env=spammer
Gefunden bei Isotopp
Der Poker-Spammer bewirbt 2 neue Domains:
http://poker-hands.chat-nett.com/
http://poker-online.terashells.com/
[via: Pepilog]
Nachdem ich heute morgen meinen ersten Trackbackspam hatte konnte ich mir diese ja mal genauer ansehen. Dabei viel auf, das durch die Art der beworbenen URLs uns eine Möglichkeit gegeben wurde, diesen Scheiß zu verhindern.
Da die URLs alle nur aus domain.tld bzw. subdomain.domain.tld bestehen und ein normaler Trackback entweder an der TLD noch Paremeter hat bzw. bei "schönen" URLs ein "Schwanz" in Form von TLD/Dir/Dir/blah hat, könnte man darauf abprüfen und zwischen Spam und echtem Trackback unterscheiden.
Zumindest könnte das wieder eine Zeitlang helfen.
Kommentare/Meinungen willkommen.
Sam - let's call our interviewee Sam, it's suitably anonymous - lives in a three-bedroom semi-detached house in London, drives a vintage Jaguar and runs his own company. But “it's not not all rock and roll and big money”, says Sam. What isn't? Spamming websites and blogs with text to pump up the search engine rankings of sites pushing PPC (pills, porn and casinos)...
Das gesamte Interview gibt es auf www.theregister.co.uk
[via:weblogs-wikis mailingliste]
Jetzt wird es komisch: http://www.google.com/googleblog/2005/01/preventing-comment-spam.html
In letzter Zeit werfe ich wieder häufiger einen Blick in die Apache-Logs, um zu sehen, ob meine Blogspam-Bekämpfungsmittel funktionieren.
Einmal mehr fallen merkwürdige Aktivitäten ausgehend von einer IP-Adresse auf, die laut WHOIS in Bulgarien vermutet werden kann: 82.103.65.225
Das Merkwürdige: als Client-Kennung wird der String "MSIE 5.0" gesendet, als Referer findet sich der Link "http://www.google.com" und der GET-Aufruf enthält eine komplette URL anstatt der "REQUEST_URI". Was sagt uns das?
Irgendwas stimmt mit den Bulgaren nicht! Wir behalten euch im Auge...
Glaubt man einem Eintrag im Blog "kasia in a nutshell" [1] zieht Kommentarspam anderen Kommentarspam magisch an. Gut zu wissen oder? Via intern.de. [2]
[1] http://www.unix-girl.com/blog/archives/001673.html
[2] http://www.intern.de/news/6328.html
allen Nichtspammern.
Möget Ihr ruhige spamfreie(nur was nicht das Lebensmittel betrifft) Tage haben.
So zumindest hat Moe diesen Eintrag in seinem Blog genannt. Ich bringe das hier mal als Fullqout(erlaubnis von Moe habe ich).
Jeremy Zawodny macht sich Gedanken darüber, wie das Problem mit den Kommentarspams zu lösen ist.
Dabei kommt er zu dem Schluss, daß sich die Grundproblematik ähnlich
wie bei Email verhält: Auch wenn die Erfolgsquoten nicht sehr hoch sind lohnen sich Kommentarspams dennoch, da es einfach ist und nicht viel kostet.
Er geht weiterhin davon aus, daß sich das Problem nicht auf Seiten der Blogger lösen lassen wird, da sich schätzungsweise höchstens 20% der User aktiv mit Kommentarspam und wirkungsvollen Gegenmaßnahmen
beschäftigen.
Folglich muss das Problem also auf Seiten der Systeme gelöst werden.
Zawodnys Interesse gilt hier eher den Suchmaschinen: Während ein Mensch Kommentarspam meist eindeutig als solchen identifzieren kann, sind Suchmaschinen bislang dazu nicht in der Lage. Für Zawodny würde es zunächst ausreichen, wenn Suchmaschinen in der Lage wären, Content der nicht vom Blog-Autor, sondern von anderen Usern erzeugt wird zu erkennen, und die darin enthaltenen Links zu ignorieren.
Dabei geht er von der Prämisse aus, daß sich Kommentarspams vorwiegend wegen der Vergabe von PageRank auf die beworbenen URLs lohnen.
Solange es nicht um "smarte" Erkennung von Kommentarspam auf einer individuellen Basis geht, kann dieses Problem jedoch auch auf Seiten der Publishing-Systeme gelöst werden: Wie Brad Choate in den Kommentaren anmerkt, kann die Vergabe von PageRank bereits durch einen (Google) Redirector verhindert werden.
Genau aus diesem Grund habe ich mein Weblog unlängst dahingehend modifiziert, daß alle URLs und Trackbacks in meinen Kommentaren über einen Google-Redirect laufen, welcher keinen PageRank vergibt.
An dem Verfahren wurde dahingehend Kritik geübt, daß es keinerlei Pagerank mehr für URLs in den Kommentaren vergibt, egal ob es sich nun um Spam handelt oder nicht. Weiterhin werden die Referrers nicht übergeben.
Zum Ersten kann ich nur sagen, daß es sich - solange wir keine "smarte" Erkennung von Kommentarspams haben - wohl nicht anders lösen lassen wird. Ich empfinde das aber nicht als sonderlich dramatisch, denn einerseits wird Pagerank gnadenlos überschätzt, und andererseites
handelt es sich ja "nur" um die Links in den Kommentaren. Die
Hyperlinks in den Beiträgen selbst bleiben schliesslich reguläre Links, welche nicht redirected werden.
Zum Zweiten lässt sich sagen, daß Referrers für die meisten Leute
unbrauchbar geworden sind, da sie einfach viel zu sehr zugespammt
werden. Jedes Blacklisting von Referrer-URLs oder IPs kann hier nur retroaktiv geschehen und ist daher weitestgehend sinnlos.
Durch den Einsatz eigener Redirect-Skripte müsste es aber möglich sein, den Referrer zu übertragen und dennoch keinen PageRank zu vererben. Hier sind jedoch die Techniker gefragt, da dies mein Wissen übersteigt. Was den Google-Redirector angeht, so schlägt Tom in den Kommentaren des Beitrags "Google approved PageRank stripping"
von Simon Willison vor, die eigentliche Referrer-URL einfach als Variable anzuhängen, so daß sie zumindest im Referrer der Redirector-URL sichtbar wird, zB so:
http://www.google.com/url?sa=D&q=http://www.ZielURL.com&referrer=http://www.RefURL.comGrundsätzlich lässt sich sagen, daß dieses Verfahren so oder so erst
dann Sinn machen könnte, wenn es standardmässig in Weblog-Systeme
eingebaut wird: Wenn es ab einer bestimmten Versionsnummer eines
Blog-Systems (welches dies einsetzt) einfach schlichtweg nicht mehr möglich wäre, URLs zu hinterlassen welche dann PageRank bekommen, so würden diese Systeme wohl nicht mehr gespammt werden. So zumindest die Hoffnung.
Für WordPress gibt es bereits ein Google Redirector Plugin, welches alle URLs in den Kommentaren durch den Redirector jagt und somit keinen Pagerank vergibt. Wie ich das in Nucleus gemacht habe kann ich hier ja mal bei Gelegenheit posten.
Insgesamt zahlt man zwar durch den Verzicht auf PageRank in den
Kommentaren und den Problemen mit der Übergabe korrekter Referrers
einen gewissen Preis, aber ich denke dennoch, daß es das wert sein
könnte.
Problematisch erscheint mir lediglich die Prämisse, daß sich
Kommentarspams nur wegen der Vergabe von PageRank lohnen. Vielleicht werden wir ja auch noch vermehrt Kommentarspams sehen, welche in der Tat mal auf den menschlichen User abzielen und zum Klicken animieren wollen, da es irgendein super Angebot oder gratis Pr0n gibt oder wasweissich was.
Ich sehe gerade, daß einige versucht haben sich hier anzumelden(erfolglos). Also wenn ihr hier mitmachen wollt, nehmt Kontakt mit mir auf. Entweder per Mail stebu at der-link dot de oder über das Kontaktformular in meinem Blog.
Da ja viele mit Blacklists arbeiten, habe ich mal meine WP-Installation erweitert und lasse von den Spammern bei jedem Versuch eine aktuelle Version einer .htaccess generieren. Mehr dazu in meinem Blog
Ich beobachte meine kleinen Blogspammer momentan sehr genau. Besonders häufig kommen sie über das Netz der Firma "Bulgarian Telecommunications Company Plc." (inetnum: 213.91.128.0 - 213.91.255.255). Kann das jemand bestätigen?
Gefunden im Pepilog
1. Der Formspam Guard von d.e-script.iv.
2. Turing Protection von viebrock.ca(Captcha)
Kommentar-Spam fange ich in meiner Wordpress-Installation
momentan über die Datei "wp-comments-post.php" ab. Nebenbei
logge ich mit, wer da stört. Folgende Merkwürdigkeiten sind
mir in den letzten 2 Tagen aufgefallen:
Der/die Blog-Verschmutzer versuchen COM-Domains zu promoten,
die nicht (mehr) online sind. Laut Whois gehören alle diese
Domains einem gewissen John Coleman aus New York. Mancher wird
jetzt denken: "Coleman?!? Den Namen habe ich schon mal gehört?"
Richtig! Im Zusammenhang mit der Nigeria-Connection taucht der
Name hin und wieder auf: John Coleman und Schwester Rose. Was
sagt uns das?
Man kann vermuten, dass lediglich eine paar miese Penner
für den Schmutz im und aus dem Internet verantwortlich sind.
Vielleicht wird es wirklich mal Zeit für einen kleinen Lync.....
Nach dem hin und her über die Lycos-Kampagne gegen Spam wurde sie jetzt endgültig beendet. O-Ton: "Lycos sein enormen Resonanz" auf die Aktion "Make Love Not Spam" überrascht gewesen".
Naja, für mich war sie eh fragwürdig.
[via: Heise]
Auf cheerleader.yoz.com gibt es eine Liste mit 7 Tipps um Blogs spamfrei zu halten.
Einige davon, wie z.B. das umbenennen der comment-Datei ist aber sehr aufwendig, da alle Bezüge auf die Datei angepasst werden müssen.
Schon wieder Referrer-Spam in den Logs von sogenannten
Suchmaschinenprofis aus Süddeutschland? Das muss nicht
sein! Diese Rewrite-Regel hilft - schnell und zuverlässig:
RewriteCond %{HTTP_USER_AGENT} ^Mozilla/4\.0\ \(compatible;\
MSIE\ 5\.0;\ Windows\ 98;\ DigExt\)$
RewriteCond %{REMOTE_HOST} ^dsl(.+)\.arcor-ip\.net$
RewriteRule ^.*$ - [F]
Die meisten Blogs haben doch eine Art Installationsroutine. Wäre es nicht besser in dieser auf ein verstecktes hidden-Input zu fragen(welches der User frei belegen darf), so daß die Installation selbst bei einem unbedarftem User so läuft, wie meine modifizierte WP-Installation?
Das sollte eigentlich bei jedem Blog gehen, denke ich.
Gibt es jemend mit so sicherem English, der sich Zutraut, das mal in den div. Foren/Wikis der BlogsoftwareCommunity vorzuschlagen?
Sollte sich keiner fnden, werde ich das mal machen, leider ist meine engl. Grammatik nicht so gut, daher die Frage.
Bei Referer Spam kann das hier in der .htaccess durchaus helfen:
RewriteEngine on
RewriteCond %{HTTP_REFERER} ^http://.*valium-.*$ [NC]
RewriteCond %{HTTP_REFERER} ^http://.*diet-pills-.*$ [NC]
RewriteCond %{HTTP_REFERER} ^http://.*-holdem-4u.*$ [NC]
RewriteCond %{HTTP_REFERER} ^http://.*free-slot-.*$ [NC]
RewriteCond %{HTTP_REFERER} ^http://.*free-slots-.*$ [NC]
RewriteCond %{HTTP_REFERER} ^http://.*holdem-.*$ [NC]
RewriteCond %{HTTP_REFERER} ^http://.*-pharmacy.*$ [NC]
RewriteCond %{HTTP_REFERER} ^http://.*-sale.*$ [NC]
RewriteCond %{HTTP_REFERER} ^http://.*-slot-machine-.*$ [NC]
RewriteCond %{HTTP_REFERER} ^http://.*phentermine.*$ [NC]
RewriteCond %{HTTP_REFERER} ^http://.*hold.*$ [NC]
RewriteCond %{HTTP_REFERER} ^http://.*pills.*$ [NC]
RewriteCond %{HTTP_REFERER} ^http://.*gambling.*$ [NC]
RewriteCond %{HTTP_REFERER} ^http://.*texas.*$ [NC]
RewriteRule ^(.*)$ http://localhost/ [R,L]
Die Liste kann und sollte man von Zeit zu Zeit erweitern.
Man könnte das ganze noch optimieren, wenn man die Regulären Ausdrücke anpasst/verbessert.



