Dienstag, 17. April 2012
Maßnahmen zur Spam-Abwehr
Seit etwa einer Woche läuft hier im Hintergrund ein Skript, welches automatisch Benutzer sperrt und Kommentare dieser Benutzer löscht.

Dabei habe ich die URLs in den Benutzerkonten als Maßstab genommen, die immer wieder auffällig sind.

Das ganze klappt auch schon sehr gut, der Nachteil ist natürlich, dass ein User ganz schnell gelöscht wird, wenn er in seiner URL ein paar "gefährliche" Begriffe drin stehen hat. Deshalb will ich diese Liste auch nicht zu großzügig machen, sondern lieber sehr speziell halten.

Ich überlege nun aber auch, Benutzer, die seit mehr als x Tagen registriert sind und weder einen Kommentar geschrieben, noch einen Blog eröffnet haben, zu blockiern. Als Schwelle schweben mir hier im Moment 7 Tage vor. Dieser Umstand würde bei der Registrierung aber auch kommuniziert.

Auch gegen Blogs, die nur angelegt, aber nie genutzt wurden, will ich stärker vorgehen. Sowie auch gegen die privaten Blogs, die es leider immer noch sehr reichlich gibt. Wahrscheinlich, weil die User gar nicht wissen, wo sie dies einstellen. Ich habe in Antville leider auch noch nicht die Stelle gefunden, wo ich alle Blogs beim Anlegen direkt auf "öffentlich" stellen könnte. Damit wäre vielleicht auch Usern geholfen, die enttäuscht darüber sind, dass niemand ihr Blog liest - dass dies auch daran liegen könnte, dass man das Blog gar nicht lesen kann, darauf kommt man ja auch nicht wirklich von alleine.

Was meint ihr dazu? Gibt es einen triftigen Grund, warum sich jemand registriert und dann eine Woche lang nichts mit dem Account tut?

... comment

 
Und just in diesem Moment habe ich die Stelle gefunden, wo die Defaultwerte für neue Blogs gesetzt werden. Ich habe diese jetzt mal so angepasst, dass neue Blogs immer direkt public sind. Kann sein, dass die Änderung erst nach einem Neustart von Antville in Kraft treten.

... link  


... comment
 
Ich könnte mir vorstellen, dass viele dabei sind, die noch gar keine Texte fertig in der Hinterhand haben und nicht so recht wissen, was sie bloggen wollen, obwohl sie wissen, dass sie bloggen wollen. Sieht man ja auch daran, dass sich viele ein Blog anlegen und dann als erstes Post "Ich weiß gar nicht, was ich bloggen soll" bloggen. Das ist dann allerdings schon mal etwas, eine erste Aktivität.

Ich finde die Idee mit der Frist nicht schlecht. Aber vielleicht sollte man die etwas länger anlegen, damit die Zaghaften eine Chance bekommen. Vielleicht 14 Tage?

Im Übrigen: Ich bin ja jetzt auch schon länger dabei und möchte an dieser Stelle auch mal sagen, dass ich Dein Engagement und den Support klasse finde.

... link  

 
14 Tage wäre auch OK, denke ich. Es gibt halt Spammer, die erst einmal Benutzer anlegen und diese dann später benutzen. Hier müsste man dann mal beobachten, wie gut man mit 14 Tagen auskommt.

Und: Danke! :)

... link  

 
14 Tage fände ich gut, eine Woche scheint mir etwas knapp. Ich glaube, es gibt schon ein paar Leute, die sich wirklich nur als Leser registriert haben, ein paar Blogs abonnieren, aber selbst nichts schreiben. Dürften aber sehr wenige sein - und die Frage ist, welcher Schaden ihnen entsteht, würde man ihren Account doch (hin und wieder) löschen.

... link  

 
Für diese Fälle könnte man natürlich eine Whitelist anlegen. Ein Schaden sollte aber wirklich nicht entstehen, da private Blogs ja auch nur in Ausnahmefällen erlaubt sind und somit eigentlich für den rein lesenden Zugriff keine Registrierung notwendig ist.

Bliebe alleine noch der einfache Zugriff auf die Abolisten.

Ich werde aber auch mal nachsehen, ob ich nicht noch das Datum des letzten Logins mit einbeziehen kann um die wirklichen User von den Spamusern zu unterscheiden.

... link  


... comment
 
Grundsätzlich gibt es durchaus Gründe, sich mal ein Blog bzw. einen Namen zu ergattern. So habe ich ja mal http://schnaps.blogger.de/ geschappt, ohne die Zeit zu haben, es sofort zu füllen. Ist vielleicht auch eine Art Missbrauch ;-)

Grundsätzlich bin ich aber dafür, verdächtige Nutzer oder Blogs zumindest zu blockieren. (Ein Freischaltlink in der Anmeldebestätigung ist nicht vorgesehen, oder?)

... link  

 
Vor ein paar Wochen habe ich auf diese Art und Weise ja knapp 13.000 "Blogleichen" gelöscht. Als Referenzdatum hatte ich den 1.1.2012 genommen. Eine Karenzzeit von 3 Monaten halte ich für angebracht.

Ziel ist es aber ja eigentlich, aus den dann verbleibenden Blogs leichter die Spam-Blogs zu identitifizieren. Das könnte ein Blog mit nur einem Beitrag sein. Diese Blogs würde ich aber auf jeden Fall manuell untersuchen.

Wenn ein nicht genutztes Blog wie "schnaps.blogger.de" gelöscht wird, entsteht ja erst einmal kein Schaden :) Aber dieses Beispiel würde ja eh nicht gelöscht, da ja Inhalte drin sind.

... link  

 
Ein Grund mehr für mich, sich mal um die Blogs zu kümmern ...

... link  


... comment
 
Ich fände es immer noch sinnvoll, wenn (ein Teil der) Spammer bereits vor dem Anlegen der Benutzernamen ausgesiebt würde(n):

Auf antville.org hat es sich seit über einem Jahr bestens bewährt, bei der Registrierung neuer Benutzer zu überprüfen, ob die Email- oder die IP-Adresse (!) auf den Blacklists von botscout.com und stopforumspam.com vorkommen.

Im Code (siehe rechte Seite) wurden dafür die Zeilen 112-115 und 143-178 hinzugefügt.

Bei blogger.de wäre code/MemberMgr/objectFunction.js dafür wahrscheinlich der richtige Platz.


Wird es mit dem automatischen Löschen Benutzern auch möglich, auf kurzem Weg sämtliche von ihnen verfassten Kommentare (auch Stories?) zu entfernen, und werden abhängige Kommentarstränge mitgelöscht?


Private Blogs wurden teilweise zum Layoutbasteln angelegt, andere waren zuvor "öffentlich" und wurden umgestellt, um persönliche Texte, die nicht mehr jeder lesen können soll, zu bewahren, manche dienten den Autoren von Anfang an als ausschliesslich privates digitales Tagebuch. (Ich habe selbst noch einige private Blogs.)

... link  

 
Ich schaue mir den Code noch mal an. Ich will mich immer wieder weiter in Antville einarbeiten und scheitere dann immer wieder an der irgendwie nicht vorhandenen Dokumentation.

Das automatische Löschen der Benutzer, ihrer Kommentare und Stories sowie abhängige Kommentare geschieht im Moment alleine in dem von mir angesprochenen PHP-Skript. Das kann also nicht innerhalb von Antville genutzt werden.

Ich will ja auch nicht jedes bereits private Blog löschen, es gibt aber tatsächlich tausende (OK, jetzt nur noch hunderte), die nach dem Anlegen nie wieder benutzt wurden. Die will ich rauslöschen.

... link  

 
Antville 1.1 kennt das JSON-Objekt nicht... :( Ich habe das jetzt zwar im Google Code Repository gefunden, habe nur wieder keinen blassen Schimmern, wie ich das in Antville hineinbekomme, so dass ich es verwenden kann...

... link  

 
So, zumindest botscout.com wird nun angefragt. Das JSON-Modul habe ich zwar theoretisch einbinden können, dann aber beim Benutzen einen Syntaxfehler bekommen.

... link  

 
Bin ich betroffen?
Hallo, entweder hats mich hier erwischt oder du verstehst die AGB anders als ich.

Leider ist mein neuer Blog reifenfreiheit.blogger.de nun offline und mein Account gesperrt.

Wenn ich hier nicht willkommen bin, würde ich doch wenigstens die Gelegenheit bekommen, meine Inhalte noch runter kopieren zu können. Aber ich komme ja nicht mehr rein.

Könnt ihr mir da bitte etwas engegen kommen? Der blog hat mich schon einiges an Arbeit gekostet und ich hoffe nicht, dass alles umsonst war.

Danke!

... link  

 
Dein Blog wurde am 30. Mai gelöscht, weil es gegen die AGB verstieß.

... link  

 
Das finde ich schon etwas heftig, dass meine Meinung zu Produkten gleich Werbung ist. Du selbst schreibst über ein Buch - das ist dann ja auch Werbung!

Ich bin total neutral und sag nur was ich über Produkte denke. Da gibt es keinen kommerziellen Hintergrund.

Gleich den Blog löschen und Account sperren? Na vielen Dank! Hat ja nur viele Stunden Arbeit gekostet. Und jetzt kann ich nicht mal meine Inhalte runter kopieren.

... link  

 
@andreashe_pa: Lesen Sie den Text, den Sie mit dem Anlegen des Blogs bestätigt haben, noch einmal durch. Sehr viel eindeutiger kann man das nicht mehr formulieren:

... link  


... comment
 
Ungefähr 10.346 Gründe!
Zitat: "Was meint ihr dazu? Gibt es einen triftigen Grund, warum sich jemand registriert und dann eine Woche lang nichts mit dem Account tut?"

Ich bin neu und werde vermutlich auch nicht sofort loslegen, denn:

- ich habe noch nie gebloggt und melden mich an, um die ersten Versuche zu unternehmen.
- Ich weiß noch gar nichts und will nichts falsch machen
-ich muss erst einmal lesen und nicht gleich meinen Senf zu allem dazugeben um nicht gleich in die ersten 333 Fettnäpfchen zu treten.
- nicht jeder sieht Bloggen als Lebensaufgabe oder -philosophie an.
- Viele müssen arbeiten und sind abends zu müde.
- hat man soviel zu sagen?
- Es soll hier ein wenig problematisch mit der Software sein, jetzt konsultiere ich erst mal ein Buch, dass sich speziell mit den Einstellungen auf blogger.de beschäftigt (weiß aber nicht, ob das stimmt).
- ich muss sehen, wie man es "richtig" macht, damit mir das Ding nicht gleich von anderen Usern zerkloppt wird (Trollalarm).
- Die Liste der Verbote in den Nutzungsbedingungen ist lang. Keine Buchbesprechungen, keine Produktbesprechungen, keine Verweise auf andere Blogs (?) Sites, keine was auch immer......

Bei all dem muss man selbst erst mal gucken, ob man sich damit arangieren kann.
Joa! Da kommt was zusammen. ;-)
H.K.

... link  

 
Also, ich sehe in den Nutzungsbedingungen von blogger.de nur eine ziemlich kurze Liste mit vier Punkten. Und ich weiß auch nicht, wo Sie das Verbot, auf "andere Blog (?) Sites" zu verweisen, herauslesen. Der Knackpunkt heißt Werbung. Kann das sein, dass Sie die Nutzungsbedingungen nicht so richtig verstanden haben?

... link  

 
Ja!
Was ist als Werbung zu werten? Ist eine Buchbesprechung jetzt Werbung, oder nicht? Wann ist der Verweis auf andere Blogs / Sites Werbung?

... link  

 
Aber Sie sehen, das kann einer der Gründe sein, warum man nicht sofort loslegt. Man muss das erst mal durchdringen......
Und als unbedarfter, kann man da schnell auflaufen.

... link  

 
Hier sind die "Websites" und unter usw. sehe ich auch andere Blogs:

"Dazu gehören das Beschalten mit Werbebannern und/oder sogenannten Partner-Programmen, das Werben für Waren, Dienstleistungen, Homepages, usw."

Aber ich lasse mich gern belehren.

... link  

 
Sie kennen aber die Bedeutung des Wortes kommerziell, oder etwa nicht?

... link  

 
In der Tat gibt es verschiedene Arten von "kommerziell" im Web.
Und tatsächlich empfand ich Satz 1. der Nutzungsbedingungen mißverständlich. Er müßte nämlich erweitert so lauten:

Die bei Blogger.de gehosteten Blogs dürfen ohne vorherige Absprache mit Blogger.de nicht kommerziell genutzt werden. Dazu gehören das Beschalten mit Werbebannern und/oder sogenannten Partner-Programmen und das Werben auf den Blogs für Waren und Dienstleistungen. Das Gleiche gilt für das Bewerben von Homepages und ähnlichen Seiten auf den Blogs, die ausschließlich kommerziellen Zwecken dienen.
(Eine Ausnahme stellt die in das Standardlayout eingebundene Werbung dar, die zur Deckung der Serverkosten beiträgt.)

In der Originalfassung steht statt dessen nämlich, dass ich auf keine Seite verlinken dürfte, die auch nur ein Werbebanner aufweist oder einer Organisation / Institution gehört.

Entschuldigung, dass ich das so genau nehme. Aber solche verkürzten Nutzungsbedingungen habe ich noch nie im Web gelesen. Deshalb hab ich das nicht gepeilt.
(An Herrn Olbertz: Dieser Text darf gern übernommen werden, wenn gewünscht. )

@aburetum: Danke für die Infos

... link  

 
In der Tat gibt es verschiedene Arten von "kommerziell" im Web.

Na ja, eigentlich nicht...

... link  


... comment