Kalender

April 2003
MoDiMiDoFrSaSo
  1 2 3 4 5 6
7 8 910111213
14151617181920
21222324252627
282930    
Mär
2003
 Mai
2003

Hexentanz - Juttas Weblog

Externe Links

Meine Seiten

Weblogs

Weblogs in der Nähe

Geo-URL

Mein GPG Key

XML-Icon

Zurück zum Seitenanfang

2003-04-19

Grub - und was dahintersteckt

Des Themas Bauernfang wollte ich mich auch schon annehmen, nachdem ich im Heise-Newsticker den Artikel Viele gegen Google über Looksmart gelesen hatte. Auch auf den Grub-Seiten findet sich ganz unten ein klitzekleiner Hinweis zur Zusammenarbeit mit Smartlook, und dann ist da eben der Copyright-Hinweis.

Guckt man sich die Suchergebnisse aus Smartlook an, so fällt auf, daß Seiten, die bei Google gelistet werden, völlig fehlen, auch wenn die Server, die diese Seiten hosten, schon erfaßt wurden (das kann man bei Grub nachsehen). Die Suchergebnisse für Hydrokultur z. B. enthalten fast nur oder nur kommerzielle Seiten. Bei WiseNut, das ebenso wie Grub laut Webseiten zu Looksmart gehört, findet man nicht unbedingt das, was man sucht. Immerhin haben sie bei unterschiedlichen Suchen nach "Hydrokultur" wenigstens die WDR-Hobbytips dabei, aber auch der WDR ist ja eine Firma...

Ob es wirklich stimmt, daß auf die mit Grub gewonnene Datenbasis frei zugegriffen werden kann (oder was ist sonst mit "opening up the database to other similar projects" im folgenden Text gemeint?), müßten andere herausfinden.

Q: Isn't it wrong to make money with Open Source software?

A: Open Source doesn't equal free! Grub coders wrote most of the software used in the project, and have made some of that code available to the Open Source community. If anything, Grub has contributed to the community, both by making it's code open, and by opening up the database to other similar projects out on the Internet.

In jedem Fall ist zu bezweifeln, daß die vielen Teilnehmer am Grub-Projekt sich darüber im Klaren sind, daß anders als bei den bisherigen Distributed Net Projekten vorwiegend kommerzielle Interessen hinter der Benutztung ihrer Rechner und Bandbreite stehen. Der Titel "Viele gegen Google" für den Heise-Artikel ist in diesem Sinne etwas danebengegriffen. Er sollte eher "Einer mittels vieler gegen Google" heißen.

veröffentlicht um 16:08:00    #

Spam zurückschicken?

Die erste Idee ist nicht immer die beste... Trotzdem machen viele als scheinbare Gegenwehr gegen Spam als Mail (UBE, UCE usw.) genau das Falsche: Sie schicken die Mail einfach zurück.

Warum ist das aber genau falsch?

  1. Mit dem Zurückschicken (User-Bounce) verursacht man zusätzliche Verkehrslast. Machen das alle, so ist der durch das Zurücksenden verurschachte Verkehr auf den Backbones wesentlich größer als der druch den ursprünglichen Spam, weil die Rücksendemails immer Einzel-Nachrichten sind.
  2. Sollte die Absenderadresse tatsächlich korrekt sein, so handelt es sich um eine Message, die entweder von einem dummen Gelegenheitsspammer stammt oder der Adreßverifizierung dient. Antwortet man also, so betätigt man die Gültigkeit der eigenen Adresse und darf sicher sein, künftig noch mehr Spam zu bekommen.
  3. Meistens aber ist die Absenderadresse falsch (gefaked). Im besten Fall ist sie schlicht eine ungültige Adresse und man bekäme beim Zurücksenden einen Bounce. Oft aber eine gültige Adresse irgendeines völlig Unbeteiligten. Dieser bekommt dann die "zurückgesandte" Mail und der Zurücksendene erscheint als Spammer.

Zum letzten Punkt möchte ich hier als selbst Betroffene mal ein Beispiel anführen, weil an ihm klar wird, warum auch das "Verschmutzen" der Adreßlisten mit ungültigen Adressen einfach Unsinn ist:

Irgendein Spammer hat eine Adresse meines Rechners als Absender eingesetzt. Da die Empfängeradressen im Spam nicht alle gültig waren, schlugen bei mir mehrere tausend Bounces für mehr als 10.000 Adressen in meiner Mailbox auf. Zusätzlich habe ich ca. 100 sogenannte Userbounces bzw. wüste Beschimpfungen bekommen. Einige der Mails kamen über Spamcop, weshalb ich ein etwas gestörtes Verhältnis zu diesem Verein habe. Um den Fluß zu unterbrechen, wurde die Mailadresse von mir, die der Spammer eingesetzt hatte, bei meinem Provider gesperrt, so daß ich keine Bounces oder Beschimpfungen mehr bekommen konnte.

An den Headern der Ursprungsmails (duch die echten Bounces konnte ich die sehen), ließ sich erkennen:

  • Der Spam war über mehrere offene Relays abgesetzt worden.
  • Diverse Header (Absender, Received-Zeilen, Return-Path) waren gefälscht.

In einem zweiten Fall, der mich betraf, kam der Spam von einem einzigen Rechner, dessen MTA (Mail Transport Agent), mir schon gleich zu Beginn der Spamaktion tausende von Bounces innerhalb weniger Stunden sandte. In diesem Fall haben wir beim Provider den Absender-Rechner direkt im MTA, der meine Mail empfängt, abgewiesen und einen Complaint gegen den Inhaber der Serverfarm gestartet. Eine Reaktion darauf erfolgte allerings nicht.

Die letzten Erläuterungen sollten zeigen, daß auch das "Verschmutzen" der Adreßlisten mit ungültigen Adressen im besten Fall nur relativ nutzlos und im schlimmsten Fall sogar grob bösartig ist. Die Spammer scheinen kein Bandbreitenproblem zu haben. Denen ist es egal, ob in den Listen 30% oder 50% ungültige Adressen stehen. Denen, wegen der gefälschten Header aber die Bounces bekommen, ist es eben nicht egal, ob die Mailbox durch 3000 oder 5000 Messages verschmutzt wird. Viele von ihnen müssen bei ihrem Provider für den Verkehr direkt oder indirekt bezahlen.

Was kann also der Einzelne gegen den Spam machen?

Die Antwort auf diese Frage ist nicht so einfach.

  • Zunächst einmal kann man sich einen brauchbaren Mailfilter anschaffen. Filter, die auf Bayesen Mailfiltering aufbauen (Popfile, Spambayes), sind sehr wirksam, wenn sie anfänglich richtig trainiert werden. Popfile kennzeichnet bei mir mehr als 99,5 % der Nachrichten richtig, ich muß also nur sehr selten Nachjustieren.
  • Dann kann man sich Provider aussuchen, die selbst keine offenen Relays betreiben und auch etwas gegen Spammer unter den eigenen Kunden tun.
  • Man kann den Provider wieder und wieder auffordern, sich an Maßnahmen gegen Spammer zu beteiligen.
  • Als letztes kann man natürlich selbst die Header solcher Messages analysieren (setzt aber Kennisse voraus) und sich z. B. bei Betreibern von offenen Relays oder Providern von Spamversendern beschweren.

veröffentlicht um 14:44:48    #

Zurück zum Seitenanfang