In den letzten Tagen werden leider bei uns in der Redaktion einige Spam-Mails, die angebliche von der Deutschen Postbank stammen und uns verleiten sollen, unsere PINs und TANs in die Formulare irgendwelcher Phisher einzugeben, von unserem Spam-Filter nicht erkannt.
Markiert man den Text der Mail mit der Maus, so wird unter der falschen Postbank-Box ein zuvor weißer Text auf weißem Grund sichtbar. Dieser klingt sehr literarisch und nachdem man Google bemüht hat, stellt sich raus, dass der Text von Schopenhauer stammt. Allerdings nicht von Arthur, sondern von seiner Mutter Johanna Schopenhauer (1766-1838). Ein Auschnitt aus »Reise durch England und Schottland«, der vom Spam-Versender offenbar willkürlich dem amerikanischen Project Gutenberg entnommen wurde, in dem sich auch deutsche Texte befinden.
Der so eingestreute Text, der zwar aus dem Zusammenhang gerissen aber dennoch sinnvoll ist, soll Spamfilter verwirren und ihnen eine normale Mail vortäuschen. Der Postbank-Text darüber ist nämlich eigentlich ein Bild, sodass ein rein textbasierter Filter dort nicht die üblichen Texte findet, die auf eine Phisher-Mail hinweisen.
Und das Austricksen mittels literarischem Text funktioniert bei unserem Filter leider recht gut. Zeit für einen neuen Filter, der per OCR auch die Texte in Bildern erkennt? Denn die Mail einfach so als »Mark as Spam« zu bewerten… hm, da zögert man, denn es dürfte die Wahrscheinlichkeit erhöhen, dass deutschsprachige Nicht-Spam-Mails fälschlicherweise im Spamtopf landen.