Spamfilter
Sie kennen ihn, Sie benutzen ihn - doch wissen Sie auch was genau ein Spamfilter eigentlich ist?
Kurz definiert ist ein Spamfilter ein Computerprogramm, das unerwünschte Werbung (Spam) aus den gewollten Informationen herausfiltert. Klassisch werden Spamfilter eingesetzt, um unerwünschte e-mails herauszusortieren. Eine neuere Anwendung ist die Kontrolle von Seiten im Webbrowser, um Werbebanner für Wikis (Linkspam) oder Blogs (Blogspam) zu filtern.
Die Kontrolle durch Spamfilter wird anhand verschiedener Kriterien durchgeführt. Zuerst wird der Absender anhand seiner e-mail-Adresse oder der URL überprüft. Weiterhin wird der Server, der den Inhalt zur Verfügung stellt, weiterleitet oder versendet, kontrolliert. Danach werden die letzten Spams nach dem Header oder aufgrund des Textes (Contentfilter) aussortiert.
Spamfilter können nach verschiedenen Methoden arbeiten. Unter anderem existiert die Blacklist-Methode, der Bayes-Filter und die datenbankbasierte Lösung.
Bei der Blacklist-Methode wird der Inhalt nach bestimmten Stichworten oder Ausdrücken auf Einträge aus einer Negativliste durchsucht. Natürlich werden auch die Absender mit dieser Blacklist verglichen. Ergibt die Kontrolle einen Treffer, wird die e-mail als Spam aussortiert. Der Nachteil dieser Methode ist, dass die Blacklist manuell erstellt und verwaltet werden muss. Allerdings bieten viele Spamfilter voreingestellte Blacklists. Zudem haben Spamfilter nach der Blacklist-Methode nur eine geringe Trefferquote und sortieren auch schnell eine e-mail fälschlicherweise als Spam aus.
Die Alternative zur Blacklist-Methode ist ein Bayes-Filter. Dieses selbstlernende Programm kontrolliert auf der Grundlage der bayesschen Wahrscheinlichkeit. Der Benutzer klassifiziert die ersten tausend e-mail als gewünschte Information oder Spam. Das System ist danach in der Lage Spam fast selbstständig und mit einer Trefferquote von über 95% auszusortieren. Falsch einsortierte e-mails muss der Anwender von Hand korrigieren, wodurch die Trefferquote noch einmal erhöht werden kann. Spamfilter nach der Bayes-Filter-Methode sind denen nach der Blacklist-Methode häufig überlegen.
Die datenbankbasierte Lösung hat als Grundlage die Idee, Spam auf Grund der in der e-mail beworbenen URL oder Telefonnummern zu erkennen. Die Absender können den Inhalt zwar beliebig personalisieren oder variieren, aber letztlich ist das Ziel der Spam immer den Nutzer zur Kontaktaufnahme zu bewegen. Da der Spielraum für mögliche Adressen begrenzt ist, ermöglicht dieser Lösungsansatz theoretisch eine hohe Trefferquote. Da keine Heuristiken verwendet werden, wird das Risiko falsch einsortierter e-mails vermieden. Die Meinung, dass diese Art Spamfilter aufgrund der technischen Anforderungen (z.B. Reaktionsgeschwindigkeit) unpraktikabel seien, ist heute überholt.
Das Problem der falsch einsortierten e-mails haben alle Spamfilter mehr oder weniger. Als falsch negativ bezeichnet man Spam, die unerkannt in den Posteingang gelangt. Wird eine erwünschte e-mail hingegen als Spam aussortiert, so bezeichnet man sie als falsch positiv. Trainiert man den Spamfilter jedoch ausreichend lange, so lässt sich das Filtern von gewollten e-mails fast vollständig verhindern und Spam wird mit bis zu über 99% erkannt.
Kurz definiert ist ein Spamfilter ein Computerprogramm, das unerwünschte Werbung (Spam) aus den gewollten Informationen herausfiltert. Klassisch werden Spamfilter eingesetzt, um unerwünschte e-mails herauszusortieren. Eine neuere Anwendung ist die Kontrolle von Seiten im Webbrowser, um Werbebanner für Wikis (Linkspam) oder Blogs (Blogspam) zu filtern.
Die Kontrolle durch Spamfilter wird anhand verschiedener Kriterien durchgeführt. Zuerst wird der Absender anhand seiner e-mail-Adresse oder der URL überprüft. Weiterhin wird der Server, der den Inhalt zur Verfügung stellt, weiterleitet oder versendet, kontrolliert. Danach werden die letzten Spams nach dem Header oder aufgrund des Textes (Contentfilter) aussortiert.
Spamfilter können nach verschiedenen Methoden arbeiten. Unter anderem existiert die Blacklist-Methode, der Bayes-Filter und die datenbankbasierte Lösung.
Bei der Blacklist-Methode wird der Inhalt nach bestimmten Stichworten oder Ausdrücken auf Einträge aus einer Negativliste durchsucht. Natürlich werden auch die Absender mit dieser Blacklist verglichen. Ergibt die Kontrolle einen Treffer, wird die e-mail als Spam aussortiert. Der Nachteil dieser Methode ist, dass die Blacklist manuell erstellt und verwaltet werden muss. Allerdings bieten viele Spamfilter voreingestellte Blacklists. Zudem haben Spamfilter nach der Blacklist-Methode nur eine geringe Trefferquote und sortieren auch schnell eine e-mail fälschlicherweise als Spam aus.
Die Alternative zur Blacklist-Methode ist ein Bayes-Filter. Dieses selbstlernende Programm kontrolliert auf der Grundlage der bayesschen Wahrscheinlichkeit. Der Benutzer klassifiziert die ersten tausend e-mail als gewünschte Information oder Spam. Das System ist danach in der Lage Spam fast selbstständig und mit einer Trefferquote von über 95% auszusortieren. Falsch einsortierte e-mails muss der Anwender von Hand korrigieren, wodurch die Trefferquote noch einmal erhöht werden kann. Spamfilter nach der Bayes-Filter-Methode sind denen nach der Blacklist-Methode häufig überlegen.
Die datenbankbasierte Lösung hat als Grundlage die Idee, Spam auf Grund der in der e-mail beworbenen URL oder Telefonnummern zu erkennen. Die Absender können den Inhalt zwar beliebig personalisieren oder variieren, aber letztlich ist das Ziel der Spam immer den Nutzer zur Kontaktaufnahme zu bewegen. Da der Spielraum für mögliche Adressen begrenzt ist, ermöglicht dieser Lösungsansatz theoretisch eine hohe Trefferquote. Da keine Heuristiken verwendet werden, wird das Risiko falsch einsortierter e-mails vermieden. Die Meinung, dass diese Art Spamfilter aufgrund der technischen Anforderungen (z.B. Reaktionsgeschwindigkeit) unpraktikabel seien, ist heute überholt.
Das Problem der falsch einsortierten e-mails haben alle Spamfilter mehr oder weniger. Als falsch negativ bezeichnet man Spam, die unerkannt in den Posteingang gelangt. Wird eine erwünschte e-mail hingegen als Spam aussortiert, so bezeichnet man sie als falsch positiv. Trainiert man den Spamfilter jedoch ausreichend lange, so lässt sich das Filtern von gewollten e-mails fast vollständig verhindern und Spam wird mit bis zu über 99% erkannt.
Angebote für SSD Webhosting, Webhosting und Joomla Webhosting finden Sie auf unserer Website.