Top-Fragen
Zeitleiste
Chat
Kontext

Markow-Spamfilter

Filter zur Klassifizierung unerwünschter E-Mail-Nachrichten Aus Wikipedia, der freien Enzyklopädie

Remove ads

Der Markow-Spamfilter (nach Andrei Andrejewitsch Markow) ist ein Spamfilter basierend auf einem Hidden Markov Model und stellt eine Weiterentwicklung des Bayes-Spamfilters dar. Der Spamfilter errechnet dabei die Wahrscheinlichkeit, mit der die Wortketten des überprüften Textes zu Wortketten typischer Spamtexte passen. Während bei einem Bayes-Spamfilter die Wahrscheinlichkeit einzelner Wörter errechnet wird, zieht der Markow-Spamfilter Wortketten zur Ermittlung der Wahrscheinlichkeit heran und gewichtet die einzelnen Kombinationsmöglichkeiten. Ähneln die Wortketten des überprüften Textes denen typischer Spamtexte, so gilt der überprüfte Text als Spam.

Remove ads

Beispiel für Gewichtung der Kombinationsmöglichkeiten

Am Beispiel des Satzes „Der schnelle braune Fuchs springt …“ kann man die Kombinationsmöglichkeiten und Gewichtungen 22N im Markow-Spamfilter veranschaulichen:

Weitere Informationen Wortkette, Gewichtung ...
Remove ads

Formale Darstellung der Wahrscheinlichkeitsberechnung

Zusammenfassung
Kontext

Während die Wahrscheinlichkeit aufgrund des Bayes-Spamfilters durch

angegeben wird, gilt für das Markow-Spamfilter

.
Remove ads

Literatur

  • Shalendra Chhabra, William S. Yerazunis, Christian Siefkes: Spam Filtering using a Markov Random Field Model with Variable Weighting Schemas. In: Fourth IEEE International Conference on Data Mining (ICDM'04). 2004, S. 347–350, doi:10.1109/ICDM.2004.10031.
Loading related searches...

Wikiwand - on

Seamless Wikipedia browsing. On steroids.

Remove ads