Inhaltsverzeichnis:
Definition - Was bedeutet Bayes'scher Filter?
Ein Bayes'scher Filter ist ein Computerprogramm mit Bayes'scher Logik oder Bayes'scher Analyse, die synonym sind. Es wird verwendet, um den Header und den Inhalt von E-Mail-Nachrichten auszuwerten und festzustellen, ob es sich um Spam handelt oder um das elektronische Äquivalent von Massen- oder Junk-E-Mail in Papierform. Ein Bayes-Filter wird am besten zusammen mit Antivirenprogrammen verwendet.
Techopedia erklärt Bayesian Filter
Ein Bayes'scher Filter arbeitet mit Wahrscheinlichkeiten für bestimmte Wörter, die in der Kopfzeile oder im Inhalt einer E-Mail erscheinen. Bestimmte Wörter weisen auf eine hohe Wahrscheinlichkeit hin, dass es sich bei der E-Mail um Spam handelt, z. B. Viagra und Refinanzierung. Der Filter erkennt nicht die Wahrscheinlichkeit, dass ein Wort auf eine hohe Wahrscheinlichkeit von Spam hinweist. Benutzer müssen die E-Mail manuell als Spam identifizieren. Wenn genügend Vorkommen des Wortes gefunden wurden und die E-Mail als Spam identifiziert wurde, „lernt“ der Bayes'sche Filter, das Wort mithilfe von Wahrscheinlichkeitsfunktionen zu identifizieren. Dies gilt auch für viele andere Wörter und Ausdrücke. Mit der Zeit wird der Bayes'sche Filter immer wirksamer, um Spam für einen bestimmten Benutzer zu identifizieren. Wenn die Wahrscheinlichkeit einen bestimmten Schwellenwert erreicht, z. B. 95 Prozent, wird die E-Mail als Spam identifiziert und häufig in einen Junk-Ordner verschoben (oder manchmal sogar automatisch gelöscht). Der Benutzer kann es regelmäßig anzeigen und entscheiden, ob es gelöscht werden soll oder nicht. Alternativ verschieben einige Spam-Programme sie in eine Quarantäne, in der Benutzer die E-Mails anzeigen und die Entscheidung der Software überprüfen können.
Das anfängliche „Training“ kann oft verfeinert werden, um falsche Positive oder falsche Negative zu reduzieren, wenn falsche Urteile gefunden werden. Dadurch kann sich der Bayes'sche Filter der Software an die sich ständig weiterentwickelnde Natur von Spam anpassen.
Einige Spam-Filter verwenden neben dem Bayes-Filter auch Heuristiken. Der Benutzer richtet vordefinierte Regeln ein, um die Genauigkeit der Identifizierung von E-Mails als Spam weiter zu erhöhen. Diese Regeln können die Anzahl der Vorkommen eines bestimmten Wortes beinhalten, neutrale Wörter wie "the", "a" oder "some" eliminieren oder ignorieren oder Sequenzen von Werken wie "Viagra ist gut für" identifizieren, anstatt eine Wahrscheinlichkeit anzuwenden Funktion zu allen vier einzelnen Wörtern.
Spammer können eine Technik verwenden, die als Bayes'sche Vergiftung bezeichnet wird, um die Wirksamkeit von Spam-Filtern mithilfe der Bayes'schen Filterung zu verringern. Einige Techniken umfassen das Einfügen von legitimem Text aus Nachrichten- oder Literaturquellen, die Verwendung von zufälligen harmlosen Wörtern, die in Spam selten vorkommen, oder das Ersetzen von Text durch Bilder.
Viele E-Mail-Clients deaktivieren die Anzeige von Bildern aus Sicherheitsgründen. Somit kann der Spam weniger Empfänger erreichen.
Mit einem Bayes'schen Filter, der Bayes'sche Logik verwendet, können alle Arten von Daten klassifiziert werden. Medizin, Wissenschaft und Technik haben alle Verwendung gefunden. Interessanterweise haben wissenschaftliche Forscher spekuliert, dass sogar das menschliche Gehirn die Bayes'sche Logikmethode verwenden könnte, um Reize zu klassifizieren und spezifisches Antwortverhalten zu bestimmen.