Zuhause Trends Was ist ein einfacher Weg, um Voreingenommenheit und Varianz beim maschinellen Lernen zu beschreiben?

Was ist ein einfacher Weg, um Voreingenommenheit und Varianz beim maschinellen Lernen zu beschreiben?

Anonim

Q:

Was ist ein einfacher Weg, um Voreingenommenheit und Varianz beim maschinellen Lernen zu beschreiben?

EIN:

Es gibt eine beliebige Anzahl von komplizierten Möglichkeiten, um Voreingenommenheit und Varianz beim maschinellen Lernen zu beschreiben. Viele von ihnen verwenden signifikant komplexe mathematische Gleichungen und zeigen durch grafische Darstellung, wie bestimmte Beispiele verschiedene Beträge sowohl der Verzerrung als auch der Varianz darstellen.

Hier ist eine einfache Möglichkeit, die Verzerrung, die Varianz und den Kompromiss zwischen Verzerrung und Varianz beim maschinellen Lernen zu beschreiben.

Voreingenommenheit ist im Kern eine zu starke Vereinfachung. Es kann wichtig sein, der Definition der Verzerrung eine Annahme oder einen angenommenen Fehler hinzuzufügen.

Wenn ein stark voreingenommenes Ergebnis nicht fehlerhaft wäre - wenn es auf dem Geld liege - wäre es sehr genau. Das Problem ist, dass das vereinfachte Modell einige Fehler enthält, so dass es nicht ins Schwarze trifft - der signifikante Fehler wird immer wieder wiederholt oder sogar verstärkt, während das maschinelle Lernprogramm funktioniert.

Die einfache Definition der Varianz ist, dass die Ergebnisse zu streuend sind. Dies führt häufig zu einer Überkomplexität des Programms und zu Problemen zwischen Test- und Trainingssätzen.

Hohe Varianz bedeutet, dass kleine Änderungen zu großen Änderungen der Ergebnisse führen.

Eine andere Möglichkeit, die Varianz einfach zu beschreiben, besteht darin, dass das Modell zu viel Rauschen enthält und es für das maschinelle Lernprogramm daher schwieriger ist, das reale Signal zu isolieren und zu identifizieren.

Eine der einfachsten Möglichkeiten, Abweichungen und Abweichungen zu vergleichen, besteht darin, maschinell lernende Ingenieure dazu anzuhalten, eine Grenze zwischen zu starker Abweichung oder zu starker Vereinfachung und zu starker Abweichung oder zu starker Komplexität zu ziehen.

Eine andere Möglichkeit, diese Quelle darzustellen, ist ein Vier-Quadranten-Diagramm, das alle Kombinationen von hoher und niedriger Varianz zeigt. Im Low Bias / Low Varianz Quadranten werden alle Ergebnisse in einem genauen Cluster zusammengefasst. In einem Ergebnis mit hoher Abweichung / niedriger Varianz werden alle Ergebnisse in einem ungenauen Cluster zusammengefasst. Bei einem Ergebnis mit niedriger Abweichung / hoher Varianz werden die Ergebnisse um einen zentralen Punkt gestreut, der einen genauen Cluster darstellen würde, während bei einem Ergebnis mit hoher Abweichung / hoher Varianz die Datenpunkte sowohl gestreut als auch insgesamt ungenau sind.

Was ist ein einfacher Weg, um Voreingenommenheit und Varianz beim maschinellen Lernen zu beschreiben?