Zuhause In den Nachrichten Warum ist die Merkmalsauswahl beim maschinellen Lernen so wichtig?

Warum ist die Merkmalsauswahl beim maschinellen Lernen so wichtig?

Anonim

Q:

Warum ist die Merkmalsauswahl beim maschinellen Lernen so wichtig?

EIN:

Die Merkmalsauswahl ist beim maschinellen Lernen in erster Linie deshalb äußerst wichtig, weil sie als grundlegende Technik dient, um die Verwendung von Variablen auf das zu lenken, was für ein bestimmtes maschinelles Lernsystem am effizientesten und effektivsten ist.

Experten sprechen darüber, wie die Merkmalsauswahl und -extraktion funktionieren, um den Fluch der Dimensionalität zu minimieren oder den Umgang mit Überanpassungen zu erleichtern - dies sind verschiedene Methoden, um die Idee einer übermäßig komplexen Modellierung anzugehen.

Kostenloser Download: Maschinelles Lernen und warum es wichtig ist

Eine andere Möglichkeit ist, dass die Funktionsauswahl den Entwicklern die Tools bietet, mit denen sie nur die relevantesten und nützlichsten Daten in Trainingssätzen für maschinelles Lernen verwenden können, wodurch Kosten und Datenvolumen drastisch reduziert werden.

Ein Beispiel ist die Idee, eine komplexe Form im Maßstab zu messen. Während das Programm skaliert, identifiziert es eine größere Anzahl von Datenpunkten und das System wird viel komplexer. Eine komplexe Form ist jedoch nicht der typische Datensatz, den ein maschinelles Lernsystem verwendet. Diese Systeme können Datensätze verwenden, deren Varianz zwischen verschiedenen Variablen sehr unterschiedlich ist. Beispielsweise können Ingenieure bei der Klassifizierung von Arten die Merkmalsauswahl verwenden, um nur die Variablen zu untersuchen, mit denen sie die gezieltesten Ergebnisse erzielen. Wenn jedes Tier in der Tabelle die gleiche Anzahl von Augen oder Beinen hat, können diese Daten entfernt oder andere relevantere Datenpunkte extrahiert werden.

Die Merkmalsauswahl ist der Unterscheidungsprozess, mit dem Ingenieure maschinelles Lernsystem auf ein Ziel lenken. Neben der Idee, die Komplexität von Systemen auf der Skala zu verringern, kann die Merkmalsauswahl auch bei der Optimierung von Aspekten hilfreich sein, die Experten beim maschinellen Lernen als "Bias-Varianz-Kompromiss" bezeichnen.

Die Gründe, warum die Merkmalsauswahl bei der Bias- und Varianzanalyse hilfreich ist, sind komplizierter. Eine Studie der Cornell University zu Merkmalsauswahl, Bias-Varianz und Bagging veranschaulicht, wie die Merkmalsauswahl Projekte unterstützt.

Laut den Autoren untersucht der Aufsatz "den Mechanismus, durch den die Merkmalsauswahl die Genauigkeit des überwachten Lernens verbessert".

In der Studie heißt es weiter:

Eine empirische Bias / Varianz-Analyse mit fortschreitender Merkmalsauswahl zeigt an, dass der genaueste Merkmalssatz dem besten Bias-Varianz-Kompromisspunkt für den Lernalgorithmus entspricht.

Bei der Erörterung der Verwendung von starker oder schwacher Relevanz sprechen die Autoren von der Merkmalsauswahl als "Varianzreduzierungsmethode" - dies ist sinnvoll, wenn Sie sich Varianz als im Wesentlichen das Ausmaß der Variation in einer bestimmten Variablen vorstellen. Wenn es keine Varianz gibt, kann der Datenpunkt oder das Array im Wesentlichen unbrauchbar sein. Wenn es eine extrem hohe Varianz gibt, kann sie sich in das verwandeln, was Ingenieure als "Rauschen" oder irrelevante, willkürliche Ergebnisse ansehen, die für das maschinelle Lernsystem schwierig zu handhaben sind.

Vor diesem Hintergrund ist die Merkmalsauswahl ein grundlegender Bestandteil des Entwurfs beim maschinellen Lernen.

Warum ist die Merkmalsauswahl beim maschinellen Lernen so wichtig?