Inhaltsverzeichnis:
Definition - Was bedeutet Datenextraktion?
Bei der Datenextraktion werden Daten analysiert und durchsucht, um relevante Informationen aus Datenquellen (wie einer Datenbank) in einem bestimmten Muster abzurufen. Die weitere Datenverarbeitung erfolgt durch Hinzufügen von Metadaten und anderer Datenintegration. Ein weiterer Prozess im Daten-Workflow.
Der Großteil der Datenextraktion stammt aus unstrukturierten Datenquellen und unterschiedlichen Datenformaten. Diese unstrukturierten Daten können in beliebiger Form vorliegen, z. B. Tabellen, Indizes und Analysen.
Techopedia erklärt die Datenextraktion
Daten in einem Warehouse können aus verschiedenen Quellen stammen. Für ein Data Warehouse sind drei verschiedene Methoden erforderlich, um die eingehenden Daten zu verwenden. Diese Prozesse werden als Extraktion, Transformation und Laden (ETL) bezeichnet.
Der Prozess der Datenextraktion umfasst das Abrufen von Daten aus nicht geordneten Datenquellen. Die Datenextrakte werden dann in den Staging-Bereich der relationalen Datenbank geladen. Hier wird eine Extraktionslogik verwendet und das Quellsystem wird unter Verwendung von Anwendungsprogrammierschnittstellen nach Daten abgefragt. Nach diesem Vorgang können die Daten nun die Transformationsphase des ETL-Prozesses durchlaufen.