Inhaltsverzeichnis:
Definition - Was bedeutet Extraktion?
Beim Extrahieren werden relevante Informationen aus Datenquellen in einem bestimmten Muster für die Verwendung in einer Data Warehousing-Umgebung abgeleitet. Die Extraktion verleiht den Daten Bedeutung und ist der erste Schritt des Datentransformationsprozesses. Beim Extrahieren werden nur bestimmte Daten aus einer großen Sammlung von Daten aus verschiedenen Quellen ausgewählt, die zu einer Bedingung oder Kategorie passen.
Techopedia erklärt die Extraktion
In einer Data Warehousing-Umgebung muss eine riesige Sammlung von Daten aus verschiedenen Strukturen und unstrukturierten Quellen verarbeitet, transformiert und gespeichert werden, um aussagekräftige Schlussfolgerungen und Prognosen abzuleiten. Die Daten, die aus den Primärquellen stammen, müssen systematisch in das Data Warehousing-System importiert werden, damit die verschiedenen Vorgänge für Daten auf einfache Weise ausgeführt werden können. Dieser Vorgang wird Extraktion genannt. Durch die Extraktion werden ansonsten unstrukturierte Daten strukturiert, indem bestimmte Regeln befolgt werden. Im Folgenden sind einige der bei der Datenextraktion verwendeten Techniken aufgeführt:
- Mustervergleich
- Tabellenbasierter Ansatz
- Textanalyse