Inhaltsverzeichnis:
Definition - Was bedeutet SQL auf Hadoop?
SQL on Hadoop ist eine Art analytisches Anwendungstool - die SQL-Implementierung auf der Hadoop-Plattform, die eine standardmäßige SQL-Abfrage strukturierter Daten mit dem Hadoop-Datenframework kombiniert. Hadoop ist eine relativ neue Plattform, genau wie Big Data selbst, und nicht viele Fachleute kennen sich damit aus. SQL unter Hadoop vereinfacht jedoch den Zugriff auf das Hadoop-Framework und erleichtert die Implementierung auf aktuellen Unternehmenssystemen.
Techopedia erklärt SQL auf Hadoop
SQL unter Hadoop bezieht sich auf verschiedene Implementierungen von SQL für die Hadoop-Plattform. MapReduce, der Cluster-Job-Mapper und Ergebnis-Organizer von Hadoop, unterstützt SQL als Hauptanwendungsfall sowie andere Verarbeitungsmethoden. Daher ist es sinnvoll, leistungsstarke Tools zu erstellen, um SQL zuzulassen, eine der am häufigsten verwendeten Sprachen für Datenbankabfragen und -manipulationen. Da Hadoop für die Unternehmensdatenarchitektur immer beliebter wird, ist SQL der Schlüssel für die ordnungsgemäße Übernahme sowohl von lose strukturierten Daten als auch von in Hadoop verwendeten strukturierten Daten.
Zu den SQL on Hadoop-Schlüsseltreibern gehören:
- Nutzung vorhandener SQL-Kenntnisse, die in den meisten Organisationen vorhanden sind
- Wiederverwenden von Investitionen in ETL (Extract Transform Load), BI (Business Intelligence) und Analyseinfrastruktur in Hadoop
Einige SQL on Hadoop-Implementierungen umfassen:
- Apache Spark SQL
- Apache Hive
- Apache Tajo
- Apache Drill
- HP Vertica auf MapR
- ODBC-Treiber
- Presto
- Hai
