ETL – Extraktion, Transformation und Last
ETL steht für Extraktion, Transformation und Last und bezeichnet einen Prozess, bei dem Daten aus mehreren Quellen extrahiert, transformiert und danach in eine Zieldatenbank geladen werden.
Extraktion
Bei der Extraktion werden Daten aus mehreren Quellen, dazu gehören beispielsweise Datenbanken, Dateien oder Webdienste, extrahiert und in ein Zwischenformat konvertiert, bevor sie transformiert werden.
Transformation
Während der Transformation werden die extrahierten Daten nach einem festgelegten Format überführt. Dies beinhaltet typischerweise Dinge wie das Ändern der Datentypen, das Löschen von Daten, das Kombinieren von Daten aus mehreren Quellen, das Anwenden von Berechnungen und das Anpassen an die Zielformatierung.
Last
Abschließend werden die transformierten Daten in die Zieldatenbank geladen. Dieser Vorgang wird als ETL-Last bezeichnet.
Beispiele für ETL
ETL-Prozesse werden in einer Vielzahl von Umgebungen eingesetzt. Einige Beispiele sind:
- Daten aus einer Online-E-Commerce-Plattform extrahieren, transformieren und in eine Data Warehouse-Datenbank laden
- Daten aus mehreren Web-APIs extrahieren, transformieren und aggregieren und dann in eine Data Warehouse-Datenbank laden
- Daten aus einer lokalen Datenbank extrahieren, transformieren und in eine Cloud-Datenbank laden
ETL-Prozesse sind ein wesentlicher Bestandteil der modernen Datenanalyse. Sie bieten eine schnelle und effiziente Möglichkeit, Daten aus mehreren Quellen zu extrahieren, zu Transformieren und in eine Zieldatenbank zu laden.