ETL

ETL – Extraktion, Transformation und Last

ETL steht für Extraktion, Transformation und Last und bezeichnet einen Prozess, bei dem Daten aus mehreren Quellen extrahiert, transformiert und danach in eine Zieldatenbank geladen werden.

Extraktion

Bei der Extraktion werden Daten aus mehreren Quellen, dazu gehören beispielsweise Datenbanken, Dateien oder Webdienste, extrahiert und in ein Zwischenformat konvertiert, bevor sie transformiert werden.

Transformation

Während der Transformation werden die extrahierten Daten nach einem festgelegten Format überführt. Dies beinhaltet typischerweise Dinge wie das Ändern der Datentypen, das Löschen von Daten, das Kombinieren von Daten aus mehreren Quellen, das Anwenden von Berechnungen und das Anpassen an die Zielformatierung.

Last

Abschließend werden die transformierten Daten in die Zieldatenbank geladen. Dieser Vorgang wird als ETL-Last bezeichnet.

Beispiele für ETL

ETL-Prozesse werden in einer Vielzahl von Umgebungen eingesetzt. Einige Beispiele sind:

  • Daten aus einer Online-E-Commerce-Plattform extrahieren, transformieren und in eine Data Warehouse-Datenbank laden
  • Daten aus mehreren Web-APIs extrahieren, transformieren und aggregieren und dann in eine Data Warehouse-Datenbank laden
  • Daten aus einer lokalen Datenbank extrahieren, transformieren und in eine Cloud-Datenbank laden

ETL-Prozesse sind ein wesentlicher Bestandteil der modernen Datenanalyse. Sie bieten eine schnelle und effiziente Möglichkeit, Daten aus mehreren Quellen zu extrahieren, zu Transformieren und in eine Zieldatenbank zu laden.

Weiterführende Links