E-Mail Kontakt - Tel: 02192 / 91 89 921

Ein ETL-Prozess Schritt für Schritt erklärt

ETL steht für "Extract Transform Load" und ist ein Synonym für mehrstufige Migrationsprozesse. Beim ETL-Prozess handelt es sich um eine Hintereinanderschaltung einzelner ETL-Schritte. Mit leistungsfähigen Validate Services erweitert ETL-inside die klassischen ETL-Schritte um die Funktionalität, auch syntaktisch und semantisch fehlerhafte Daten zu verarbeiten. Convert Services sind spezielle Transform Services, die den Typ eines Wertes verändern.

Erläuterung der einzelnen Schritte:
Schritt Aktion Daten je ETL-Schritt
1 Extract
Zeilen aus Quelle auslesen
"Michael Hauber;  1955-08-28"
2 Transform
Zeile in Reihe umwandeln 1
"Michael Hauber" "  1955-08-28"
3 Modify
Leerzeichen entfernen (trim)
"Michael Hauber" "1955-08-28"
4 Validate Syntax (Plausibilitätstest)
Namen enthalten z.B. keine Zahlen
"Michael Hauber" "1955-08-28"
5 Convert (Typkonvertierung)
String in Datum (long) konvertieren
"Michael Hauber" -452739600000
6 Validate Semantic (Plausibilitätstest)
Könnte Person noch leben?
"Michael Hauber" -452739600000
7 Load DB (Data-Warehouse)
Reihen in Datenbank schreiben
"Michael Hauber" -452739600000
8 Convert (Typkonvertierung)
Datum in formatierten Text konvertieren
"Michael Hauber" "28.08.1955"
9 Load PDF-Dokument
Reihen in PDF-Dokument schreiben
"Michael Hauber" "28.08.1955"
1 Mit "Zeile" ist eine Textzeile gemeint; mit "Reihe" eine Tabellenzeile mit Spalten.

Siehe auch Wikipedia: "ETL-Prozess"