Datenqualität durch Normierung
Normierung von Textbestandteilen
Die Tatsache, dass Daten elektronisch bzw. in einer Datenbank vorliegen,
garantiert leider noch nicht ihre Qualität. Viele Systeme erlauben Freitext,
obwohl einheitliche Angaben sinnvoll wären. Die gemischte Verwendung von "Euro",
"€", "$", "Dollar" als Währungsangaben erschwert spätere Auswertungen
unnötig. In so einem Fall müssen Sie zum Beispiel bei jeder Abfrage die Liste aller möglichen
Ausprägungen angeben, um die Geschäfte zu ermitteln, die auf Dollarbasis abgerechnet
wurden.
Auf Basis einer frei erweiterbaren Synonymliste ersetzt ETL-inside auf Wunsch alle obigen
Angaben durch "EUR" und "USD". Denkbar ist auch, dass Sie speziell für Ihre
Anwendungen Übersetzungslisten definieren, in denen zum Beispiel die Namen aller
gefundenen Mitarbeiter durch Ihr Kürzel oder die alte Bezeichnung des
Unternehmensbereiches durch den neuen ersetzt wird.
Doch was passiert mit Maßangaben wie "Kilogramm" und "Zentimeter" ?
Umrechnung von
Maß und Währungsangaben
"0,5 Kilogramm" und "100 Gramm" werden auf Wunsch zu "500" "gr" und "100" "gr"
und die damaligen Währungen der europäischen Union können anhand ihres festen
Wechselkurses in EUR umgerechnet werden. Auch dies ist natürlich frei definier-
und erweiterbar.