27.10.2023 Babenhausen - Mit einer konfigurierbaren Option für geschützte Testdaten kann die Datenmaskierung mit der Software-Suite IRI Fieldshield aufwarten: Das Blurring („Verwischen“) von Daten auf Zeilen- statt auf Spaltenebene mit einer konfigurierbaren Option zur Beibehaltung des Intervalls zwischen diesen Daten.
Als Anwendungsbeispiel nennt Amadeus Thomas, Geschäftsführer der Jet-Software GmbH, das „Verschieben“ von Datumsangaben unter Beibehaltung der Zeitabstände. Dies ist typischerweise in klinischen Forschungs- oder Testdatenszenarien sinnvoll, bei denen bestimmte Intervalle zwischen den Daten für die Aufnahme oder Entlassung in ein Krankenhaus oder den Beginn und das Ende einer Behandlung eingehalten werden müssen – sogenannte „Protected Health Information“ (PHI).
Beispiel: Eine produktiv genutzte Datenbanktabelle oder CSV-Datei in der Produktion enthält die Spalten „Startdatum“ und „Enddatum“. Die Werte beider Daten müssen anonymisiert, aber um die identische Anzahl von Tagen verschoben werden, damit sich die Dauer des Ereignisses nicht ändert. Für jeden Datensatz kann eine neue Zufallszahl innerhalb des gewünschten Bereichs verwendet werden, wobei der Ablauf voraussichtlich wie folgt ist:
■ Benutzer wählt die Eingangsdatenquelle (Tabelle oder Datei)
■ Benutzer wählt die Spalten aus, die den Anfang und das Ende des Intervalls definieren
■ Benutzer gibt den Bereich des Shift-Faktors vor (z. B. -10 bis +10)
■ Die Software wählt eine Zufallszahl innerhalb der Verschiebung
■ In jeder Zeile werden die Anfangs- und Endwerte um den Zufallswert verschoben, so dass das Intervall erhalten bleibt.
Das Fieldshield-Skript verarbeitet dies mit einem separat generierten Zufallszahlen-Offset innerhalb eines vorgegebenen Bereichs. Ein schönes Merkmal dieses Ansatzes ist, dass mit unseren datums- und zeitbasierten mathematischen Funktionen der Offset als Sekunden, Minuten, Stunden, Tage, Wochen, Monate oder Jahre definiert werden kann.
Natürlich könnten verschiedene Maskierungsfunktionen auf andere Felder im selben Jobskript angewendet werden, zum Beispiel die Pseudonymisierung der Namen und/oder Unschärfe der Alterswerte. Dabei ist Fieldshield nur eines von vielen Mitgliedern einer integrierten Software-Familie rund um die IRI Datenschutz-Suite und die Datenmanagement-Plattform Voracity, mit der sich personenbezogene Daten (PII) und andere „sensible“ Daten in unterschiedlichsten Quellen finden, klassifizieren und schützen lassen – oder auch als Basis für das Generieren synthetischer Testdaten nutzen lassen.