PRIMAT - PRIvate MAtching Toolbox

Dieses Produkt befindet sich in der Testphase und wird bisher nur vom Hersteller eingesetzt.
zuletzt aktualisiert
09.03.2022

Produktdetails

Datum der Erstverfügbarkeit
Version/Versionsdatum
0.1/2019
Lizenzmodell
Apache License, Version 2.0
Preis
kostenlos
Support
Community
Technische Voraussetzungen
Java 11+
Maven
Ubuntu (empfohlen)
DOI
10.14778/3352063.3352076

Beschreibung

Logo

 

PRIMAT (PRIvate MAtching Toolbox) ist ein Framework von Komponenten und Methoden zur Umsetzung von individuellen Record-Linkage-Prozessen. Hierbei liegt der Fokus auf Linkage-Szenarien bei denen sensible Daten, wie persönliche oder medizinische Daten, verarbeitet werden und dadurch besonders hohe Anforderungen an die Einhaltung des Datenschutzes stellen. Hierfür enthält PRIMAT eine umfangreiche Sammlung an Methoden, um das Linkage auf kodierten (maskierten) Daten durchzuführen und flexibel zu konfiguieren.

 

PRIMAT - Architektur

 

PRIMAT ist unterteilt in zwei Module mit Komponenten für Dateneigentümer und Linkage Unit. Die Linkage Unit bezeichnet eine vertrauenswürdige zentrale Instanz, welche das eigentliche Linkage durchführt.

Jeder beteiligte Dateneigentümer führt zunächst (lokal) eine Kodierung seiner Datensätze durch. Hierzu stimmen sich die Datenbesitzer im Vorfeld bezüglich des Kodierungsverfahrens und der Parameter ab. Der Fokus von PRIMAT liegt dabei aktuell auf Bloom-Filter-basierten Kodierungen, welche bereits erfolgreich in mehreren realen Linkage-Projekten eingesetzt wurden. Zudem bietet PRIMAT verschiedene Funktionen zum Data Cleaning an, mit denen häufig auftretene Datenfehler und Problemfälle (Sonderzeichen, Umlaute, Diakritka) reduziert werden können. Die Kodierung beschränkt sich auf die Quasi-Identifikatoren einer Entität. Quasi-Identifiaktoren sind Attribute, welche gemeinsam zur eindeutigen Identifizierung der Entität genutzt werden können. Bei Patienten sind typische Quasi-Identifikatoren Attribute wie Vorname, Nachname, Geburtsdatum und Adresse. Medizinische Daten werden für das Linkage nicht benötigt und genutzt, können jedoch natürlich - basierend auf dem Linkage-Ergebnis - ausgetauscht oder aggregiert werden.

Die kodierten Datensätze werden schließlich von den Dateneigentümern an die zentrale Linkage Unit gesendet. Dort werden die Datensätze ermittelt, welche diesselbe Entität referenzieren (Record Linkage). Hierbei bietet PRIMAT ein umfangreiches Funktionsangebot sowie verschiedene Operationsmodi - (einmaliges) Batch Matching oder inkrementelles Matching mit Speicherung von Match-Ergebnissen in einer Datenbank. Durch die Nutzung von Blocking oder Filtering-Verfahren, z. B. Blocking mittels Locality-sensitive Hashing, sowie paraller Abarbeitung in mehreren Threads errreicht PRIMAT - trotz der quadratischer Komplexität des Linkage - eine hohe Skalierbarkeit und Performanz.

 

Funktionsüberblick und Implementierungsstatus

PRIMAT - Funktionen

Erfahrungsberichte

Eigenen Erfahrungsbericht verfassen

Referenzen

Z. Sehili, E. Rahm: Speeding up Privacy Preserving Record Linkage for Metric Space Similarity Measures. In Datenbank-Spektrum. 2016. http://link.springer.com/article/10.1007/s13222-016-0222-9

M. Franke, Z. Sehili, E. Rahm: Parallel Privacy-Preserving Record Linkage Using LSH-Based Blocking. In IoTBDS, pages 195–203. 2018. https://doi.org/10.5220/0006682701950203

M. Franke, Z. Sehili, M. Gladbach, E. Rahm: Post-processing methods for high quality privacy-preserving record linkage. In Data

Privacy Management, Cryptocurrencies and Blockchain Technology, pages 263–278. Springer, 2018.

https://doi.org/10.1007/978-3-030-00305-0_19

M. Franke, M. Gladbach, Z. Sehili, F. Rohde, E. Rahm: ScaDS Research on Scalable Privacy-preserving Record Linkage. In Datenbank-Spektrum. 2019. https://doi.org/10.1007/s13222-019-00305-y

M. Franke, Z. Sehili, und E. Rahm: „PRIMAT“, in Proceedings of the VLDB Endowment, Aug. 2019, Bd. 12, Nr. 12, S. 1826–1829. https://doi.org/10.14778/3352063.3352076

F. Rohde, M. Franke, Z. Sehili, M. Lablans, E. Rahm: Optimization of the Mainzelliste software for fast privacy-preserving record linkage. In BMC Journal of Translational Medicine. 2021. https://www.doi.org/10.1186/s12967-020-02678-1

M. Franke, Z. Sehili, F. Rohde, E. Rahm: Evaluation of Hardening Techniques for Privacy-Preserving Record Linkage. In EDBT,

pages 289-300. 2021. https://doi.org/10.5441/002/edbt.2021.26

Z. Sehili, F. Rohde, M. Franke, E. Rahm: Multi-Party Privacy Preserving Record Linkage in Dynamic Metric Space. In BTW. 2021.

Produkt-Features vergleichen mit ähnlichen Produkten

Wählen Sie maximal 4 weitere Produkte aus, die sie mit diesem Produkt vergleichen wollen.

Kommentare

Um einen Kommentar verfassen zu können, müssen Sie sich zunächst anmelden!