Record Linkage mittels E-PIX

zuletzt aktualisiert
08.10.2024

Produktdetails

Datum der Erstverfügbarkeit
Version/Versionsdatum
2024.2.0 (Sept 2024)
Lizenzmodell
AGPLv3
Preis
keine
Support
Herstellersupport
Technische Voraussetzungen
Ubuntu Server 8GB RAM
10GB freier Festplattenspeicher
Java 17
MySQL 8
Wildfly 26.x oder höher
DOI
http://dx.doi.org/10.3414/ME14-01-0133

Beschreibung

Um Forschungsdaten aus mehreren Projekten und Studien zusammenführen und einer einzigen Person zuordnen zu können, ist ein Record Linkage und die Vergabe einer eineindeutigen systemweiten Kennung für jeden Patienten erforderlich. Dieser Kennung (MPI ID oder PID) werden sowohl die personenidentifizierenden Daten, als auch die einzelnen lokalen Kennungen des Quellsystems (z.B. Labore, Studienzentralen, etc.) zugeordnet. Da dies auch bei unvollständigen oder fehlerhaften Personendaten fehlertolerant und nachvollziehbar erfolgen muss, ist ein nachhaltiges ID-Management erforderlich.

Der E-PIX setzt das Konzept eines Master Patient Index um. Ein integriertes Identitätenkonzept erlaubt potentielle Synonymfehler automatisch zu erkennen und unterstützt bei deren grafischer Auflösung. Die Erkennung von Dubletten erfolgt auf Basis frei definierbarer  Parameter und der Levensthein-Distanz. Mögliche Synonymfehler werden so protokolliert und können im Nachhinein über entsprechende Funktionen aufgelöst werden.

Durch die verbesserten Bloomfilter-Mechanismen können E-PIX-Anwender nun PPRL-Prozesse (Privacy-Preserving-Record-Linkage) aufbauen und ein Standort-übergreifendes Record-Linkage von Patienten durchführen ohne dafür demographische Informationen, wie Vorname, Nachname, Geburtsdatum, etc. untereinander austauschen zu müssen. Der Abgleich der Patientendaten (und die Berechnung entsprechender Wahrscheinlichkeiten) erfolgt dabei allein auf Basis der durch den E-PIX generierten Bloomfilter. Dabei sind die Bloomfilter natürlich entsprechend konfigurierbar und wurden die Verfahren Double-Hashing  und Random Hashing umgesetzt.

Die neuen PPRL-Funktionalitäten des E-PIX setzen, wie bereits auf dem Workshop der GMDS-Jahrestagung 2019 in Dortmund angekündigt, ausgewählte Konzepte der MII Taskforce Datenschutz um. Sie stellen die Grundlage für den Aufbau der Föderierten Treuhandstelle (fTTP) im Rahmen des “Netzwerk Universitätsmedizin” (NUM) am Standort Greifswald dar. Der Datenaustausch mit der fTTP wurde erstmals erfolgreich im März 2021 demonstriert.

Das Produkt im Einsatz

  • Treuhandstelle für das KAS+ Projekt (Pressenotiz)
  • Treuhandstelle für die Collaborative Biobank (CoBi) der DKMS
  • Treuhandstelle „ZDM“ der Medizinischen Fakultät der CAU zu Kiel
  • Summative Evaluation KiFög MV
  • Treuhandstelle des Klinische Krebsregistrierung MV
  • Treuhandstelle des GANI_MED-Projekts
  • Treuhandstelle der NAKO Gesundheitsstudie
  • Treuhandstelle des DZHK
  • Treuhandstelle des ReTraSarc-Projekts
  • Treuhandstelle für das Deutsche Forschungspraxennetz (DFPN)
  • Treuhandstelle des Baltic Fracture Competence Centres (BFCC)

Zusätzliche Anwendungsbereiche

  • Mehr als 14 NUM-Standorte
  • Popgen 2.0-Netzwerk (P2N)
  • Charité Schlaganfallcentrum (Mondafis, Berliner Vorhofflimmern Register)
  • Berlin Institute of Health (BIH) (Konsortium HiGHmed)
  • 8 von 10 Standorte des MIRACUM-Konsortiums
  • Universitätsklinikum Eppendorf (Konsortium SMITH)
  • Universitätsklinikum Aachen (Konsortium SMITH)

Unterstützung

Probieren Sie den E-PIX einfach aus: https://demo.ths-greifswald.de/epix-web/

Für MII, NUM und die Community: neue Releases von E-PIX, gPAS und gICS frei verfügbar:
https://www.ths-greifswald.de/mii-num-community-releases-von-e-pix-gpas-und-gics-frei-verfuegbar/

Erfahrungsberichte

  • Nutzung des E-PIX in der Unabhängigen Treuhandstelle der NAKO Gesundheitsstudie

    Die NAKO Gesundheitsstudie ist eine Langzeit-Bevölkerungsstudie (Dauer 20 – 30 Jahre), die 2014 gestartet ist. Im Rahmen dieser epidemiologischen Studie sollen aus ganz Deutschland 200.000 Personen zwischen 20 und 69 Jahren standardisiert untersucht werden.

    Die personenidentifizierenden und die medizinischen Daten werden hierbei strikt voneinander getrennt gespeichert. Jegliche personenidentifizierenden Daten (Name, Anschrift, Geburtsdatum, …) werden in der Unabhängigen Treuhandstelle der Universitätsmedizin Greifswald gespeichert und verwaltet.

    Die möglichen Studienteilnehmer werden zufällig von den Einwohnermeldeämtern ausgewählt. Bevor die Personen angeschrieben werden, werden die personenidentifizierenden Daten (IDAT) von den Studienzentren an die Unabhängige Treuhandstelle geschickt. Hier werden jegliche IDAT in der Software E-PIX (‚Enterprise Patient Identifier Crossreferencing‘) gespeichert und verarbeitet.

    Anhand der Ausprägungen für Vorname, Nachname, Geschlecht, Geburtsjahr, Nationalität, Postleitzahl und Straße inkl. Hausnummer, wird geprüft, ob diese Person im Rahmen der NAKO Gesundheitsstudie bereits erfasst wurde.

    Ist dies nicht der Fall, wird eine neue Person im E-PIX angelegt.

    Existiert diese Identität mit identischer Schreibweise bereits, werden beide Identitäten zu einer Person zusammengeführt (Perfect Match).

    Im E-PIX gibt es außerdem die Option, unsichere Matches zu erkennen. Dies sind mögliche Matches des neuen Personendatensatzes mit einer Personenidentität einer vorhandenen Person, welche nicht automatisch aufgelöst werden können. Das Auflösen muss manuell von einem Mitarbeiter übernommen werden. Aufgrund der Weboberfläche ist das jedoch ohne Schwierigkeiten möglich.

    Aktuell (Stand: 15.09.2017) verwalten wir in der Unabhängigen Treuhandstelle der NAKO Gesundheitsstudie mithilfe des E-PIX die Datensätze von knapp 908.000 Personen. Im Rahmen der Verarbeitung dieser Datensätze sind ca. 28.000 unsichere Matches entstanden, von denen sich ca. 3.500 als tatsächliche Matches (Dubletten) herausgestellt haben.

    Bisher hat diese Software problemlos funktioniert, weshalb wir sie weiter verwenden werden und auch weiterempfehlen können.

Eigenen Erfahrungsbericht verfassen

Referenzen

Bialke M*, Bahls T, Havemann C, Piegsa J, Weitmann K, Wegner T , et al. MOSAIC. A modular approach to data management in epidemiological studies. METHODS OF INFORMATION IN MEDICINE. 2015; 54(4):364-371.

Bialke M*, Penndorf P, Wegner T, Bahls T, Havemann C, Piegsa J , et al. A workflow-driven approach to integrate generic software modules in a Trusted Third Party. Journal of Translational Medicine. 2015; 13(176).

Hampf C*, Geidel L, Zerbe N, Bialke M, Stahl D, Blumentritt A, Bahls T, Hufnagl P, Hoffmann W, et al. Assessment of scalability and performance of the record linkage tool E-PIX® in managing multi-million patients in research projects at a large university hospital in Germany, Journal of Translational Medicine. 2020. DOI:10.1186/s12967-020-02257-4

Produkt-Features vergleichen mit ähnlichen Produkten

Wählen Sie maximal 4 weitere Produkte aus, die sie mit diesem Produkt vergleichen wollen.

Kommentare

Um einen Kommentar verfassen zu können, müssen Sie sich zunächst anmelden!