Mainzelliste

Dieses Produkt wird entwickelt und bereitgestellt von Mainzelliste Community
zuletzt aktualisiert
02.10.2020

Produktdetails

Datum der Erstverfügbarkeit
Version/Versionsdatum
1.8.4/2020-07-21; Release Candidate für 1.9.0 ist verfügbar
Lizenzmodell
AGPL v3
Preis
kostenlos
Support
Community
Technische Voraussetzungen
Java Servlet Container (empfohlen: Apache Tomcat, Version 7 oder neuer)
JDBC-fähige Datenbank (empfohlen: PostgreSQL, Version 9.x)
DOI
10.1186/s12911-014-0123-5

Beschreibung

Die Mainzelliste ist ein webbasierter Pseudonymisierungsdienst und wurde als Nachfolger des PID-Generators der TMF entwickelt. Sie erlaubt die Erzeugung von Personenidentifikatoren (PID) aus identifizierenden Attributen (IDAT), dank Record-Linkage-Funktionalität auch bei wechselnder Qualität identifizierender Daten. Ihre Funktionen werden über eine REST-Schnittstelle bereitgestellt, die besonders flexible Integration durch andere Software ermöglicht.

Erklärvideo

Produktbroschüre "MAGIC": IT-Werkzeuge für die medizinische Verbundforschung

MAGIC Mainzelliste

Erstellung nichtsprechender Pseudonyme (PID-Generierung)

Die Mainzelliste erzeugt für jeden eingetragenen Patienten einen oder mehrere nichtsprechende sogenannte Personenidentifikatoren (PID), die kompatibel zu denen des ursprünglichen PID-Generators sind. Diese deterministisch erzeugten achtstelligen Zeichenketten eignen sich sowohl für den Webeinsatz als auch manuelle Übertragung, da sie bis zu zwei Tippfehler erkennen können.

Record Linkage

Für jeden Patienten soll auch bei mehrmaliger Eingabe nur genau ein Pseudonym erzeugt werden. Dazu wird bei Anlage eines Patienten geprüft, ob dieser schon in der Datenbank vorhanden ist. Dank eines modularen Record-Linkage-Systems, das mit Hilfe einer Konfigurationsdatei flexibel an die Anforderungen des konkreten Anwendungsfalls angepasst werden kann, gelingt dies auch bei abweichender Schreibweise oder Vertippen. Neu im Vergleich zum PID-Generator ist insbesondere die Möglichkeit, eigene phonetische Codes sowie Zeichenkettenvergleiche zu nutzen, wodurch auch Namen aus anderen Sprachräumen fehlertolerant verglichen werden können. Derzeit wird ein gewichtsbasiertes Record Linkage unterstützt, die modulare Konzeption erlaubt aber auch die Nachrüstung eigener Algorithmen. Die Möglichkeit, unsicherere Zuordnungen manuell nachzubearbeiten, unterstützt darüber hinaus das automatische Matchverfahren.

Im Rahmen des Deutschen Konsortiums für Translationale Krebsforschung (kurz DKTK) wird außerdem basierend auf der Mainzelliste ein förderiertes Record Linkage betrieben. Das Record Linkage wird hierbei auf Basis von Bloomfiltern durchgeführt (Privacy-Preserving Record Linkage). Hierbei betreibt der Standort Frankfurt die Software zum Erzeugen der Bloomfilter und der Standort Mainz die Patientenliste.

REST-basierte Webschnittstelle

Eine leichtgewichtige REST-basierte Schnittstelle erlaubt eine einfache Anbindung unterschiedlichster Systeme, also z.B. Registern, Biobanken, EDC- und Studienmanagementsystemen. Das macht überhaupt erst die Verwendung aus Webbrowsern über AJAX- und JSONP-Aufrufe möglich. Implementierungen existieren für eine Vielzahl von Systemen, bspw. die Studienmanagementsysteme SecuTrial der Firma iAS, OpenClinica und Redcap.

Nutzer- und Administrationsschnittstelle

Die Komplexität des Record Linkage bleibt dem Nutzer verborgen, da er identifizierende Patientendaten über eine leicht verständliche, schlanke Bedienoberfläche in seinem Webbrowser eingibt.

Etwaige Fehler des Record Linkage können in einer administrativen Bedienoberfläche korrigiert werden (ab Version 1.11). Entsprechende Meldefunktionen vereinfachen den Prozess für Nutzer und Administratoren.

Abwärtskompatibilität

Für Verbünde, die noch den PID-Generator einsetzen, steht in den allermeisten Fällen ein Migrationspfad auf die Mainzelliste zur Verfügung. Dafür wurde die Phonetik nach dem Phonet-Algorithmus von Jörg Michael im Rahmen einer Evaluation in Java reimplementiert.

Die Mainzelliste selbst folgt einem kontrollierten Releasezyklus und ist seit ihrer ursprünglichen Version 1.0 (Mai 2013) abwärtskompatibel.

Zusammenführung verschiedener Datenklassen in Webbrowsern

In manchen behandlungsnahen Anwendungen ist es zulässig und wünschenswert, dass Nutzer anstelle von Pseudonymen Klarnamen sehen. Die REST-Schnittstelle der Mainzelliste ermöglicht prinzipiell deren Abruf, aber einige moderne und fast alle betagten Webbrowser halten für eine stabile Implementierung diverse Hürden bereit, u.a. die Same-Origin-Policy. Die Mainzelliste hilft diese Hindernisse zu umschiffen, indem eine Bibliothek für den Zugriff auf die Schnittstelle bereitgestellt wird.

Blocking und Locality Sensitive Hashing (ab v1.9)

Im Rahmen der „FASTML“-Förderung des TMF e.V. wurde das Bloomfilter-Matching der Mainzelliste dramatisch beschleunigt. Zur Anwendung kommt hierfür Locality-Sensitive Hashing. Eine Publikation belegt Geschwindigkeit und Matchgüte (Franke, 2018).

Audittrail (ab v1.9)

Zur Erfüllung von Anforderungen im Bereich klinischer Studien wurde die Mainzelliste um eine Audittrail-Funktionalität erweitert.

Secure Multi-Party Computation (Prototyp auf Github, Integration geplannt)

Der Mainzelliste Secure EpiLinker (MainSEL) stellt die nächste Stufe des Privacy-Preserving Record Linkage dar: Er ermöglicht Record Linkage und Pseudonymisierung zwischen zwei Mainzellisten, ohne dabei Bestandteile der IDAT preiszugeben (experimentell; siehe u.a. Publikation).

Weitere an der Entwicklung beteiligte Einrichtungen

  • Andreas Borg, Universitätsmedizin Mainz
  • Benjamin Gathmann, Universitätsklinikum Freiburg
  • Christian Koch, DKFZ-Heidelberg
  • Cornelius Knopp, Universitätsmedizin Göttingen, Handling von eGK-Nummern
  • Daniel Volk, Universitätsmedizin Mainz
  • Dirk Langner, Universitätsmedizin Greifswald
  • Florens Rohde, Universität Leipzig, Blocking- and Locality Sensitive Hashing
  • Florian Stampe, DKFZ-Heidelberg
  • Galina Tremper, DKFZ-Heidelberg
  • Jens Schwanke, Universitätsmedizin Göttingen
  • Jürgen Riegel, Universitätsmedizin Mainz
  • Martin Lablans, DKFZ-Heidelberg
  • Matthias Lemmer, Universität Marburg, Audittrail
  • Maximilian Ataian, Universitätsmedizin Mainz
  • Moanes Ben Amor, DKFZ-Heidelberg
  • Phillip Schoppmann, TU Darmstadt, MainSEL
  • Project FP7-305653-chILD-EU
  • Sebastian Stammler, TU Darmstadt, MainSEL
  • Stephan Rusch, Universitätsklinikum Freiburg
  • Tobias Kussel, TU Darmstadt, MainSEL
  • Torben Brenner, DKFZ-Heidelberg
  • Ziad Sehili, Universität Leipzig

Das Produkt im Einsatz

  • Institut für Medizinische Informatik, Universität Münster

Zusätzliche Anwendungsbereiche

  • Deutsches Krebsforschungszentrum (DKFZ), Heidelberg

Unterstützung

Support für die Mainzelliste gibt es auf Bitbucket durch die Entwicklungscommunity. Außerdem kann Kontakt über die E-Mail Adresse info@mainzelliste.de aufgenommen werden

Erfahrungsberichte

  • Nutzung der Mainzelliste in einer Registerstudie

    Die Mainzelliste wurde in der Version 1.4 im Rahmen einer Registerstudie (2012-2015 in Münster) verwendet, um die identifizierenden Daten der Probanden zu pseudonymisieren und die medizinischen Daten von mehreren Standorten zu den Probanden in einem Register pseudonymisiert zusammenzufassen.

    Die Dokumentation sowohl für die Installation als auch für die Benutzung der Mainzelliste ist leicht zu finden und auch hilfreich. Die Installation und auch das Updaten der Software ist mit Hilfe der gelieferten Dokumentation ohne Hilfe möglich. Bei Fragen oder Problemen liefern die Entwickler aber auch zeitnah Hilfestellung.

    Da das Projekt Open Source zur Verfügung steht, können leicht Fehler gemeldet und eigene Patches zur Verfügung gestellt werden.

Eigenen Erfahrungsbericht verfassen

Referenzen

Mainzelliste-Tutorial beim TMF-Tutorialtag im Rahmen des Programmpunktes

"MAGIC: IT-Werkzeuge für die medizinische Verbundforschung" am 19. März 2019 in Bonn.

Download Vortrag [PDF | 2 MB]

Vorstellung Mainzelliste beim TMF-Workshop "MAGIC" am 18. September 2018 in Berlin.

Download Vortrag [PDF | 1 MB]

Lablans M, Borg A, Ückert F: A RESTful interface to pseudonymization services in modern web applications. BMC Medical Informatics and Decision Making201515:2.

Faldum A., Pommerening K., An optimal code for patient identifiers. Computer methods and programs in biomedicine, 2005. 79: p. 81-8.

Fielding R.T., Architectural Styles and the Design of Network-based Software Architectures, in Building, R.N. Taylor, Editor. 2000, Citeseer. p. 162.

Michael J., Doppelgänger gesucht – Ein Programm für kontextsensitive phonetische Textumwandlung. c’t Magazin für Computertechnik, 1999. 25.

Warnecke T., Borg A., Ückert F., Lablans M., Fehlertolerantes Record Linkage von Patientendaten durch den Phonet-Algorithmus

Lablans, M., et al. Eine generische Softwarebibliothek zur Umsetzung des TMF-Datenschutzkonzepts A im Webeinsatz. in 55. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds). 2010.

Borg A., Lablans M., Ückert F., Mainzelliste.Client - Eine Bibliothek für den Zugriff auf Patientenlisten. in 60. Jahrestagung der Deutschen Gesellschaft für Medizinische Informatik, Biometrie und Epidemiologie (gmds). 2015

Franke M., Sehili Z., Rahm E., Parallel Privacy-Preserving Record Linkage using LSH-based Blocking. In: Proceedings of the 3rd International Conference on Internet of Things, 2018.

Produkt-Features vergleichen mit ähnlichen Produkten

Wählen Sie maximal 4 weitere Produkte aus, die sie mit diesem Produkt vergleichen wollen.

Kommentare

Um einen Kommentar verfassen zu können, müssen Sie sich zunächst anmelden!