Het koppelen van grote databases met gezondheidsgegevens biedt kansen voor gezondheidsonderzoek. Het Nivel en IKNL koppelden data uit de Nederlandse Kankerregistratie (NKR, beheerd door IKNL) en Nivel Zorgregistraties Eerste Lijn (beheerd door Nivel) om onderzoek te doen naar borstkanker en de behandeleffecten tot 14 jaar na diagnose.
Groepen onderzoeken
Een belangrijk voordeel van het koppelen van databases is dat er geen gegevens meer verzameld hoeven worden, stellen de onderzoekers. Dat kan geld en tijd besparen. “Ook bevatten deze databases vaak gegevens over een groot aantal personen die soms over langere tijd zijn verzameld. Hierdoor is het mogelijk om ook groepen te onderzoeken met zeldzame (vormen van) ziektes en om patiënten in verschillende fases van hun ziekte te volgen. Door gegevens uit verschillende databases te koppelen krijg je bovendien zeer gedetailleerde en uitgebreide informatie over een patiënt.”
Privacy en veiligheid
Het koppelen van data uit verschillende bronnen vraagt om zorgvuldigheid en nauwgezet afwegen van verschillende belangen, tekenen de onderzoekers aan. “Gegevens zijn vaak bij verschillende organisaties opgeslagen, dus er zijn goede onderlinge afspraken nodig over beheer en zeggenschap over de data. Hier moet voldoende tijd voor worden gereserveerd. Daarnaast moet voor een koppeling tot stand komt een zorgvuldige afweging gemaakt worden tussen het belang van het onderzoek en de risico’s op het gebied van privacy en veiligheid. Door het koppelen van gegevens wordt de kans op herleidbaarheid immers groter.”
Koppelen van zorg-databases lijkt veelbelovend, maar de meeste van deze databases zijn een ‘datakerkhof’. Dat wil zeggen dat de data er ongestructureerd in begraven zijn en dat er ook nogal wat data missen: zorgprofessionals hebben echt geen tijd tussendoor om een sluitende administratie te voeren. Hier is dus geen zinnig onderzoek op te doen.
Daarnaast is er een groot probleem dat met name ziekenhuisdata afgeleid zijn van de DBC’s: als je dat gaat analyseren kijk je naar declaratiegedrag. Zolang er geen algemeen geaccepteerd medisch dataformat bestaat zal het koppelen van databases geen antwoorden opleveren, waarschijnlijk wel veel meer vragen en onzekerheden.
Vergeet daarbij niet dat zorgdata niet te anonimiseren zijn: ook zonder persoonsgegevens kunnen Google, Facebook en Amazon zorgdata re-identificeren, als je maar genoeg andere data hebt. Kortom er worden forse risico’s genomen zonder dat er aanwijzingen zijn dat dit de zorg beter gaat maken.
Mijn oplossing is: een medisch dataformat, waardoor alle zorgdata op dezelfde manier opgeslagen worden en ook lokaal blijven, veilig binnen de digitale muren van een instelling. Als iedereen vervolgens dezelfde rapportages draait zijn deze tussen instellingen vergelijkbaar: dit levert wel heel veel informatie op: welke instelling doet het op een bepaald gebied het beste? Vervolgens ga je bij die instelling kijken waarom zij zo goed zijn.
Ook AI kun je op lokale zorgdata in het juiste medisch dataformat trainen: federated learning, zoals nu ontwikkeld wordt door de ‘Personal Health Train’ van o.a. TNO. Een algemeen geaccepteerd medisch dataformat is een veilige, toekomstbestendige oplossing die zorgdata herbruikbaar maakt.