Meten van uitkomsten en kosten

GGZ werkt met waardegedreven zorg

De condities om waarde gedreven zorg toe te passen in de GGZ zijn gunstig. In de GGZ is er bij het vaststellen van de uitkomst van de zorg van oudsher al een focus op de visie van de patiënt.

Edwin de Beurs 

Dit is ten dele uit nood geboren: psychische gezondheid is vooral een subjectief fenomeen en meestal niet vast te stellen aan de hand van objectieve somatische criteria. Sterftecijfers of postoperatieve infectie percentages zijn geen geschikte indicatoren van de uitkomst van zorg in de GGZ. Behandeluitkomst in de GGZ wordt gemeten op een drietal meetdomeinen: ernst van de aandoening of symptomatologie, beperkingen in het (objectief) functioneren en kwaliteit van leven of de subjectieve waardering van het functioneren beurs (De Beurs et al., 2017a).

Voorts bestaat in de GGZ al een lange traditie van werken met PROMs al heet het hier anders: Routine Outcome Monitoring of ROM (De Beurs en Zitman, 2007). De basis van meten in de GGZ is gelegd met wetenschappelijke therapie-effect onderzoek. Net als in de somatisch-medische zorg is gerandomiseerd klinisch effect onderzoek (RCT’s) in de GGZ de gouden weg om werkzaamheid van interventies vast te stellen en tot behandelrichtlijnen te komen. De richtlijnen zijn de basis voor het evidence-based handelen.

De opkomst van RCT’s in de GGZ in de tachtiger- en negentiger jaren leiden tot de ontwikkeling van meetinstrumenten om de aard en ernst van psychische klachten te meten. Dit waren klinische interviews, beoordelingsschalen zoals de Hamilton Depression Rating Scale (Hamilton, 1960) en zelf-rapportage vragenlijsten, zoals de SCL-90 (Derogatis, 1975). Vooral zelfrapportage vragenlijsten werden graag toegepast, want dit was de meest directe weg naar de subjectieve beoordeling van ernst van de aandoening en de “administratieve” last kwam zo bij de patiënt te liggen.

Een tweede ontwikkeling was de opkomst van zogenaamd effectiveness research (Howard et al., 1996), onderzoek naar de effectiviteit van werkzame interventies in de klinische praktijk van alledag, waarmee uitkomstmeting ook buiten de muren van academische centra werd toegepast. Ten derde kwam een beweging op om GGZ professionals te doordringen van het belang van (voortdurende) feedback of de behandeling aansloeg en op koers bleef.

De klinisch blik van professionals is immers vaak minder helder en onvertekend dan zij zelf denken (Lambert, 2010; Miller et al., 2005). Zo blijkt uit onderzoek van Hannan en collega’s dat behandelaren veel minder vaak dan een meetinstrument detecteren dat de patiënt verslechterd (Hannan et al., 2005). Ten slotte was een belangrijke faciliterende factor voor ROM de opkomst van de computer en het internet waardoor met een veel groter gemak gegevens kunnen worden verkregen, beheerd en teruggekoppeld.

Rond 2000 kwamen in Nederland de eerste projecten van de grond waarbij  grote hoeveelheden uitkomstgegevens werden verworven bij patiënten met veelvoorkomende psychische stoornissen zoals depressie, angst en somatoforme stoornissen ( ROM in Leiden; De Beurs et al., 2011) en bij ernstige psychiatrische aandoeningen, zoals psychotische stoornissen (Zorgmonitor in Zuid-Limburg; Delespaul et al., 2008) en bij beide stoornistypen (Roqua in Groningen; Sytema en Van der Krieke, 2013).

Extra stimulans

In 2010 kreeg ROM een extra stimulans toen de uitkomstmetingen door de zorgverzekeraars werden ontdekt als een middel om inhoud te geven aan hun rol van hoeders van de kwaliteit van de zorg. De insteek was dat er informatie voor kwaliteitsmanagement (benchmarken en verantwoorden) beschikbaar zou komen op basis van ROM, een activiteit waar het GGZ veld al in meer of mindere mate mee bezig was. In een bestuurlijk akkoord spraken zorgverzekeraars en zorgaanbieders met elkaar af dat ROM sector breed zou worden geïmplementeerd; een deel van de ROM-gegevens zou richting de zorgverzekeraars gaan (ONVZ, 2010). Voor het aggregeren van landelijke ROM gegevens werd door de zorgaanbieders, de zorgverzekeraars en de patiëntenvertegenwoordiging (LPGGZ, nu MIND) een stichting opgericht, Stichting Benchmark GGZ (SBG). SBG ontwikkelde een methodiek om informatie over de waarde van zorg te genereren op basis van de ROM gegevens. Met het veld werden afspraken gemaakt over een jaarlijkse toename van de ROM-respons met 10 procent, zodat in 2015 voldoende representatieve data zou zijn ontstaan.

In de afgelopen jaren is er flink gewerkt aan ROM en er is veel tot stand gebracht, zowel door het veld als door SBG. Het veld heeft op grote schaal ROM geïmplementeerd en geïnvesteerd in een infrastructuur om gegevens aan te kunnen leveren bij de centrale bewerker (SBG). Er verschenen verscheidene boeken over ROM (Buwalda et al., 2012; Oudejans en Spits, 2018; van Hees et al., 2011). Een universele meet schaal voor instrumenten werd gelanceerd, de T-Score (De Beurs, et al., 2017a). Een prestatie-indicator is opgesteld voor de uitkomst van behandeling (Delta T) en Delta T is vertaald naar klinisch beter herkenbare concepten als “verbetering” of “herstel” (De Beurs et al., 2016). Voor diverse zorgdomeinen in de GGZ zijn uitkomstindicatoren en meetinstrumenten vastgesteld (De Beurs, et al., 2017).  Als PREM is een verkorte CQI ontwikkeld en gevalideerd (Linszen en De Beurs, 2017). Tenslotte is een prestatie-indicator ontwikkeld die informatie over de behandeluitkomst en de kosten combineert (De Beurs, et al., 2017b). Vooral dit laatste is relevant, want deze prestatie-indicator is direct geïnspireerd op waarde gedreven zorg en maakt de waarde zichtbaar als gezondheidswinst per euro. Zo kan bijvoorbeeld met een eenvoudige indicator inzichtelijk worden wat de kosten zijn die een zorgaanbieder maakt per verbeterde of herstelde patiënt (gemiddelde kosten gedeeld door de proportie verbeterden of herstelden).

Voortvarend pakten bestuurders in de GGZ het verzamelen van uitkomstgegevens op, echter soms zonder hun professionals voldoende mee te nemen in deze ontwikkeling en zonder hen te stimuleren om de uitkomstgegevens ook te gebruiken tijdens de behandeling. Hierdoor kwam in Nederland veel sneller dan elders ROM tot stand, maar werd ook bij veel instellingen een ROM variant geïmplementeerd waar professionals weinig in zagen. Ze deden mee omdat het moest, niet om de meetgegevens te gebruiken in de behandeling.

Begripsvervuiling

Er ontstond ook verwarring over het onderscheid tussen ROM en benchmarken. ROM, benchmarken, vergelijken, verantwoorden en afrekenen werden allemaal als doelen van ROM gepresenteerd (Nugter en Buwalda, 2012). Deze begripsvervuiling helpt niet om tot een heldere discussie te komen: tegenstanders van ROM vrezen bijvoorbeeld te grote invloed van verzekeraars op het zorgproces, maar zijn niet tegen het ondersteunen van de professional in de GGZ met feedback over hoe het met de patiënt gaat tijdens de behandeling.

Ter verduidelijking geldt het volgende onderscheid: ROM is herhaaldelijk de aard of ernst van de psychopathologie of het functioneren van de patiënt meten ter ondersteuning van het klinische proces; de meetgegevens brengen de patiënt in een betere positie, en ondersteunen bijvoorbeeld Shared Decision Making over de behandeling (Metz et al., 2015). Een deel van de ROM-gegevens kan je gebruiken om te benchmarken. Benchmarken is leren van geaggregeerde informatie door je uitkomsten te delen en vergelijken met vergelijkbare andere zorgaanbieders (Barendregt, 2015), verantwoorden is informatie ter beschikking stellen aan zorgverzekeraars of patiënten(vertegenwoordigers) en afrekenen duidt op uitkomstbekostiging, ook wel bekend als pay-for-performance of P4P (Eijkenaar en Schut, 2015). Hiermee wordt bedoeld dat zorgverzekeraars goede performance belonen en zo verbetering van de zorg stimuleren. Met uitkomstbekostiging is in de Nederlandse GGZ nog geen ervaring opgedaan.

Door allerlei omstandigheden is de ontwikkeling van ROM ten behoeve van het klinische proces bij het aggregeren van ROM gegevens achterop geraakt. Om ROM te stimuleren zijn diverse activiteiten ondernomen zoals een doorbraakproject van het Trimbos-instituut (Franx, et al., 2014) en meerdere promotie onderzoeken (Janse et al., 2016; Metz et al., 2015; Van Noorden, 2012; Veerbeek et al., 2013).

Voortvarend

De implementatie van ROM is door sommige zorgaanbieders voortvarend ter hand genomen, wat heeft geleid tot “best practices” van ROM. Deze zorgaanbieders meten frequent met generieke en stoornisspecifieke meetinstrumenten[1], professionals is geleerd hoe ROM informatie optimaal bij de behandeling in te zetten. De voor ROM benodigde cultuurverandering in de GGZ (Van Vught en Van Vemde, 2013) komt langzaam maar zeker op gang. Voor deze vorm van ROM ter ondersteuning van de behandeling (“sturende ROM“, Hafkenscheid en van Os, 2014) is voldoende draagvlak, zeker onder “evidence based” werkende professionals.

Indien resultaten worden besproken ervaren ook patiënten ROM als positief. Aan de andere kant zijn er zorgaanbieders waar de ROM implementatie is blijven steken bij een minimale vorm “omdat het moet van de verzekeraar” (om te kunnen voldoen aan aanlevering van gegevens aan SBG). Het draagvlak voor deze vorm van ROM (ook wel “volgende ROM” genoemd (Hafkenscheid en Van Os, 2014) is onder professionals begrijpelijkerwijs minimaal. Zij bespreken de meetresultaten niet met de patiënt, waardoor ook onder patiënten het draagvlak om vragenlijsten in te vullen afneemt. Zo is er al met al een brede diversiteit aan ROM varianten ontstaan in het veld. Voorlopers hadden al een ROM systeem waarin frequent en met stoornisspecifieke meetinstrumenten werd gemeten en feedback geboden, achterblijvers implementeerden louter en alleen pre-post metingen om te kunnen voldoen aan de verplichting tot aanleveren bij SBG. Bij hen is de ROM implementatie mislukt en draagvlak onder professionals en patiënten gering.

Kritiek

Niet iedereen juicht dus de ROM-ontwikkeling in de GGZ toe. Al in 2012 verscheen een kritisch artikel van een groep opinion leaders in de GGZ (Van Os et al., 2012) die vraagtekens zetten bij de bruikbaarheid van de geaggregeerde ROM gegevens om resultaten van instellingen te vergelijken. Aan de afspraken over 10 procent groei per jaar aan ROM-respons werden financiële consequenties verbonden, hetgeen als een strafkorting werd ervaren. Ongewild kwam ROM daarmee in een context van afrekenen terecht. De Algemene Rekenkamer was, na een rondgang langs betrokkenen in het veld, ook kritisch over de mogelijkheden van het monitoren van kwaliteit van zorg op basis van ROM (Algemene Rekenkamer, 2017).

In het voorjaar van 2017 kanaliseerde allerlei onvrede onder professionals zich in de oprichting van een actiegroep die een online petitie organiseerde (StopBenchmarkmetROM; Van Os et al., 2017) en die SBG voor de rechter daagde vanwege vermeende schending van de privacy van patiënten. SBG betoogde dat de gegevens voldoende geanonimiseerd worden en niet tot een individu herleidbaar zijn en de rechter is in zijn oordeel daarin meegegaan.

De toekomst van ROM en benchmarken staat volop ter discussie. Instellingen en professionals in de GGZ zullen ROM wel blijven toepassen, maar op welke schaal en in hoeverre dat op uniforme wijze zal worden aangepakt is in december 2017 ongewis. Om tegemoet te komen aan bezwaren uit het veld lijkt het noodzakelijk meer ruimte te scheppen voor meten dichter op het klinische proces en met stoornisspecifieke meetinstrumenten. Dat moet dan gerealiseerd worden zonder de administratieve last voor de behandelaar te vergroten. Ten slotte moeten professionals en patiënten beter bij de ontwikkelingen worden betrokken om gevoel van eigenaarschap van de ROM-systematiek te stimuleren. De bemoeienis van de zorgverzekeraars moet worden teruggedrongen. Een vorm van verantwoording voor de jaarlijkse besteding van zo’n 6 tot 7 miljard zorggeld in de GGZ is gepast, maar de GGZ beschouwt het als haar eigen verantwoordelijkheid om een betrouwbare en valide methodiek te ontwikkelen voor het creëren van transparantie over haar waarde.

Edwin de Beurs is hoogleraar Routine Outcome Monitoring en Benchmarken in de Geestelijke Gezondheidszorg, Universiteit Leiden, en hoofd Wetenschappelijk Onderzoek, Stichting Benchmark GGZ


 

Referenties

Algemene Rekenkamer. (2017). Bekostiging van de curatieve geestelijke gezondheidszorg. Retrieved f rom Den Haag:

Barendregt, M. (2015). Benchmarken en andere functies van ROM: back to basics [Benchmarking and other functions of ROM: back to basics]. Tijdschrift voor Psychiatrie, 57, 517-525. Retrieved f rom www.tijdschriftvoorpsychiatrie.nl/assets/articles/57-2015-7-artikel-barendregt.pdf

Buwalda, V.J A., Nugter, M.A., Swildens, J.A., en Mulder, C.L. (Eds.). (2012). Praktijkboek ROM in de ggz; een leidraad voor gebruik en implementatie van meetinstrumenten.

De Beurs, E., Barendregt, M., de Heer, A., van Duijn, E., Goeree, B., Kloos, M., . . . Merks, A. (2016). Comparing methods to denote treatment outcome in clinical research and benchmarking mental health care. Clinical Psychology & Psychotherapy, 23, 308-318. doi:10.1002/cpp.1954

De Beurs, E., Barendregt, M., en Warmerdam, L. (Eds.). (2017a). Behandeluitkomsten: bron voor kwaliteitsbeleid in de GGZ [Treatment outcome: source of quality management in mental Health Care]. Amsterdam: Boom.

De Beurs, E., den Hollander-Gijsman, M.E., Van Rood, Y.R., Van der Wee, N.J., Giltay, E.J., van Noorden, M.S., . . . Zitman, F.G. (2011). Routine outcome monitoring in the Netherlands: Practical experiences with a web-based strategy for the assessment of treatment outcome in clinical practice. Clinical Psychology & Psychotherapy, 18, 1-12. doi:10.1002/cpp.696

De Beurs, E., Warmerdam, E.H., Oudejans, S.C.C., Spits, M., Dingemanse, P., De Graaf, S., . . . Van Son, G.E. (2017b). Treatment outcome, duration, and costs: A comparison of performance indicators using data f rom eight mental health care providers in the Netherlands. Administration and Policy in Mental Health and Mental Health Services Research, 44, 1-12. doi:10.1007/s10488-017-0818-x

De Beurs, E. en Zitman, F. (2007). Routine Outcome Monitoring. Het meten van therapie effect in de klinische practijk met web based software ( Routine Outcome Monitoring: the measurement of treatment effect in clinical practice with webbased software]. Maandblad Geestelijke Volksgezondheid, 62, 13-28.

Delespaul, P., Gunther, N., Drukker, M., Commissaris, K., Driessen, G., Bak, M., . . . Van Os, J. (2008). Zorgmonitor Zuid-Limburg: Instrument voor vraaggerichte Geestelijke Gezondheidszorg voor de hulpverlening en het management. Maastricht: Universitaire Press Maastricht.

Derogatis, L.R. (1975). The Symptom Checklist-90. Baltimore, MD.: Clinical Psychometric Research.

Eijkenaar, F. en Schut, E. (2015). Uitkomstbekostiging in de zorg: een (on)begaanbare weg? Retrieved f rom Rotterdam: http://repub.eur.nl/pub/78057/

Franx, G., Verbeek, M., en Metz, M. (2014). Doorbraakproject ROM 2014-2016. Retrieved f rom Utrecht:

Hafkenscheid, A. en Van Os, J. (2014). Naar een deugdelijke ROM. Maandblad Geestelijke Volksgezondheid, 69, 20-28.

Hamilton, M. (1960). A rating scale for depression. Journal of Neurology, Neurosurgery and Psychiatry, 23, 56-62.

Hannan, C., Lambert, M.J., Harmon, C., Nielsen, S.L., Smart, D.W., Shimokawa, K., en Sutton, S.W. (2005). A lab test and algorithms for identifying clients at risk for treatment failure. Journal of Clinical Psychology in Medical Settings, 61, 155-163. doi:10.1002/jclp.20108

Howard, K.I., Moras, K., Brill, P.L., Martinovich, Z., en Lutz, W. (1996). Evaluation of psychotherapy: Efficacy, effectiveness, and patient progress. American Psychologist, 51, 1059.

Janse, P.D., De Jong, K., Van Dijk, M.K., Hutschemaekers, G.J., en Verbraak, M.J. (2016). Improving the efficiency of cognitive-behavioural therapy by using formal client feedback. Psychotherapy Research, 37, 1-14. doi:10.1080/10503307.2016.1152408

Lambert, M.J. (2010). Prevention of treatment failure. The use measuring, monitoring, and feedback in clinical practice. . Washington, D.C.: American Psychological Association.

Linszen, D.F.E. en De Beurs, E. (2017). Patient experience as measured with the brief CQI: an evaluation. European Journal for Person Centered Healthcare, 5.

Metz, M.J., Franx, G.C., Veerbeek, M.A., De Beurs, E., van der Feltz-Cornelis, C.M., en Beekman, A.T.F. (2015). Shared Decision Making in mental health care using Routine Outcome Monitoring as a source of information: a cluster randomised controlled trial. BMC Psychiatry, 15, 1-10. doi:10.1186/s12888-015-0696-2

Miller, D., Steele Gray, C., Kuluski, K., en Cott, C. (2015). Patient-Centered Care and Patient-Reported Measures: Let’s Look Before We Leap. The Patient – Patient-Centered Outcomes Research, 8, 293-299. doi:10.1007/s40271-014-0095-7

Miller, S.D., Duncan, B.L., Sorrell, R., en Brown, G.S. (2005). The partners for change outcome management system. Journal of Clinical Psychology, 61, 199-208. doi:10.1002/jclp.20111

Nugter, M.A. en Buwalda, V.J. (2012). Achtergronden en gebruiksmogelijkheden van ROM in de ggz. [Background and possible use of ROM in mental health care]. Tijdschrift voor Psychiatrie, 54, 111-120. Retrieved f rom http://www.ncbi.nlm.nih.gov/pubmed/22331531

Obbarius, A., Van Maasakkers, L., Bear, L., Clark, D. M., Crocker, A. G., De Beurs, E., . . . Rose, M. (2017). Standardization of health outcomes assessment for depression and anxiety: recommendations f rom the ICHOM Depression and Anxiety Working Group. Quality of Life Research, 26, 1-15. doi:10.1007/s11136-017-1659-5

ONVZ. (2010). Bestuurlijk akkoord.  Retrieved f rom www.onvz.nl/ONVZ/documenten/2011/bestuurlijk-akkoord-ggz-n-en-zn.pdf

Oudejans, S. en Spits, M. (2018). Snel succes met ROM, een leidraad voor professionals in de GGZ. Houten: Bohn Stafleu van Loghum.

Porter, M.E. en Teisberg, E.O. (2006). Redefining Health care: creating value-based competition on results. Cambridge: Harvard Business Press.

Sawatzky, R., Chan, E.K.H., Zumbo, B.D., Ahmed, S., Bartlett, S.J., Bingham, C.O., . . . Lix, L.M. (2017). Montreal Accord on Patient-Reported Outcomes (PROs) use series–Paper 7: modern perspectives of measurement validation emphasize justification of inferences based on patient reported outcome scores. Journal of Clinical Epidemiology, 89, 154-159. doi:https://doi.org/10.1016/j.jclinepi.2016.12.002

Sytema, S. en Van der Krieke, L. (2013). Routine outcome monitoring: A tool to improve the quality of mental health care? In G. Thornicroft, M. Ruggeri, en D. Goldberg (Eds.), Improving Mental Health Care: The Global Challenge (pp. 246-263). Chichester: John Wiley & Sons.

Van Beurden, P. (2017). GGZ start met Value Based Health care. Zorgvisie.

Van Hees, S., Van der Vlist, P., en Mulder, N. (Eds.). (2011). Van weten naar meten: ROM in de GGZ. Amsterdam: Uitgeverij Boom.

Van Noorden, M.S. (2012). On real-world patients and real-world outcomes : the Leiden Routine Outcome Monitoring Study in patients with mood, anxiety and somatoform disorders. (PhD), Leiden University, Leiden.

Van Os, J., Berkelaar, A., en Hafkenscheid, A. (2017). Benchmarken: doodlopende weg onder het mom van ‘ ROM’. Tijdschrift voor Psychiatrie, 59, 247-250.

Van Os, J., Kahn, R., Denys, D., Schoevers, R.A., Beekman, A.T., Hoogendijk, W.J., . . . Leentjens, A.F. (2012). ROM: Gedragsnorm of dwangmaatregel? Overwegingen bij het themanummer over routine outcome monitoring [Behavioural standard or coercive measure? Some considerations regarding the special issue on ROM]. Tijdschrift voor Psychiatrie, 54, 245-253. doi:TVPart_9345

Van Vught, Y. en van Vemde, N. (2013). ROM vraagt verandering van gedrag en cultuur. Kwaliteit in Zorg, 3, 26-29.

Veerbeek, M.R., Oude Voshaar, R., Depla, M., en Pot, A.M. (2013). Mental health care Monitor Older adults (MEMO): monitoring patient characteristics and outcome in Dutch mental health services for older adults. International Journal of Methods in Psychiatric Research, 22, 100-109. doi:10.1002/mpr.1386

[1] Zo is een gratis generiek instrument voor het veld ontwikkeld, de SQ-48) en zijn er voor stoornisspecifiek meten gecomputeriseerde adaptieve tests ontwikkeld (voor het meten van de ernst van depressieve stemming en angst.

Reacties