Een model voor observationele studies

De hypothetische trial

Illustratie van een tafel teksten erop en mensen eromheen
Marleen M.H.J. van Gelder
Laura Rodwell
Kit C.B. Roes
Citeer dit artikel als
Ned Tijdschr Geneeskd. 2023;167:D7702
Abstract
Download PDF

Gerandomiseerde trials (RCT’s) worden vaak als ideale studie-opzet gezien om causale verbanden aan te tonen. Maar wat als een trial niet mogelijk is? Door observationele studies te ontwerpen als een gerandomiseerde trial, kunnen een aantal methodologische beperkingen geadresseerd worden.

Samenvatting

Causale vraagstellingen worden idealiter beantwoord met gerandomiseerde trials, maar om praktische, ethische of methodologische redenen is dit niet altijd verantwoord of haalbaar. Om toch een betrouwbaar antwoord te krijgen op causale vraagstellingen met observationele data, is enkele jaren geleden de benadering geïntroduceerd waarbij een observationele studie wordt ontworpen, uitgevoerd en geanalyseerd met een hypothetische trial als model. Na het opstellen van een causale vraagstelling, wordt in deze benadering eerst het protocol van de hypothetische trial gedefinieerd aan de hand van zeven elementen: inclusie- en exclusiecriteria, behandelopties, toewijzen van behandeling, begin en eind van follow-up, uitkomstparameter, causale contrast en statistische analyse. Vervolgens worden deze protocolelementen nagebootst met observationele data. Deze benadering adresseert methodologische valkuilen voorafgaand aan de studie, maakt conclusies eenduidiger en geeft een gestructureerd beeld van beperkingen van observationele studies alsmede gerandomiseerde trials. We zien dat deze benadering steeds vaker toegepast wordt voor het onderzoeken van causale verbanden.

artikel

Wat is het effect van het gebruik van antidepressiva tijdens de zwangerschap op het gewicht van het kind? Welke covid-19-vaccinatie beschermt het best tegen ziekenhuisopname? Verhogen anti-epileptica met psychotrope werking het risico op diabetes type 2? Idealiter worden dit soort causale vraagstellingen beantwoord met een RCT, maar vaak is dit niet mogelijk vanwege praktische, ethische of methodologische bezwaren. Zo ook bij deze voorbeelden. We zijn dan aangewezen op observationele data, waarvan vaak beweerd wordt dat hiermee geen causaliteit aangetoond kan worden vanwege het risico op confounding en andere vormen van vertekening (zie kader rechts bovenaan de pagina).1

Om meer betrouwbare causale conclusies te kunnen trekken uit observationele studies, introduceerden Hernán en Robins in 2016 de zogenoemde ‘target trial approach’.2 Daarin wordt een observationele studie ontworpen, uitgevoerd en geanalyseerd alsof het een RCT betreft. Deze benadering heeft als voordeel dat de vraagstelling aangescherpt en causaal geformuleerd wordt en dat methodologische uitdagingen systematisch geadresseerd worden voordat de studie van start gaat. Het maakt ook conclusies eenduidiger en geeft een gestructureerd beeld van kritiekpunten van zowel de ideale RCT (bijvoorbeeld met betrekking tot haalbaarheid en generaliseerbaarheid) als de observationele studie (interne validiteit). We bespreken in dit artikel eerst de theoretische opzet aan de hand van een recent gepubliceerd artikel, gevolgd door een reflectie op deze benadering.

Begin bij het begin: de vraagstelling

Het onderzoeken van een causaal verband begint bij het stellen van een causale vraag,3 die essentieel is voor het opzetten van een studie, ongeacht de opzet. Dit lijkt een open deur, maar in de praktijk zien we dat het een uitdaging kan zijn om de vraagstelling specifiek genoeg te formuleren.

Neem de eerste voorbeeldvraagstelling: wat is het effect van het gebruik van antidepressiva tijdens de zwangerschap op het gewicht van het kind? Deze vraagstelling is veel te vaag. Welke antidepressiva: selectieve serotonineheropnameremmers, tricyclische antidepressiva of alle groepen bij elkaar? Hoe zit het met de dosis? Is er onderscheid tussen nieuwe gebruikers, chronische gebruikers en vrouwen die stoppen met het gebruik? Gebruik op enig moment tijdens de zwangerschap of in een specifiek trimester? Maar ook over de uitkomstmaat zijn onduidelijkheden: zijn we geïnteresseerd in het effect op geboortegewicht, het gewicht van het kind op 5-jarige leeftijd of het verloop van het gewicht tijdens de eerste 10 levensjaren?

Een goede vraagstelling specificeert de te vergelijken interventies of blootstellingen, het causale contrast dat we willen onderzoeken en uitkomstmaat en doelpopulatie. De gehele vraagstelling, geformuleerd als PICO (patiëntengroep, interventie, controle-behandeling en uitkomsten), is leidend voor de studie-opzet.

Het onderzoeksprotocol

De benadering waarbij een observationele studie wordt ontworpen naar het model van een RCT, behelst twee stappen.2 Eerst wordt het protocol ontwikkeld van een hypothetische RCT die antwoord geeft op de causale onderzoeksvraag. Dit protocol bevat de inclusie- en exclusiecriteria van de studiepopulatie, de behandelopties, de manier van het toewijzen van behandeling, het begin en einde van follow-up, de uitkomstparameter, het causale contrast en statistische analyse. Dit komt overeen met het onlangs gepubliceerde ‘estimand framework’ in ICH E9 (R1) van het International Council for Harmonisation of Technical Requirements for Pharmaceuticals for Human Use, een richtlijn voor de statistische principes van klinische trials.4 Deze hypothetische trial wordt de modelstudie voor de uiteindelijke observationele studie.

De tweede stap is het expliciet nabootsen van de zeven protocolelementen met het gebruik van observationele data. In een recent onderzoek werd deze benadering gebruikt voor het beantwoorden van de vraagstelling: ‘Wat is het effect van een multimodaal prehabilitatieprogramma vergeleken met gebruikelijke zorg op perioperatieve uitkomsten bij patiënten met colorectaal carcinoom met een verhoogd risico op postoperatieve complicaties?’5 RCT’s op dit gebied laten wellicht een té positief effect zien, omdat deze onder ideale omstandigheden zijn uitgevoerd. De patiënten die meedoen aan een RCT hebben vaak meer motivatie om het programma ook daadwerkelijk af te maken. Het supplement bevat de specificatie van de hypothetische trial en de observationele analyse zoals toegepast in deze studie.

Inclusie- en exclusiecriteria

De observationele studie heeft dezelfde inclusie- en exclusiecriteria als de hypothetische trial. Een belangrijk punt hierbij is dat deze criteria niet gebaseerd kunnen zijn op gebeurtenissen die pas na inclusie kunnen plaatsvinden, bijvoorbeeld ‘excludeer patiënten die een myocardinfarct krijgen tijdens de follow-up’. Deze criteria kunnen namelijk niet toegepast worden in een RCT en kunnen leiden tot vertekening van de resultaten van zowel gerandomiseerde als observationele studies.6 Wanneer toch dergelijke criteria van toepassing zijn, moeten deze patiënten alsnog meegenomen worden in de follow-up en geanalyseerd worden in lijn met de vraagstelling.

Behandelopties

Een placebo-gecontroleerde studie kan niet worden nagebootst in een observationele studie. Daardoor kunnen alleen behandelopties uit de reguliere zorg met elkaar vergeleken worden in een zogeheten ‘pragmatische trial’. In de observationele studie nemen we dus alle patiënten mee die aan de inclusiecriteria voldoen en die met een van de behandelopties beginnen zoals gespecificeerd in de causale vraag. Patiënten die met een andere behandeling beginnen worden daarom niet meegenomen in de studie. Door het begin van de behandeling als uitgangspunt te nemen, worden alleen nieuwe gebruikers meegenomen, wat diverse vormen van bias kan voorkomen.7 Zo worden bijvoorbeeld patiënten die de therapie al jaren gebruiken niet meegenomen, wat voorkomt dat je alleen naar patiënten kijkt die relatief weinig bijwerkingen hebben.

Toewijzen van behandeling

In een RCT beslist toeval welke behandeloptie een patiënt krijgt. Randomisatie zorgt ervoor dat de groepen gemiddeld genomen vergelijkbaar zullen zijn ten aanzien van prognostische kenmerken, zoals leeftijd en leefstijlfactoren. In een observationele studie beslist de behandeld arts of de patiënt zelf welke behandeloptie wordt ingezet, vaak gebaseerd op kenmerken van de patiënt. Hierdoor verschilt de prognose tussen de behandelopties. Om de hypothetische trial na te bootsen, moet daarom in de observationele studie gecorrigeerd worden voor alle confounders bij aanvang van de studie (‘baseline confounders’) om de behandelgroepen zo vergelijkbaar mogelijk te maken (zie kader rechts bovenaan de pagina). Het is dus essentieel om deze confounders systematisch te identificeren en te meten.

Follow-up

Bij de hypothetische trial begint de follow-up op het moment van randomiseren en eindigt de follow-up op het moment van diagnose van de uitkomstmaat, concurrerend risico (overlijden, ‘loss to follow-up’) of het bereiken van het einde van de onderzoeksperiode (bijvoorbeeld 5 jaar).8 Het definiëren van het begin van de follow-up kan echter een uitdaging zijn in observationele studies. Dat is met name het geval wanneer een patiënt op meerdere momenten aan de inclusiecriteria kan voldoen, bijvoorbeeld wanneer een vrouw op 16-jarige leeftijd en op 35-jarige leeftijd met de pil begint, of wanneer dit moment varieert tussen patiënten. Het correct definiëren van de start van follow-up is van belang voor de preventie van ‘immortal time bias’ (zie kader rechts bovenaan de pagina).9 Hierbij zijn tijdsintervallen verkeerd geclassificeerd of ten onrechte buiten beschouwing gelaten, waardoor sommige tijdsperiodes onterecht gelden als ‘blootgesteld aan een interventie’, terwijl de behandeling pas op een later moment begint. Dit kan alleen voorkomen worden als het begin van de behandeling en dus ook het begin van de follow-up samenvalt met het voldoen aan de inclusie- en exclusiecriteria.

Uitkomstparameter

Blindering van degene die de uitkomstmaat vaststelt voorkomt dat kennis over de blootstellingsstatus, behandeling A of behandeling B, invloed heeft op het beoordelen van de uitkomstmaat. In observationele studies is dit onmogelijk, doordat de zorgverlener op de hoogte is van de behandelstatus. Daarnaast is het tijdstip en frequentie van vaststellen van de uitkomstparameter niet volgens een onderzoeksprotocol vast te leggen. Gegevens over de betrouwbaarheid van de observationele data met betrekking tot de uitkomstparameter zouden bij voorkeur bekend moeten zijn, bijvoorbeeld uit validatiestudies.10 Dit geeft inzicht in het potentieel voor vertekening en vormt de basis voor eventuele sensitiviteitsanalyses.

Causale contrast

In RCT’s zijn vaak twee causale effecten interessant: het ‘intention-to-treat’-effect –wat is het effect van toewijzing aan de behandeling, ongeacht of de patiënt deze strategie ook daadwerkelijk volgt – en het per-protocoleffect – wat is het effect van het volgen van de behandeling zoals vastgesteld in het protocol. De bovengenoemde estimand-framework-richtlijn heeft dit verder verfijnd,4 en definieert in plaats van een per-protocolanalyse meer gerichte contrasten en bijbehorende analyses.11 Een voorbeeld hiervan is het schatten van het effect in de populatie van patiënten die een behandeling lang genoeg kunnen verdragen. Dit is geen subgroep en wordt ook niet geadresseerd met een per-protocolanalyse, maar vraagt een toegespitste modellering. Met de observationele data wordt getracht afgeleiden van deze causale effecten te schatten.

Statistische analyse

Het schatten van een intention-to-treat-effect is zelden mogelijk in de observationele analyse van bestaande data. Het hebben van een voorschrift voor een bepaalde behandeling komt in de buurt, maar in veel databases zijn alleen gegevens over verstrekkingen beschikbaar. Het initiëren of continueren van behandeling tijdens de follow-up dient bij het schatten van het intention-to-treat-effect niet meegenomen te worden, waardoor correctie voor baseline confounders volstaat. Voor observationele studies kan een deel van dergelijke vragen met traditionelere regressieanalyses beantwoord worden, maar het kan ook zijn dat gebruikgemaakt moet worden van meer geavanceerde benaderingen (causale inferentie),12 zoals stratificatie, matching (bijvoorbeeld op basis van de ‘propensity score’),13 standaardisatie en weging (‘inverse probability of treatment weighting’).

Reflectie

Door een causale vraag te beantwoorden aan de hand van een observationele studie die is vormgegeven naar het model van een hypothetische trial, kunnen veel methodologische valkuilen op basis van intuïtie en zonder ingewikkelde formules vermeden worden. Dat geldt met name voor vormen van bias gerelateerd aan tijd.14 Door de observationele analyse direct te vergelijken met de opzet van een hypothetische trial, wordt ook duidelijk waar de beperkingen van de observationele opzet liggen en of deze afwijkingen kunnen leiden tot onvermogen om de causale vraag te beantwoorden met de beschikbare gegevens. Het verdient dan ook de aanbeveling om de tabel met protocolelementen op te nemen in manuscripten van studies waarin deze benadering gebruikt wordt.

Het onderzoek dat hier als voorbeeld diende,5 concludeerde dat multimodale prehabilitatie leidt tot een klinisch significante reductie van complicaties en opnameduur, overeenkomstig met voorgaande RCT’s. Er waren echter wel verschillen in inclusie- en exclusiecriteria, toewijzen van behandeling, begin van follow-up en statistische analyse tussen de hypothetische trial en de uiteindelijke observationele data-analyse (Supplement). Deze verschillen leken te gering om de conclusie van de studie in twijfel te trekken, hoewel er nog potentieel was voor residuele confounding, dat wil zeggen: vertekening doordat de behandelgroepen ondanks statistische correctie toch niet volledig vergelijkbaar zijn. Naast de toepassing bij de opzet van onderzoek – waarbij wij sterk aanraden om methodologische expertise in te schakelen – kan de target-trialbenadering ook behulpzaam zijn bij het kritisch evalueren van literatuur, zowel om individuele studies te beoordelen als om meerdere studies met tegenstrijdige resultaten te vergelijken.

In de afgelopen jaren zien we dat het modelleren van observationele studies naar een hypothetische trial aan populariteit wint (figuur), met toepassingen in diverse onderzoeksvelden en verfijningen van de oorspronkelijke benadering. Zo is de benadering onder andere ingezet in onderzoek naar de effectiviteit van de derde dosis van verschillende mRNA-vaccins op covid-19-gerelateerde uitkomstmaten,15 effectiviteit van clomifeen versus letrozol voor ovulatie-inductie,16 en de veiligheid van directwerkende orale anticoagulantia in vergelijking met een vitamine K-antagonist.17 Voor de meeste toepassingen is vooralsnog gebruikgemaakt van secundaire databronnen (‘real world data’) afkomstig uit patiëntendossiers, declaratiegegevens en ziekteregistraties, maar de eerste studies met primaire dataverzameling geïnformeerd door deze benadering zijn ook recent verschenen.18,19

Figuur
Toename populariteit van de hypothetische trial
Figuur | Toename populariteit van de hypothetische trial
Weergave van het aantal observationele studies dat is gemodelleerd naar een hypothetische trial in de periode 2016-2022, na publicatie van deze benadering door Hernán en Robins.[2] De blauwe grafieklijn geeft het aantal citaties van dat oorspronkelijke artikel volgens Web of Science; de rode grafieklijn het aantal publicaties in PubMed met ‘target trial’ emulat* in de titel of het abstract.

Het nabootsen van een hypothetische trial met observationele data heeft ons inziens het potentieel om de kwaliteit en interpretatie van observationele studies te verbeteren. Het zal echter nooit alle kritiekpunten van trialpuristen kunnen weerleggen, met name het ontbreken van randomisatie en daardoor het onvermogen om residuele confounding uit te kunnen sluiten. Daarnaast is er discussie over het nut en de noodzaak van het berekenen van de steekproefomvang bij observationele studies naar causale effecten, dat ingewikkelder ligt dan bij gerandomiseerde trials.20,21 Desalniettemin biedt het een systematiek waarmee de waarde van observationele data vergroot kan worden, zodat er causale verbanden mee kunnen worden aangetoond die relevant zijn voor de gezondheidszorg of maatschappij in het algemeen.

Literatuur
  1. Groenwold RHH. Verstoring in observationeel onderzoek: ‘confounding’. Methodologie van onderzoek 2. Ned Tijdschr Geneeskd. 2012;156:A4221 Medline.
  2. Hernán MA, Robins JM. Using big data to emulate a target trial when a randomized trial is not available. Am J Epidemiol. 2016;183:758-64. doi:10.1093/aje/kwv254. Medline
  3. Hernán MA. The C-word: scientific euphemisms do not improve causal inference from observational data. Am J Public Health. 2018;108:616-9. doi:10.2105/AJPH.2018.304337. Medline
  4. European Medicines Agency. ICH E9 (R1) addendum on estimands and sensitivity analysis in clinical trials to the guideline on statistical principles for clinical trials, geraadpleegd op 15 maart 2023.
  5. Heil TC, Verdaasdonk EGG, Maas HAAM, et al. Improved postoperative outcomes after prehabilitation for colorectal cancer surgery in older patients: an emulated target trial. Ann Surg Oncol. 2023;30:244-54. doi:10.1245/s10434-022-12623-9. Medline
  6. Hernán MA, Hernández-Díaz S, Robins JM. A structural approach to selection bias. Epidemiology. 2004;15:615-25. doi:10.1097/01.ede.0000135174.63482.43. Medline
  7. Lund JL, Richardson DB, Stürmer T. The active comparator, new user study design in pharmacoepidemiology: historical foundations and contemporary application. Curr Epidemiol Rep. 2015;2:221-8. doi:10.1007/s40471-015-0053-5. Medline
  8. Van Kruijsdijk RCM, Eijkemans MJC, Visseren FLJ. Concurrerende risico’s in klinisch onderzoek. Ned Tijdschr Geneeskd. 2012;156:A5176 Medline.
  9. Yadav K, Lewis RJ. Immortal time bias in observational studies. JAMA. 2021;325:686-7. doi:10.1001/jama.2020.9151. Medline
  10. van Gelder MMHJ, Vorstenbosch S, Derks L, Te Winkel B, van Puijenbroek EP, Roeleveld N. Web-based questionnaires to assess perinatal outcome proved to be valid. J Clin Epidemiol. 2017;90:136-43. doi:10.1016/j.jclinepi.2017.07.004. Medline
  11. Luijken K, van Eekelen R, Gardarsdottir H, Groenwold RHH, van Geloven N. Tell me what you want, what you really really want: Estimands in observational pharmacoepidemiologic comparative effectiveness and safety studies. Pharmacoepidemiol Drug Saf. 2023;32:863-72. doi:10.1002/pds.5620. Medline
  12. Hernán MA, Robins JM. Causal inference: what if. Boca Raton: Chapman & Hall/CRC; 2020.
  13. Groenwold RHH. ‘Propensity scores’ in observationeel onderzoek. Ned Tijdschr Geneeskd. 2013;157:A6179 Medline.
  14. Hernán MA, Sauer BC, Hernández-Díaz S, Platt R, Shrier I. Specifying a target trial prevents immortal time bias and other self-inflicted injuries in observational analyses. J Clin Epidemiol. 2016;79:70-5. doi:10.1016/j.jclinepi.2016.04.014. Medline
  15. Dickerman BA, Gerlovin H, Madenci AL, et al. Comparative effectiveness of third doses of mRNA-based COVID-19 vaccines in US veterans. Nat Microbiol. 2023;8:55-63. doi:10.1038/s41564-022-01272-z. Medline
  16. Yland JJ, Chiu YH, Rinaudo P, Hsu J, Hernán MA, Hernández-Díaz S. Emulating a target trial of the comparative effectiveness of clomiphene citrate and letrozole for ovulation induction. Hum Reprod. 2022;37:793-805. doi:10.1093/humrep/deac005. Medline
  17. Melgaard L, Overvad TF, Jensen M, et al. Effectiveness and safety of NOAC versus warfarin in patients with atrial fibrillation and aortic stenosis. J Am Heart Assoc. 2021;10:e022628. doi:10.1161/JAHA.121.022628. Medline
  18. Tran VT, Perrodeau E, Saldanha J, Pane I, Ravaud P. Efficacy of first dose of covid-19 vaccine versus no vaccination on symptoms of patients with long covid: target trial emulation based on ComPaRe e-cohort. BMJ Med. 2023;2:e000229. doi:10.1136/bmjmed-2022-000229. Medline
  19. Scheidell JD, Townsend T, Ban KF, et al. Cessation of self-reported opioid use and impacts on co-occurring health conditions. Drug Alcohol Depend. 2023;242:109712. doi:10.1016/j.drugalcdep.2022.109712. Medline
  20. Hernán MA. Causal analyses of existing databases: no power calculations required. J Clin Epidemiol. 2022;144:203-5. doi:10.1016/j.jclinepi.2021.08.028.
  21. Morris TP, van Smeden M. Causal analyses of existing databases: the importance of understanding what can be achieved with your data before analysis (commentary on Hernán). J Clin Epidemiol. 2022;142:261-3. doi:10.1016/j.jclinepi.2021.09.026. Medline
Auteursinformatie

Radboudumc, afd. Health Evidence, Nijmegen: dr. M.M.H.J van Gelder, farmaco-epidemioloog; dr. L. Rodwell, biostatisticus; prof.dr. K.C.B. Roes, statisticus.

Contact M.M.H.J. van Gelder (marleen.vangelder@radboudumc.nl)

Belangenverstrengeling

Belangenconflict en financiële ondersteuning: geen gemeld.

Auteur Belangenverstrengeling
Marleen M.H.J. van Gelder ICMJE-formulier
Laura Rodwell ICMJE-formulier
Kit C.B. Roes ICMJE-formulier
Informatiekader
Heb je nog vragen na het lezen van dit artikel?
Check onze AI-tool en verbaas je over de antwoorden.
ASK NTVG

Ook interessant

Reacties