Nuancering nodig van de hiërarchische structuur van studieopzetten

Meerwaarde van observationeel onderzoek in chirurgie

Perspectief
Reinier B. Beks
R. Marijn Houwert
Rolf H.H. Groenwold
Citeer dit artikel als
Ned Tijdschr Geneeskd. 2017;161:D1493
Abstract
Download PDF

Samenvatting

De gerandomiseerde placebogecontroleerde trial (RCT) geldt als de gouden standaard voor het evalueren van medische interventies. Observationeel onderzoek daarentegen krijgt doorgaans minder waardering. Voor chirurgisch onderzoek lijkt dit echter niet altijd terecht en daarom is nuancering nodig van de veelgebruikte hiërarchische structuur van onderzoeksopzetten. In plaats van een strikte scheiding aan te brengen tussen de resultaten van RCT’s en die van andere studieopzetten zouden we voor het evalueren van operatieve interventies de resultaten van verschillende onderzoeksopzetten veel meer als complementair aan elkaar moeten zien.

De gerandomiseerde placebogecontroleerde trial (RCT) geldt als de gouden standaard voor het evalueren van medische interventies.1 Patiënten worden gerandomiseerd tussen een interventie- en controlegroep waarbij zowel de patiënt als de behandelaar wordt geblindeerd voor de behandelkeuze. Zo ontstaan 2 vergelijkbare groepen en kunnen waargenomen verschillen in gezondheidsuitkomsten tussen deze onderzoeksgroepen worden toegeschreven aan de interventie.

In observationeel onderzoek naar de effecten van medische interventies vindt geen randomisatie plaats en is blindering niet mogelijk. Hierdoor is deze onderzoeksopzet gevoeliger voor bias, bijvoorbeeld door confounding, en krijgt observationeel onderzoek doorgaans minder waardering.2,3

In de loop der jaren heeft zich een hiërarchie van niveaus van bewijskracht (‘levels of evidence’) ontwikkeld waarin observationeel onderzoek ver onder de RCT wordt ingeschaald. Toch zijn de resultaten van observationeel onderzoek vaak beter te generaliseren door de minder strikte inclusiecriteria, zijn er meer mogelijkheden tot subgroepanalyse en is het onderzoek makkelijker, sneller en voor minder geld uit te voeren dan een RCT.

In de medische literatuur zijn RCT’s over traumachirurgie beperkt vertegenwoordigd. Bovendien wordt slechts een klein deel van de uitgevoerde operaties ondersteund door resultaten van RCT’s.4 Wij vinden dat de eerdergenoemde hiërarchie van bewijsniveaus nuancering behoeft als het gaat om onderzoek naar operatieve interventies in de traumachirurgie en zetten hier uiteen waarom en in welke situaties de resultaten van observationeel onderzoek met name waardevol kunnen zijn en de besluitvorming in de dagelijkse praktijk kunnen ondersteunen.

3 typen onderzoeksvragen

Voor de evaluatie van interventies in de chirurgische kliniek kunnen 3 typen onderzoeksvragen worden onderscheiden.5

Geneesmiddel vs. controlemiddel Type 1-onderzoek richt zich op farmacologische interventies bij chirurgische patiënten, waarbij een bepaald geneesmiddel wordt vergeleken met een placebo of een ander geneesmiddel. Om het risico op bias te minimaliseren is randomisatie een vereiste; blindering van de deelnemer, de behandelaar of beiden is optioneel. Een voorbeeld is een recente RCT waarin het effect van farmacologische tromboseprofylaxe werd vergeleken met dat van placebo bij patiënten die een artroscopie van de knie hadden ondergaan en bij patiënten met onderbeengips.6

Operatie vs. controleoperatie Type 2-onderzoek vergelijkt verschillende operatieve interventies, waarbij patiënten die een bepaalde ingreep ondergaan worden vergeleken met een controlegroep die een alternatieve operatie of een ‘sham’-operatie krijgt. Bij een sham-operatie doorloopt de patiënt hetzelfde traject als de onderzoeksgroep, inclusief anesthesie en gelijke chirurgische incisie, maar zonder de daadwerkelijke ingreep. In tegenstelling tot een farmacologische interventie omvat de operatieve interventie een traject van pre-, peri- en postoperatieve handelingen. Bovendien is elke operatieve interventie een complexe interventie, wat betekent dat de uitkomst ook afhankelijk is van de vaardigheid en expertise van het chirurgische team. Bij type 2-onderzoek gaat het doorgaans niet om de werkzame component van de interventie, zoals bij type 1-onderzoek wel het geval is, maar om het volledige pakket aan handelingen. Type 2-onderzoek is minder gevoelig voor confounding als verwijzing naar de chirurg een willekeurig proces is en er geen aanwijzingen zijn dat de behandelvoorkeur van de chirurg sterk onderhevig is aan patiëntkenmerken.7

Operatie vs. geen operatie Type 3-onderzoek vergelijkt een operatieve interventie met een niet-operatieve interventie, bijvoorbeeld operatie versus conservatief beleid bij patiënten met een fractuur. Net als bij type 2-onderzoek is de operatieve interventie complex. Maar type 3-onderzoek heeft mogelijk een groter risico op confounding dan type 2-onderzoek doordat de patiëntkenmerken een grotere invloed kunnen hebben op het besluit tussen een operatie of conservatief beleid.

RCT in chirurgie

Voor het minimaliseren van confounding is het belangrijk 2 gelijkwaardige groepen te vormen door het willekeurig toewijzen van behandelingen aan de patiënten (randomiseren). Dit is mogelijk in trials met een relatief laagcomplexe interventie, zoals het toedienen van medicatie (type 1-trials).

Een operatie is per definitie een hoogcomplexe handeling, waarbij een goed resultaat afhangt van de expertise van het chirurgische team. Afhankelijk van hoe er wordt gerandomiseerd kan een situatie ontstaan waarin een chirurg een complexe handeling moet uitvoeren die minder binnen zijn expertise valt doordat een alternatieve behandeling de standaard is in zijn praktijk. Dit bemoeilijkt een eerlijke vergelijking van verschillende interventies. Gekoppeld aan technische expertise hebben chirurgen vaak een sterke behandelvoorkeur ontwikkeld, waardoor er onder hen weinig animo kan zijn voor deelname aan een RCT waarin zij verschillende operatieve behandelingen zullen moeten toepassen.5,8 Een alternatief is het randomiseren van patiënten naar behandelaars, die vervolgens alle aan hen toegewezen patiënten opereren met de techniek waarin zij het bekwaamst zijn.

Ook patiënten kunnen een sterke voorkeur hebben voor een bepaalde behandeling en willen daarom niet dat de keuze voor een behandeling afhangt van toeval (randomisatie). Dit geldt met name voor type 3-trials omdat de beide behandelopties enorm verschillen en de chirurgische interventie onomkeerbaar is. Dit maakt patiëntvoorkeur een belangrijk obstakel voor chirurgische RCT’s.5,9 Een voorbeeld hiervan is een type 3-RCT waarin fractuurfixatie van proximale humerusfracturen werd vergeleken met een conservatief beleid, maar waaraan meer dan de helft van de gevraagde patiënten weigerde deel te nemen.10

In een chirurgische RCT kan het blinderen van een patiënt lastig zijn. Een oplossing hiervoor is de eerdergenoemde sham-operatie. Dit type operatie kent ethische bezwaren, omdat het gepaard gaat met operatierisico’s voor een patiënt zonder dat daar mogelijk gunstige effecten tegenover staan. Bovendien is het de vraag of het onderzoek zich richt op een specifieke werkzame component – waarbij blindering noodzakelijk lijkt – of dat er 2 verschillende strategieën worden vergeleken, inclusief de effecten die het gevolg zijn van kennis over de gevolgde strategie – waarbij blindering juist overbodig is. Het is wenselijk de beoordelaar van de uitkomstmaat wel te blinderen, om op die manier het risico op zogenaamde beoordelaarsbias (‘observer bias’) te minimaliseren.

Tot slot is het uitvoeren van gerandomiseerd onderzoek met klinische patiënten duur en zijn middelen vaak slechts in beperkte mate beschikbaar. Hierdoor is de follow-upduur in RCT’s vaak beperkt vergeleken met bijvoorbeeld retrospectief observationeel onderzoek.

Observationeel onderzoek in chirurgie

Observationele studies binnen de chirurgie zijn waardevol voor de evaluatie van gunstige effecten van operatieve behandelingen en het in kaart brengen van complicaties. De inclusiecriteria van observationeel onderzoek zijn minder selectief dan die van RCT’s en daardoor zijn de patiëntencohorten groter en representatiever. Dit betekent dat de resultaten van observationeel onderzoek doorgaans meer van toepassing zijn op de dagelijkse praktijk. Een groter aantal patiënten geeft ook meer inzicht in zeldzame uitkomsten en biedt de mogelijkheid tot subgroepanalyses. Vanzelfsprekend valt of staat de waarde van de resultaten van een observationele studie, net als bij een RCT, met de kwaliteit van de gegevens en een juiste vraagstelling.

Het belangrijkste nadeel van observationeel onderzoek is de gevoeligheid voor bias. Dit risico op bias maakt dat bijvoorbeeld een type 1-onderzoeksvraag vrijwel altijd moet worden beantwoord met een RCT.

Type 2- en type 3-onderzoeksvragen bieden meer plaats voor observationeel onderzoek. Dit wordt ondersteund door een recente meta-analyse naar 2 operatieve behandeltechnieken, plaatfixatie en intramedullaire fixatie, bij patiënten met een midschacht-claviculafractuur waarin zowel de resultaten van RCT’s als die van observationeel onderzoek werden meegenomen;11 dit is dus type 2-onderzoek. Voor de primaire uitkomstmaat, die bestond uit ‘non-union’ en heroperatie, liet observationeel onderzoek inderdaad hetzelfde behandeleffect zien als de RCT’s (tabel 1).11 Uit een andere meta-analyse naar operatief versus conservatief beleid (type 3-onderzoek) bij patiënten met een midschacht-claviculafractuur kwam ook naar voren dat observationeel onderzoek tot dezelfde resultaten leidt als RCT’s (tabel 2).12

De meerwaarde van observationeel onderzoek blijkt uit een analyse naar een minder harde uitkomstmaat als terugkeer naar werk. Waar de RCT’s te klein waren om harde conclusies te kunnen trekken met betrekking tot deze uitkomstmaat, bevatten de observationele onderzoeken voldoende deelnemers om een gunstig effect van operatief ingrijpen op terugkeer naar werk te kunnen concluderen. Dit laat de toegevoegde waarde van schaalvergroting zien door inclusie van observationeel onderzoek, terwijl invloeden van bias minimaal lijken te zijn.

Zoals gezegd is het voor observationeel onderzoek naar chirurgische interventie bij traumatologiepatiënten van belang dat de verwijzing naar de chirurg een willekeurig proces is en er geen aanwijzingen zijn dat de behandelvoorkeur van de chirurg sterk beïnvloedt wordt door patiëntkenmerken. Wanneer niet aan beide voorwaarden wordt voldaan, is er een groot risico op bias en daardoor op verkeerde effectschattingen.

Een voorbeeld hiervan is de vergelijking van de plaatsing van een prothese versus osteosynthese bij patiënten met een heupfractuur. Observationeel onderzoek overschatte het mortaliteitsrisico na behandeling met een prothese met 40% vergeleken met RCT’s.13 In de observationele onderzoeken kozen chirurgen echter sneller voor een prothese bij zwakkere en oudere patiënten, wat een deel van dit gevonden effect verklaart.

Tot slot

Waarom hebben we observationeel onderzoek nodig voor de evaluatie van operatieve behandelingen? De relatief lage kosten en praktische uitvoerbaarheid van dit type onderzoek maken het mogelijk naar de lange-termijnuitkomsten van grote representatieve groepen of subgroepen van patiënten te kijken, terwijl het risico op confounding voor type 2- en type 3-onderzoek relatief klein kan zijn.

Eén aspect hebben we echter nog niet benoemd en dat is het vakmanschap dat nodig is om te opereren en de creativiteit die ontwikkeling van nieuwe chirurgische technieken en behandelmethoden mogelijk maakt. De creativiteit die sommige chirurgen bezitten laat zien wat er allemaal mogelijk is. Dat is niet te vangen in een RCT, maar wel in observationeel onderzoek. De techniek en vaardigheid van de chirurgen die deelnemen aan RCT’s zijn niet altijd representatief voor de vaardigheden van chirurgen in de dagelijkse praktijk. De vertaalslag van de resultaten van een RCT naar de dagelijkse praktijk valt daardoor niet altijd goed te maken.

Voor het evalueren van operatieve interventies zit de kracht in het combineren van de resultaten van RCT’s én observationeel onderzoek. In plaats van een strikte scheiding aan te brengen tussen de resultaten van verschillende onderzoeksopzetten zouden we voor het evalueren van type 2- en type 3-interventies de resultaten van observationeel onderzoek en die van RCT’s veel meer als complementair aan elkaar moeten zien.

Literatuur
  1. Vandenbroucke JP. Observational research, randomised trials, and two views of medical science. PLoS Med. 2008;5:e67. Medlinedoi:10.1371/journal.pmed.0050067

  2. Cole GD, Francis DP. Trials are best, ignore the rest: safety and efficacy of digoxin. BMJ. 2015;351:h4662. Medlinedoi:10.1136/bmj.h4662

  3. Black N. Why we need observational studies to evaluate the effectiveness of health care. BMJ. 1996;312:1215-8. Medlinedoi:10.1136/bmj.312.7040.1215

  4. Lim HC, Adie S, Naylor JM, Harris IA. Randomised trial support for orthopaedic surgical procedures. PLoS ONE. 2014;9:e96745. Medlinedoi:10.1371/journal.pone.0096745

  5. McCulloch P, Taylor I, Sasako M, Lovett B, Griffin D. Randomised trials in surgery: problems and possible solutions. BMJ. 2002;324:1448-51. Medlinedoi:10.1136/bmj.324.7351.1448

  6. Van Adrichem RA, Nemeth B, Algra A, et al. Thromboprophylaxis after knee arthroscopy and lower-leg casting. N Engl J Med. 2017;376:515-25. Medline

  7. Wijdicks FJ, Houwert M, Dijkgraaf M, et al. Complications after plate fixation and elastic stable intramedullary nailing of dislocated midshaft clavicle fractures: a retrospective comparison. Int Orthop. 2012;36:2139-45. Medlinedoi:10.1007/s00264-012-1615-5

  8. Van der Meijden OA, Houwert RM, Hulsmans M, et al. Operative treatment of dislocated midshaft clavicular fractures: plate or intramedullary nail fixation? A randomized controlled trial. J Bone Joint Surg Am. 2015;97:613-9. Medlinedoi:10.2106/JBJS.N.00449

  9. Solomon MJ, McLeod RS. Should we be performing more randomized controlled trials evaluating surgical operations? Surgery. 1995;118:459-67. Medlinedoi:10.1016/S0039-6060(05)80359-9

  10. Rangan A, Handoll H, Brealey S, et al; PROFHER Trial Collaborators. Surgical vs nonsurgical treatment of adults with displaced fractures of the proximal humerus: the PROFHER randomized clinical trial. JAMA. 2015;313:1037-47. Medlinedoi:10.1001/jama.2015.1629

  11. Houwert RM, Smeeing DP, Ahmed Ali U, Hietbrink F, Kruyt MC, van der Meijden OA. Plate fixation or intramedullary fixation for midshaft clavicle fractures: a systematic review and meta-analysis of randomized controlled trials and observational studies. J Shoulder Elbow Surg. 2016;25:1195-203. Medline

  12. Smeeing DP, van der Ven DJ, Hietbrink F, et al. Surgical versus nonsurgical treatment for midshaft clavicle fractures in patients aged 16 years and older: a systematic review, meta-analysis, and comparison of randomized controlled trials and observational studies. Am J Sports Med. 1 november 2016 (epub). Medline

  13. Bhandari M, Tornetta P III, Ellis T, et al. Hierarchy of evidence: differences in results between non-randomized studies and randomized trials in patients with femoral neck fractures. Arch Orthop Trauma Surg. 2004;124:10-6. Medlinedoi:10.1007/s00402-003-0559-z

Auteursinformatie

UMC Utrecht, Utrecht.

Afd. Traumachirurgie: drs. R.B. Beks, arts-onderzoeker; dr. R.M. Houwert, traumachirurg.

Julius Centrum voor Gezondheidswetenschappen en Eerstelijns Geneeskunde: dr. R.H.H. Groenwold, arts-epidemioloog.

Contact dr. R.H.H. Groenwold (r.h.h.groenwold@umcutrecht.nl)

Belangenverstrengeling

Belangenconflict en financiële ondersteuning: geen gemeld.

Auteur Belangenverstrengeling
Reinier B. Beks ICMJE-formulier
R. Marijn Houwert ICMJE-formulier
Rolf H.H. Groenwold ICMJE-formulier

Gerelateerde artikelen

Reacties