Een serie over de waarde van lichamelijk onderzoek

Fysische diagnostiek
26-11-2010
Tjeerd O.H. de Jongh en Joost O.M Zaat
 • Dit artikel is de inleiding op een nieuwe serie in het Nederlands Tijdschrift voor Geneeskunde over de waarde van het lichamelijk onderzoek.

 • Gekoppeld aan deze serie staan op de website (www.ntvg.nl) hoofdstukken uit het nieuwe leerboek over fysische diagnostiek en filmpjes over de uitvoering van het lichamelijk onderzoek.

 • Hoewel lichamelijk onderzoek een essentieel onderdeel is van het diagnostische proces, is er vaak weinig aandacht voor de juiste uitvoering en onvoldoende kennis van de waarde van de bevindingen.

 • Diagnostiek bestaat meestal uit het combineren van vele gegevens uit anamnese en lichamelijk onderzoek. Er is echter alleen onderzoek gedaan naar de waarde van geïsoleerde tests en zelfs daarnaar is weinig goed onderzoek gedaan.

 • De waarde van een bevinding bij het lichamelijk onderzoek wordt het best weergegeven door de ‘likelihood’-ratio, die aangeeft hoe de kans op de aan- of afwezigheid van een aandoening verandert door de uitslag van het onderzoek.

Voor iedere arts is lichamelijk onderzoek een essentieel onderdeel is van het diagnostische proces. Niet voor niets noemen we allerlei beeldvormend onderzoek, laboratoriumbepalingen en elektrofysiologisch onderzoek ‘aanvullende diagnostiek’. Goed lichamelijk onderzoek is vaak zinvol en leuk om te doen. Toch is er in de opleiding en de praktijk vaak weinig aandacht voor de juiste uitvoering ervan en is er gebrek aan kennis over de waarde van de bevindingen.

Het Nederlands Tijdschrift voor Geneeskunde publiceert de komende maanden een serie korte artikelen waarin we een overzicht geven van de waarde van verschillende onderdelen van het lichamelijk onderzoek. De serie is nadrukkelijk bedoeld voor iedereen, van student tot ervaren rot in het vak.

Op onze website (www.ntvg.nl) staan hoofdstukken uit het leerboek Fysische Diagnostiek met achtergrondinformatie en illustratieve films die laten zien hoe het onderzoek uitgevoerd moet worden. Klik hier voor het eerste hoofdstuk uit het leerboek Fysische Diagnostiek.

Het diagnostisch proces

Diagnostiek is een continu proces dat begint op het moment dat de patiënt de spreekkamer binnenkomt of de specialist de verwijsbrief leest, en dat eindigt wanneer de definitieve diagnose is gesteld. Artsen hebben meestal vanaf het begin van het artspatiëntcontact al diagnostische hypothesen. Zij gebruiken de informatie uit de voorgeschiedenis, anamnese en lichamelijk onderzoek om hun lijst van diagnostische hypothesen bij te stellen.1 Als na het lichamelijk onderzoek nog onvoldoende zekerheid is over de diagnose, volgt aanvullend onderzoek of wordt de tijd als diagnosticum gebruikt.

De uitvoering van anamnese en lichamelijk onderzoek lijkt in het gedrang te komen in de huidige tijd met zijn vele geavanceerde technische onderzoeksmogelijkheden, ten onrechte. Nog steeds wordt de diagnose voor 70% gesteld op basis van de informatie uit anamnese en lichamelijk onderzoek.2 Aan de andere kant overschatten artsen de waarde van lichamelijk onderzoek nog al eens. Niet voor niets heeft beeldvormende diagnostiek een belangrijke plaats gekregen bij de diagnose ‘acute appendicitis’ en is de warme hand van de chirurg niet meer doorslaggevend bij de beslissing wel of geen appendectomie uit te voeren.

Een serie over fysische diagnostiek

Sinds 1999 zijn in dit Tijdschrift onder de titel ‘Fysische Diagnostiek’ artikelen verschenen over de uitvoering en de waarde van een aantal tests en onderzoeken van organen. Ook de JAMA publiceerde de afgelopen jaren een dergelijke serie.

Het leek ons tijd voor een nieuwe serie korte artikelen waarin de huidige kennis over de waarde van een aantal onderzoeken kort wordt weergegeven. We doen het echter anders dan in de eerdere serie en ook anders dan andere tijdschriften. Op papier geven we u op 2 of 3 pagina’s een overzicht. Dat is natuurlijk heel beknopt en daarom verwijzen we voor een uitgebreide beschrijving van de tests naar de NTvG-website, waar u ook het bijbehorende filmmateriaal kunt bekijken. Op de site staat verder de uitgebreide wetenschappelijke verantwoording. De serie is gebaseerd op het leerboek Fysische diagnostiek, dat in juni van dit jaar verscheen.3 Voor de verantwoording hier klikken.

De betrouwbaarheid van lichamelijk onderzoek

De technische uitvoering van het lichamelijk onderzoek en de verschillende aanvullende tests is in Nederland weinig gestandaardiseerd. In het cursorisch onderwijs aan de 8 medische faculteiten worden verschillende leerboeken gebruikt met soms forse verschillen in de uitvoering van de fysische diagnostiek. In de coassistentschappen en vervolgopleidingen bepaalt de meester-gezelverhouding meestal dat een assistent de handelwijze van de opleider kopieert. Onderzoeksmethoden worden zodoende van generatie op generatie overgedragen en zelden getoetst op betrouwbaarheid. Een van de gevolgen is dat er veel onderzoeksmethoden in gebruik zijn waarvan de waarde niet bekend is.

Bij onderzoek naar de waarde van tests valt op dat er een grote intra- en interdoktervariatie bestaat van de uitvoering en beoordeling, hetgeen leidt tot lage kappawaarden (zie uitlegkader). Dit komt onder andere doordat de criteria voor afwijkingen soms moeilijk te omschrijven zijn. Wanneer is longauscultatie afwijkend en wanneer noemen we een dikke enkel oedemateus? Ook is het dubbelblind beoordelen van tests vaak moeilijk.

Bij het schrijven van het boek en deze serie bleek dat er wereldwijd verrassend weinig betrouwbaar onderzoek is verricht naar de waarde van al dan niet afwijkende bevindingen bij alledaags lichamelijk onderzoek.

Wetenschappelijk waarde van de bevindingen

Diagnostiek is in feite het uitvoeren van een serie opeenvolgende tests, te beginnen met patiëntkenmerken zoals leeftijd, gevolgd door informatie uit anamnese en lichamelijk onderzoek. Hierdoor is zelfs de waarde van één goed uitgevoerde test met een betrouwbare uitkomst beperkt. Eén test levert zelden het bewijs voor een bepaalde diagnose, het maakt deze alleen waarschijnlijker of onwaarschijnlijker. Om deze verandering van een voorafkans (a-priorikans) in een achterafkans (a-posteriorikans) weer te geven gebruiken we in het boek en deze serie artikelen de term ‘likelihood’-ratio (LR) (zie uitlegkader en figuur). De LR is onafhankelijk van de a-priorikans.

Sensitiveit en specificiteit zijn testeigenschappen en zijn daardoor minder belangrijk voor het individu, dat vooral gebaat is bij kennis van de achterafkans op een afwijking. LR’s lijken ook wat makkelijker te interpreteren dan de kale testkenmerken.4 Uit de sensitiviteit en specificiteit zijn wel de LR van de positieve test (LR+) en de LR van de negatieve test (LR-) af te leiden. Zie figuur 2:

Hoewel de LR+ en LR- goede maten zijn om de waarde van een test weer te geven, zijn er ook onzekerheden. ‘De’ LR bestaat namelijk niet; de weergegeven LR’s zijn door zeer ervaren onderzoekers bepaald in een grote patiëntengroep. Voor het onderzoek van één arts bij één patiënt kan deze anders zijn:

Likelihoodratio’s zijn dus niet de ultieme maten, maar ze zijn redelijk bruikbaar bij het vergelijken van verschillende tests. Een test met een LR+ van 5 is beter dan één met een LR+ van 2 om een gezochte aandoening aan te tonen; een test met een LR- van 0,1 is geschikter voor het uitsluiten van een diagnose dan een test met een LR- van 0,7.

 • de LR+ zal voor een onervaren arts of student lager zijn;

 • de LR+ zal bij zeer zieke patiënten hoger zijn. Als de LR+ voor pneumonie bij koorts verhoogd is, zal deze bij 40°C sterker verhoogd zijn dan bij 38,5°C;

 • de LR+ is ook afhankelijk van andere symptomen bij de patiënt. Bij een asymptomatisch iemand zal deze lager zijn;

 • omdat de LR’s berekend worden uit de sensitiviteit en specificiteit, zijn de ratio’s ook ‘echelon-afhankelijk’. Beide testkenmerken kunnen immers nogal verschillen in verschillende populaties.

Conclusie

Het is moeilijk om de bevindingen van lichamelijk onderzoek betrouwbaar te interpreteren. Toch is het voor iedere arts van groot belang zo goed mogelijk op de hoogte te zijn van de waarde van de handelingen die hij of zij dagelijks verricht. Daar dragen we met deze serie aan bij.

uitleg

Enkele in de serie gebruikte begrippen:

 • Betrouwbaarheidsinterval (95%-BI): 95% zekerheid dat de werkelijke waarde tussen de intervalwaarden ligt.

 • Kappa (κ): de graad van overeenstemming tussen 2 metingen bij een persoon, of tussen dezelfde soort meting door 2 verschillende personen.

 • ‘Likelihood’-ratio: het getal waarmee men een de voorafkans vermenigvuldigt om te komen tot de achterafkans.

 • ‘Likelihood’-ratio, negatief (LR-): de kans op een negatieve bevinding bij personen met de afwijking gedeeld door de kans op een negatieve uitslag bij personen zonder die afwijking.

 • ‘Likelihood’-ratio, positief (LR+): de kans op een positieve bevinding bij personen met de afwijking gedeeld door de kans op een positieve bevinding bij personen zonder die afwijking.

 • Odds: een quotiënt van kansen, namelijk de kans dat een gebeurtenis optreedt gedeeld door de kans dat de gebeurtenis niet optreedt. In algebraïsche vorm: p/(1-p); in woorden: ‘3 tegen 1 dat de test een correcte uitslag geeft’ (p is dan 75%).

 • Oddsratio (OR): de verhouding tussen de odds voor en na de test.

Leerpunten

 • De uitkomst van het lichamelijk onderzoek bepaalt in aanvulling op de anamnese of aanvullend onderzoek nodig is en zo ja, welk onderzoek.

 • Om lichamelijk onderzoek in het diagnostisch proces zinvol te laten zijn, dient men op de hoogte te zijn van de juiste techniek en de waarde van de bevindingen.

 • De ‘likelihood’-ratio geeft het beste aan in hoeverre de kans op een aandoening verandert door de uitkomst van een test.

 • Er is nog weinig betrouwbaar wetenschappelijk onderzoek naar de waarde van het lichamelijk onderzoek.

Literatuur

 1. Grundmeijer HG, Reenders K, Rutten GE. Het geneeskundig proces. Maarsen: Elsevier gezondheidszorg; 2009.

 2. Sandler G. Costs of unnecessary tests. BMJ. 1979;2:21-4.

 3. De Jongh TOH (red). Fysische diagnostiek. Houten: Bohn Stafleu van Loghum; 2010.

 4. Vermeersch P, Bossuyt X. Comparative analysis of different approaches to report diagnostic accuracy. Arch Intern Med. 2010; 170:734-5.