Dwalingen in de methodologie. XXVI. De ecologische valkuil en zijn minder bekende tegenhanger, de atomistische valkuil

Klinische praktijk
J.P. Mackenbach
Citeer dit artikel als
Ned Tijdschr Geneeskd. 2000;144:2097-100
Abstract
Download PDF

Samenvatting

- Veel epidemiologisch onderzoek werkt met individuen als eenheid van waarneming en analyse, maar in een zogenaamde ecologische onderzoeksopzet vormen groepen (schoolklassen, bedrijven, buurten, landen) de onderzoekseenheid.

- Wanneer men uit een onderzoek op groepsniveau conclusies wil trekken over verbanden tussen determinant en ziekte op individueel niveau, loopt men het risico in de zogenaamde ecologische valkuil te belanden: het verband op groepsniveau hoeft namelijk geen goede afspiegeling te zijn van het verband op individueel niveau.

- Omgekeerd kan men in de atomistische valkuil terechtkomen wanneer men uit een onderzoek op individueel niveau conclusies wil trekken over verbanden op groepsniveau: het verband tussen determinant en ziekte op groepsniveau hoeft namelijk niet uitsluitend te berusten op het verband op individueel niveau.

In het meeste epidemiologische onderzoek is de eenheid van waarneming en analyse het individu. Soms is dat niet het geval, maar is de onderzoekseenheid een groep personen, bijvoorbeeld een schoolklas, een bedrijf, een buurt of een land. In dat geval spreken we van een ecologische onderzoeksopzet.

Het verschil tussen beide typen onderzoek kan eenvoudig geïllustreerd worden aan de hand van het befaamde onderzoek van Doll en Hill naar het verband tussen roken en longkanker.1 Voor dit onderzoek benaderden zij alle artsen in Groot-Brittannië; zij stelden hun enkele vragen over rookgewoonten en wachtten vervolgens gedurende een aantal jaren af om te zien bij wie zich longkanker ontwikkelde. Bij de analyse van de onderzoeksgegevens deelden zij alle individuele dokters in een groep ‘rokers’ en een groep ‘niet-rokers’ in en daarna vergeleken zij de frequentie van longkanker in beide groepen.1 2 Doll en Hill hadden voor de vaststelling van het verband tussen roken en longkanker ook kunnen kiezen voor een ecologische onderzoeksopzet, bijvoorbeeld door van iedere Engelse regio het percentage rokers vast te stellen en vervolgens een aantal jaren de frequentie van longkanker in elk van die regio's bij te houden. Bij de analyse van hun onderzoeksgegevens hadden zij dan de longkankerfrequentie in regio's met een hoog percentage rokers kunnen vergelijken met die in regio's met een laag percentage rokers.3 4

Gegeven het feit dat Doll en Hill geïnteresseerd waren in het verband tussen roken en longkanker op individueel niveau (hun vraag was: ‘Hebben rokers een grotere kans op longkanker dan niet-rokers?’), is de door hen gekozen onderzoeksopzet superieur aan het ecologische alternatief. Of longkanker ook daadwerkelijk meer voorkomt onder rokers blijft namelijk in een ecologische onderzoeksopzet buiten beeld, en ten gevolge daarvan bestaat het risico dat men in de zogenaamde ecologische valkuil terechtkomt (‘ecological fallacy’).5-9 Deze valkuil wordt in vrijwel alle epidemiologische leerboeken met veel smaak beschreven, maar minder bekend is dat zich in onderzoek op individueel niveau een omgekeerde vertekening kan voordoen, de zogenaamde atomistische valkuil (‘atomistic fallacy’).8-10

Wanneer men geïnteresseerd is in het verband tussen een determinant en ziekte op groepsniveau (men stelt bijvoorbeeld de vraag: ‘Heeft een bevolking waarin wordt gerookt een hogere frequentie van longkanker dan één waarin niet wordt gerookt?’), dan zal een onderzoek met individuen als eenheid van waarneming en analyse niet zonder meer het juiste antwoord opleveren. Zo blijven in het onderzoek van Doll en Hill de effecten van passief roken volledig buiten beeld, en dat is een van de oorzaken waardoor men met deze onderzoeksopzet in de atomistische valkuil zou kunnen belanden. In de ecologische variant daarentegen worden deze effecten ongemerkt meegenomen, en bestaat dit risico niet.

de ecologische valkuil

Om te laten zien wat de ecologische valkuil is, maak ik gebruik van een paar eenvoudige voorbeelden. Stel, we hebben een onderzoeksvraag op individueel niveau (‘Hebben mensen die excessief alcohol gebruiken een vergrote kans op sterfte door ongevallen en geweld?’) en we willen deze beantwoorden in een ecologische onderzoeksopzet. Hiervoor beschikken wij over de gegevens van 3 steden, en we gaan na of de sterfte door ongevallen en geweld in een stad groter is naarmate in die stad het percentage excessief drinkende personen hoger is. Ter wille van de overzichtelijkheid beperken wij ons hier tot 3 onderzoekseenheden; in werkelijkheid zal een ecologisch onderzoek er meestal (veel) meer hebben.

In tabel 1 en figuur 1 is één mogelijke uitkomst van ons onderzoek geschetst. Er is tussen de 3 steden een duidelijk verschil in percentage excessief drinkende personen, en er is een positief verband met de frequentie van sterfte door ongevallen en geweld: de sterfte is groter naarmate excessief alcoholgebruik meer voorkomt. Dit verband kan men ook kwantificeren, door het risico op ziekte of sterfte in een groep die voor 100 aan de determinant wordt blootgesteld, te delen door het risico in een groep met 0 blootgestelden.11 In ons voorbeeld verwachten we op basis van extrapolatie in een stad met 100 excessief drinkende personen een sterfte door ongevallen en geweld van 50 (punt D in figuur 1), in een stad met 0 excessief drinkenden een sterfte van 25 (punt E). Dit levert ons een relatief risico (RR) op groepsniveau op van 50/25 = 2.

In figuur 1 kunnen we als het ware achter de ecologische gegevens ook de individuele waarnemingen zien, en daardoor kunnen we eveneens het meer gebruikelijke RR op individueel niveau berekenen. Onder individuen die excessief alcohol gebruiken, blijkt in die redenering het sterfterisico 50 te zijn, terwijl dit onder de niet excessief drinkende personen 25 is. Het individuele RR is dan 2, evenals het ecologische RR.

Een verband op groepsniveau hoeft op individueel niveau niet te bestaan

Het individuele en het ecologische RR zullen echter niet altijd gelijk zijn, en als er een verschil bestaat tussen de verbanden op individueel niveau en op groepsniveau, kan men op een moment van onoplettendheid in de ecologische valkuil terechtkomen. Dit houdt dan in dat men uit een verband op groepsniveau ten onrechte conclusies trekt over het verband tussen de determinant en de ziekte op individueel niveau. Over de omstandigheden waarin deze vertekening kan optreden bestaat uitgebreide literatuur, vol met ingenieuze getallenvoorbeelden.6 7 12 13 De belangrijkste omstandigheid is echter de situatie waarin er een systematisch verschil is in het ‘achtergrondrisico’ (dat wil zeggen het risico op ziekte ongeacht of men wel of niet op individueel niveau aan de te bestuderen factor is blootgesteld) tussen de groepen die worden vergeleken.

Deze situatie is verbeeld in figuur 2. Hierin is het individuele RR veel lager dan het ecologische RR. Het getallenvoorbeeld is namelijk zo geconstrueerd dat er een groot verschil in achtergrondrisico is tussen de 3 steden, en wel zo dat het achtergrondrisico systematisch hoger is in een stad met een hoger percentage excessief drinkende personen. In stad A bedraagt de sterfte door ongevallen en geweld onder de niet excessief drinkende personen 35 (28/80), in stad B 45 (27/60) en in stad C 55 (22/40). Omdat ook het percentage personen met excessief alcoholgebruik oploopt van stad A naar stad C, geeft het ecologische RR (100/25 = 4) een sterke overschatting van het individuele RR ((88/120)/(77/180) = 1,7).

de atomistische valkuil

Maar veronderstel nu eens dat wij onze onderzoeksvraag anders hadden geformuleerd: ‘Heeft een bevolking met veel personen die excessief alcohol gebruiken, een verhoogd sterftecijfer door ongevallen en geweld?’ Een mogelijke reden om de vraag op deze manier te formuleren is dat excessief drinkende mensen niet alleen zichzelf in gevaar brengen, maar ook anderen. Zij kunnen bijvoorbeeld door rijden onder invloed ongevalsletsel bij nuchtere voetgangers veroorzaken, of door ontremming van agressieve impulsen ‘zinloos geweld’ plegen tegen anderen die van een avondje uit hopen te genieten.

Bij deze onderzoeksvraag zouden we heel anders tegen de onderzoeksbevindingen van tabel 2 en figuur 2 aankijken. We kunnen het feit dat het achtergrondrisico op sterfte door ongevallen en geweld in stad C hoger is dan in stad A, in verband brengen met het feit dat in stad C ook het percentage excessief drinkende mensen hoger is. Dit is in overeenstemming met onze veronderstelling dat blootstelling van niet excessief drinkende mensen aan excessief drankgebruik in hun omgeving gepaard gaat met een verhoogd risico op sterfte door ongevallen en geweld. In feite heb ik het getallenvoorbeeld helemaal rond deze veronderstelling geconstrueerd: de aanname was dat bovenop het verhoogde sterfterisico van excessief drinkenden zelf, elke 2 excessief drinkende personen ook nog eens samen 1 andere stadgenoot, die al dan niet zelf excessief drinkt, om het leven brengen. Zo kan men voor stad A berekenen dat de 20 personen met excessief alcoholgebruik de dood van 10 willekeurige personen veroorzaken (2 onder de excessief drinkenden, bovenop de 10 overledenen die toch al in deze groep konden worden verwacht, en 8 onder de niet excessief drinkenden, bovenop de 20 uit tabel 1).

Op individueel niveau kan men effecten op groepsniveau over het hoofd zien

Het ecologische RR van 4 dat in dit voorbeeld is berekend, geeft een goed antwoord op onze onderzoeksvraag. Het is als het ware de optelsom van het individuele effect (excessief drinkende mensen brengen zichzelf om het leven) en het groepseffect (excessief drinkende mensen brengen ook anderen om het leven). Het individuele RR van 1,7 geeft een sterke onderschatting van het effect van excessief alcoholgebruik op bevolkingsniveau. Deze vertekening is het gevolg van de atomistische valkuil, die naar analogie van de ecologische valkuil inhoudt dat men uit een verband zoals vastgesteld op individueel niveau, ten onrechte conclusies trekt over het verband tussen een determinant en ziekte op groepsniveau.

implicaties

Het is, zoals uit de fictieve voorbeelden blijkt, van veel belang bij ieder epidemiologisch onderzoek nauwkeurig vast te stellen of de vraagstelling het individuele niveau dan wel het groepsniveau betreft respectievelijk zou moeten betreffen. Ligt de vraagstelling op individueel niveau, dan doet men er goed aan ook in de onderzoeksopzet het individu als eenheid van waarneming en analyse te kiezen. Mocht dit onverhoopt niet mogelijk zijn, dan loopt men het risico in de ecologische valkuil te belanden. Om die reden heeft de ecologische onderzoeksopzet een slechte naam onder veel epidemiologen.

Omgekeerd kan gebruik van individuele gegevens voor beantwoording van een vraagstelling op groepsniveau er echter toe leiden dat men in de atomistische valkuil terechtkomt. Om die reden wordt er de laatste tijd regelmatig gepleit voor een herwaardering van de ecologische onderzoeksopzet.8 9 14 Omdat het in een zuiver ecologische onderzoeksopzet niet mogelijk is de individuele effecten en de groepseffecten van elkaar te onderscheiden, is een mengvorm waarbij zowel gegevens op individueel niveau als gegevens op groepsniveau worden verzameld, voor dat doel te prefereren.

Literatuur
  1. Doll R, Hill AB. The mortality of doctors in relation totheir smoking habits. BMJ 1954;i:1451-5.

  2. Doll R, Peto R, Wheatley K, Gray RG, Sutherland I.Mortality in relation to smoking: 40 years' observation on male Britishdoctors. BMJ 1994;309:901-11.

  3. Weinberg GB, Kuller LH, Redmond CK. The relationshipbetween the geographic distribution of lung cancer incidence and cigarettesmoking in Allegheny County, Pennsylvania. Am J Epidemiol 1982;115:40-58.

  4. Kunst AE, Looman CWN, Mackenbach JP. Determinants ofregional differences in lung cancer mortality in the Netherlands. Soc Sci Med1993;37:623-31.

  5. Selvin H. Durkheim's suicide and problems ofempirical research. Am J Sociol 1958;63:607-19.

  6. Morgenstern H. Uses of ecologic analysis in epidemiologicresearch. Am J Public Health 1982;72:1336-44.

  7. Morgenstern H. Ecologic studies. In: Rothman KJ, GreenlandS, editors. Modern epidemiology. 2th ed. Philadelphia: Lippincott Raven;1998. p. 459-80.

  8. Susser M. The logic in ecological: I. The logic ofanalysis. Am J Public Health 1994;84:825-9.

  9. Susser M. The logic in ecological: II. The logic ofdesign. Am J Public Health 1994;84:830-5.

  10. Riley MW. Sociological research. New York: Harcourt BraceJovanovich; 1963. p. 700-18.

  11. Beral V, Chilvers C, Fraser P. On the estimation ofrelative risk from vital statistical data. J Epidemiol Community Health1979;33:159-62.

  12. Greenland S. Divergent biases in ecologic andindividual-level studies. Stat Med 1992;11:1209-23.

  13. Greenland S, Robins J. Invited commentary: ecologicalstudies-biases, misconceptions, and counterexamples. Am J Epidemiol 1994;139:747-60.

  14. Schwartz S. The fallacy of the ecological fallacy: thepotential misuse of a concept and the consequences. Am J Public Health 1994;84:819-24.

Auteursinformatie

Erasmus Universiteit, Instituut Maatschappelijke Gezondheidszorg, Postbus 1738, 3000 DR Rotterdam.

Prof.dr.J.P.Mackenbach, sociaal-geneeskundige/epidemioloog.

Gerelateerde artikelen

Reacties