Dwalingen in de methodologie. XXII. Toepassing van technieken voor longitudinale data-analyse

Klinische praktijk
J.W.R. Twisk
W. de Vente
Citeer dit artikel als
Ned Tijdschr Geneeskd. 2000;144:1680-3
Abstract
Download PDF

Samenvatting

- Longitudinaal onderzoek wordt erdoor gekenmerkt dat dezelfde uitkomstvariabele meerdere keren in de tijd is gemeten bij dezelfde personen.

- Dit betekent dat de observaties niet onafhankelijk zijn van elkaar en dat statistische technieken zoals lineaire regressieanalyse niet bruikbaar zijn.

- Speciale longitudinale analysetechnieken houden rekening met de afhankelijkheid van observaties en hebben als kenmerk dat de individuele ontwikkeling in de tijd wordt geanalyseerd.

- Afhankelijk van de onderzoeksvraag, de vorm van de uitkomstvariabele en het aantal herhaalde metingen kan een bepaalde techniek gekozen worden, waarbij ‘generalized estimating equations’ en ‘random-coëfficiënt’-modellen de meeste mogelijkheden bieden.

De exponentiële toename van longitudinale onderzoeken heeft geleid tot een evenredige toename van de vraag naar technieken voor longitudinale data-analyse. In het kader van dit artikel wordt longitudinaal onderzoek gedefinieerd als onderzoek waarbij de uitkomstvariabele meerdere keren bij dezelfde persoon is gemeten. Er is dus sprake van gecorreleerde waarnemingen; met andere woorden, de observaties bij dezelfde persoon op 2 verschillende tijdstippen zijn niet onafhankelijk van elkaar. Daarom moeten voor longitudinale data-analyse statistische technieken gebruikt worden die rekening houden met dat gecorreleerd-zijn van de waarnemingen. Een essentieel uitgangspunt van longitudinale data-analysen is dat de individuele veranderingen centraal staan en dat de individuele ontwikkeling in de tijd wordt geanalyseerd.

Wat bepaalt de keuze van de analysetechniek?

De keuze van de analysetechniek wordt in de eerste plaats bepaald door de wetenschappelijke vraag. De statistiek is slechts een hulpmiddel bij het beantwoorden van deze vraag. Wanneer een onderzoeker alleen geïnteresseerd is in de ontwikkeling van een bepaalde variabele in de tijd, zijn er andere mogelijkheden dan wanneer de onderzoeker ook geïnteresseerd is in het onderlinge verband tussen de ontwikkeling van 2 variabelen. In de tweede plaats wordt de keuze van de techniek bepaald door de vorm van de uitkomstvariabele. Voor een continue uitkomstvariabele (denk aan de bloeddruk) zijn er meer analysemogelijkheden dan voor categoriale uitkomstvariabelen (bijvoorbeeld de bloedgroep). De keuze van de statistische techniek wordt in de derde plaats bepaald door het aantal herhaalde metingen. Bij 2 metingen zijn er meer analysemogelijkheden dan bij meer dan 2 metingen.

Voorbeeld

De verschillende technieken voor longitudinale data-analyse illustreren wij aan de hand van data uit het ‘Amsterdams groei- en gezondheidsonderzoek’, een observationeel longitudinaal onderzoek waarin vooral de relatie tussen leefstijl en gezondheid centraal staat.1 In het voorbeeld wordt verondersteld dat er 6 metingen zijn uitgevoerd bij een groep personen tussen 13 en 27 jaar. De uitkomstvariabele of afhankelijke variabele is de totale serumcholesterolconcentratie. Er worden 2 determinanten (onafhankelijke of voorspellende variabelen) onderscheiden: lichaamsvetpercentage (uitgedrukt als de som van de dikte van 4 huidplooien) en sekse.

technieken voor longitudinale data-analyse

Ontwikkeling in de tijd

Het simpelste voorbeeld van een longitudinaal onderzoek is een onderzoek waarbij de uitkomstvariabele 2 keer bij dezelfde personen wordt gemeten. De vraag die hierbij gesteld wordt, is: is er een verandering in de onderzochte variabele in de tijd? In de statistiek is hiervoor de t-toets voor gepaarde waarnemingen ontwikkeld. Met deze toets kan men nagaan of het verschil tussen de 1e en de 2e meting van 0 verschilt. De techniek houdt rekening met het feit dat bij dezelfde personen 2 keer is gemeten. In figuur 1a is deze situatie weergegeven voor het eerdergenoemde voorbeeld uit het ‘Amsterdams groei- en gezondheidsonderzoek’. Met een t-toets voor gepaarde waarnemingen wordt onderzocht of de serumcholesterolconcentratie verandert tussen de 1e en de 6e meting. De output van de t-toets voor gepaarde waarnemingen geeft het gemiddelde verschil (meting 2 - meting 1 = 0,69 mmol/l) en het bijbehorende 95-betrouwbaarheidsinterval (95-BI: 0,56-0,81). Er was dus een stijging van de serumcholesterolspiegel tussen 13 en 27 jaar en aangezien de waarde 0 niet binnen dit betrouwbaarheidsinterval valt, kan deze stijging als ‘statistisch significant’ worden aangemerkt.

Als er meer dan 2 metingen bij dezelfde persoon zijn uitgevoerd en de onderzoeker wederom de verandering van de uitkomstvariabele in de tijd wil onderzoeken, kan deze geen gebruik maken van de t-toets voor gepaarde waarnemingen. In dit geval kan multivariate variantieanalyse (‘multivariate analysis of variance’; MANOVA) voor herhaalde metingen worden gebruikt. Deze techniek is eigenlijk de multivariate variant van de t-toets voor gepaarde waarnemingen. Omdat er meer dan één verandering in de tijd is, worden de veranderingen gelijktijdig getoetst. In figuur 1b is deze situatie geïllustreerd voor de ontwikkeling van de serumcholesterolwaarde.

Hoewel voor herhaalde metingen in het algemeen MANOVA gebruikt wordt als toetsingstechniek, kan men ook het percentage bepalen van de totale variantie in de uitkomstvariabele (hier de serumcholesterolspiegel) dat verklaard wordt door de onderzochte factor (hier de leeftijd). In het voorbeeld blijkt dat 41 van de variabiliteit van de serumcholesterolwaarde verklaard wordt door de ontwikkeling in de tijd. Bij toetsing geeft de gevonden p-waarde (in dit geval p figuur 1b).

Vergelijking van groepen

Voor het onderzoeken van verschillen in de ontwikkeling in de tijd tussen 2 (of meer) groepen kan ook de genoemde MANOVA voor herhaalde metingen worden gebruikt. In het voorbeeld kan zo worden onderzocht of de ontwikkeling van de serumcholesterolwaarde verschillend is voor mannen en vrouwen (zie figuur 1c). Uit de resultaten blijkt dat 5 van de variatie in de serumcholesterolwaarde verklaard wordt door het verschil in ontwikkeling tussen mannen en vrouwen. Dit percentage is weliswaar klein, maar wel statistisch significant verschillend van 0. Er is dus blijkbaar een verschil in de ontwikkeling van de serumcholesterolwaarde tussen mannen en vrouwen, dat beschreven kan worden aan de hand van figuur 1c.

Samenhang tussen verschillende variabelen

De situatie wordt ingewikkelder als men wil onderzoeken of er een samenhang bestaat tussen 2 variabelen die beide meerdere keren zijn gemeten. In dat geval is de uitkomstvariabele tijdsafhankelijk, dat wil zeggen meerdere keren bij dezelfde personen gemeten, en deze kan per tijdstip een andere waarde hebben. De determinanten kunnen zowel tijdsafhankelijk zijn als tijdsonafhankelijk, wat wil zeggen dat ze dezelfde waarde hebben op alle tijdstippen (bijvoorbeeld sekse). Er kan nu geen gebruik worden gemaakt van de MANOVA voor herhaalde metingen, maar men is aangewezen op speciale longitudinale regressietechnieken. (Als er maar één determinant is die verschillende categorieën bevat en die tijdsonafhankelijk is (bijvoorbeeld sekse of etniciteit), dan is dat in principe een situatie die wel geanalyseerd kan worden met MANOVA voor herhaalde metingen.)

De twee meest gebruikte regressietechnieken voor longitudinale data-analyse zijn ‘generalized estimating equations’ (GEE)2 en ‘random-coëfficiënt’-modellen.3 GEE is een abstracte vorm van regressieanalyse, waarbij de essentie is dat gecorrigeerd wordt voor het feit dat de metingen ‘binnen’ één persoon gecorreleerd zijn. Bij random-coëfficiëntmodellen (die ook bekend zijn als ‘random-effect’-modellen of ‘multi-level’-technieken) kunnen de regressiecoëfficiënten verschillend (random) zijn voor ieder individu. Er kan sprake zijn van een random kruising met de Y-as (‘random intercept’), dat wil zeggen dat het uitgangsniveau van de uitkomstvariabele verschillend is voor de verschillende personen (figuur 2a), maar ook van een random coëfficiënt voor tijd, namelijk als de ontwikkeling van de uitkomstvariabele verschillend is voor verschillende personen (zie figuur 2b). Tenslotte kan er sprake zijn van een combinatie van deze beide random coëfficiënten (zie figuur 2c).

De samenhang tussen de ontwikkeling van de som van de dikte van 4 huidplooien en de serumcholesterolwaarde hebben wij onderzocht met GEE en met random-coëfficiëntmodellen (figuur 3). Bij beide analysen werd een regressiecoëfficiënt gevonden van 0,11 (95-BI: 0,07-0,15). De interpretatie van deze coëfficiënt is min of meer vergelijkbaar met die van een regressiecoëfficiënt bij dwarsdoorsneden-lineaire-regressie, met dien verstande dat bij de dwarsdoorsneden-lineaire-regressie de interpretatie beperkt is tot verschillen tussen personen, terwijl bij de longitudinale regressietechnieken de coëfficiënt een combinatie is van zowel het verschil tussen personen als de verandering binnen personen. Dus een stijging van 1 mm in de som van de 4 huidplooidikten binnen één persoon vertoont een samenhang met een stijging van 0,11 mmol/l in de serumcholesterolwaarde en/of een verschil van 1 mm tussen personen gaat samen met een verschil van 0,11 mmol/l.

Het is overigens niet noodzakelijk om de samenhang tussen simultane veranderingen in determinant en uitkomst te analyseren. Afhankelijk van het veronderstelde biologische werkingsmechanisme kan men bijvoorbeeld bij de analyse ook een tijdsverschil tussen determinant en uitkomst verdisconteren (bijvoorbeeld de ontwikkeling van een determinant in relatie tot de uitkomst 1 jaar later). Men spreekt in dit geval van een ‘time-lag’-model.3

Categoriale uitkomstvariabelen

Zoals reeds gezegd wordt de keuze van de techniek voor longitudinale data-analyse mede bepaald door de vorm van de uitkomstvariabele. Zo zijn de t-toets voor gepaarde waarnemingen en de MANOVA voor herhaalde metingen alleen geschikt voor continue uitkomstvariabelen, terwijl de geavanceerde technieken (GEE en random-coëfficiëntmodellen) ook geschikt zijn voor dichotomische uitkomstvariabelen. Beide technieken zijn dan in principe vergelijkbaar met een logistische regressieanalyse waarbij gecorrigeerd wordt voor de afhankelijkheid van de waarnemingen. Als resultaat leveren deze technieken oddsratio's op, die zowel een indicatie zijn voor de veranderingen binnen één persoon als voor de verschillen tussen personen. Voor categoriale uitkomstvariabelen met meer dan 2 categorieën zijn helaas nog nauwelijks longitudinale statistische technieken beschikbaar.

opmerkingen

Zowel GEE als random-coëfficiëntmodellen kunnen ook gebruikt worden voor de vragen die met de t-toets voor gepaarde waarnemingen en de MANOVA voor herhaalde metingen zijn beantwoord. Het voordeel van de geavanceerde technieken is dat er beter omgegaan wordt met ongelijke tijdsintervallen en ontbrekende data en dat de nadruk ligt op schatten in plaats van toetsen.4

Hoewel GEE en random-coëfficiëntmodellen allebei rekening houden met de afhankelijkheid van de observaties, maken beide technieken gebruik van verschillende schattingsprocedures, waardoor de resultaten enigszins kunnen verschillen.

Hoewel de geavanceerde technieken in bijna alle longitudinale onderzoekssituaties kunnen worden gebruikt, gebeurt dit in de praktijk weinig. Hiervoor zijn twee oorzaken aan te wijzen. Enerzijds zijn de geavanceerde technieken niet standaard beschikbaar in de gangbare software. Anderzijds zijn deze technieken vrij ingewikkeld en zijn de longitudinale regressiecoëfficiënten niet altijd even makkelijk te interpreteren. In veel longitudinaal onderzoek reduceert men het longitudinale probleem daarom tot een dwarsdoorsnedenprobleem door veranderingsscores te analyseren. De vraag luidt dan of de verandering in de uitkomstvariabele samenhangt met de verandering in één of meerdere determinanten.

Bij meerdere metingen is een mogelijke oplossing dat men alleen de eerste en de laatste meting in de analyse betrekt. Deze simplificatie is met name bruikbaar in situaties waarin de onderzoeker expliciet geïnteresseerd is in de laatste follow-upmeting (bijvoorbeeld om langetermijneffecten van een therapie te onderzoeken). In de meeste gevallen is het negeren van tussenliggende metingen echter niet aan te bevelen, omdat daarmee een aanzienlijke hoeveelheid informatie verloren gaat.

computerprogramma's en boeken

De t-toets voor gepaarde waarnemingen en de MANOVA voor herhaalde metingen zijn beschikbaar in alle gangbare softwarepakketten. Voor GEE en random-coëfficiëntmodellen ligt de situatie anders. Het veelgebruikte Statistical Package for the Social Sciences (SPSS) heeft geen onderdeel om deze technieken toe te passen. In het kader van ons voorbeeld zijn de GEE-analysen uitgevoerd met het Statistical Package for Interactive Data Analysis (SPIDA) en de random-coëfficiëntmodellen met Multi-level Analysis for Windows (MlwiN). Verder zijn beide technieken beschikbaar als aparte modules in de softwarepakketten Statistical Analysis System (SAS), Statistics-plus (S-PLUS) en Statistical Analysis (STATA). Overigens wordt geadviseerd voor het gebruik van de geavanceerde technieken binnen de genoemde pakketten een specialist te raadplegen.

In de literatuur zijn uitgebreide handboeken beschikbaar waarin de principes van longitudinale data-analyse worden besproken.1 2 5 6 In het algemeen zijn deze boeken echter nauwelijks toegankelijk voor niet-statistici en doorgaans behandelen ze niet alle mogelijkheden even uitgebreid.

Voor informatie over de verschillende softwarepakketten kunnen de volgende internetpagina's worden geraadpleegd: http:// www.efs.mq.edu.au/statlab/spida.html; htpp://www.ioe.ac.uk/ multilevel; http://www.sas.com; http://www.splus.com; http:// www.stata.com.

Literatuur
  1. Diggle PJ, Liang KY, Zeger SL. Analysis of longitudinaldata. New York: Oxford University Press; 1994.

  2. Goldstein H. Multilevel statistical models. 2nd ed.Londen: Edward Arnold; 1995.

  3. Twisk JWR. Different statistical models to analyzeepidemiological observational longitudinal data: an example from theAmsterdam Growth and Health Study. Int J Sports Med 1997;18 Suppl3:S216-24.

  4. Kemper HCG, editor. The Amsterdam growth study: alongitudinal analysis of health, fitness and lifestyle. HK sports sciencemonograph series. Vol 6. Champaign, Ill.: Human Kinetics; 1995.

  5. Bijleveld CCJH, Kamp LJTh van der. Longitudinal dataanalysis. Design, models and methods. Londen: SAGE; 1998.

  6. Lindsey JK. Models for repeated measurements. New York:Oxford University Press; 1993.

Auteursinformatie

Vrije Universiteit, Instituut voor Extramuraal Geneeskundig Onderzoek, Van der Boechorststraat 7, 1081 BT Amsterdam.

Dr.J.W.R.Twisk, epidemioloog; mw.drs.W.de Vente, psycholoog.

Contact dr.J.W.R.Twisk (jwr.twisk.emgo@med.vu.nl)

Gerelateerde artikelen

Reacties