Klinimetrische evaluatie van de Barthel-index, een maat voor beperkingen in het dagelijks functioneren

Onderzoek
R. de Haan
M. Limburg
J. Schuling
J. Broeshart
L. Jonkers
P. van Zuylen
Citeer dit artikel als
Ned Tijdschr Geneeskd. 1993;137:917-21
Abstract
Download PDF

Samenvatting

Doel

Evaluatie van de klinimetrische kwaliteiten van de Barthel-index.

Opzet

Het meten van beperkingen in activiteiten van het dagelijks leven (ADL) en mobiliteit door onafhankelijke beoordelaars.

Plaats

(Poli)klinische afdeling Neurologie van het Academisch Medisch Centrum te Amsterdam.

Patiënten en methode

In de periode juli-december 1991 werden bij 35 klinische en 25 poliklinische patiënten met een cerebrovasculair accident de beperkingen onafhankelijk beoordeeld door 3 waarnemers. De Barthel-index werd geëvalueerd in termen van scoringsovereenkomsten, homogeniteit en begripsvaliditeit.

Resultaten

Er was een goede concordantie van totaalscores (gemiddelde kappa = 0,88; uitersten 0,85-0,90) en afzonderlijke itemscores (uitersten van de gemiddelde kappa-waarde: 0,82-1,00). Herhaalde analysen zonder patiënten met een maximale score van 20, leidden niet tot een duidelijke verlaging van deze kappa-waarden. De Barthel-index bleek een sterk homogene schaal te zijn (Cronbach-α = 0,96). Alle items leverden een evenwichtige bijdrage aan deze betrouwbaarheid. Factoranalyse liet zien dat de schaalitems één gemeenschappelijk onderliggend kenmerk beschreven. Deze factor verklaarde 81 van de scorevariantie.

Conclusie

De Barthel-index is een verantwoord instrument om ADL- en mobiliteitsbeperkingen te meten. De schaal is geschikt voor gebruik in zowel patiëntenzorg als wetenschappelijk onderzoek.

Inleiding

Inleiding

Om de gevolgen van ziekte op geordende wijze te kunnen vaststellen zijn maat en getal nodig.1 Deze gevolgen kunnen volgens een Wereldgezondheidsorganisatie (WHO)-classificatie worden ingedeeld in ‘stoornissen’, ‘beperkingen’ en ‘handicaps’.2 Stoornissen zijn de directe manifestaties van ziekte in termen van organische dysfuncties of lichamelijke afwijkingen. Beperkingen verwijzen naar taken, gedragingen en prestaties van de patiënt. Wat betreft lichamelijke beperkingen kan het gaan om basale activiteiten van het dagelijks leven (ADL) zoals mobiliteit en zelfverzorging of om meer complexe activiteiten (instrumentele ADL) zoals huishouden, winkelen en vrijetijdsbesteding. Handicaps, tot slot, weerspiegelen de sociaal-maatschappelijke afhankelijkheid van de persoon.

In de loop der jaren zijn er voor het meten van ADL-beperkingen diverse instrumenten ontwikkeld.3-5 Bij de keuze van een geschikt instrument zijn drie overwegingen van belang: de praktische toepasbaarheid, de geschiktheid van het instrument voor de doelpopulatie en de klinimetrische kwaliteit. In het licht van deze criteria kan de Barthel-index een goede keus zijn.6 Deze is in enkele minuten af te nemen en bestaat uit 10 vragen: over incontinentie van blaas en darm, uiterlijke verzorging, toiletgebruik, eten, van bed naar stoel gaan en omgekeerd (‘transfer’), mobiliteit, aan- en uitkleden, trappenlopen en baden. Deze items zijn in min of meer oplopende moeilijkheidsgraad geordend en arbitrair gewogen. De scoring kan worden gebaseerd op de rapportage van de patiënt zelf of op de beoordeling door een familielid of verpleegkundige.

De Barthel-index (BI) is expliciet een ‘doe’-schaal, dat wil zeggen dat er een beoordeling plaatsvindt van wat de patiënt feitelijk doet. De index meet dus geen capaciteiten in de zin van wat de patiënt in potentie misschien zou kunnen. Als klinisch instrument kan de schaal worden gebruikt om bij de individuele patiënt de momentane ADL-beperkingen (ongeacht de oorzaak) vast te stellen, behandeldoelen te kiezen en de mate van herstel te beoordelen. In wetenschappelijk onderzoek kan de BI als maat dienen om de functionele uitkomsten van een interventie te meten. De klinimetrische kwaliteiten van de BI in termen van betrouwbaarheid en validiteit zijn goed.7-11

Wij vertaalden de Engelstalige 20-puntsschaal van de BI (appendix).111 Het doel van dit onderzoek was na te gaan of de meetkwaliteiten van deze Nederlandstalige versie overeenkomen met die van de originele schaal.

PatiËnten en methoden

De onderzoeksgroep werd gevormd door 60 patiënten met een cerebrovaculair-accident (CVA). CVA werd gedefinieerd als een langer dan 24 h bestaande acute focale neurologische stoornis veroorzaakt door vasculaire afwijkingen aan de hersenen. De patiënten werden onderzocht in de periode juli-december 1991. Het betrof 35 opgenomen patiënten en 25 poliklinische patiënten. De mediane tijd na het CVA was respectievelijk 2 weken en 8 maanden. De mediane leeftijd van de groep was 71,5 jaar (uiterste waarden 21-91) en er waren 28 mannen en 32 vrouwen.

De beperkingen werden onafhankelijk beoordeeld door 3 daarvoor getrainde studenten geneeskunde. De scoring van de opgenomen patiënten vond minimaal 72 h na opname plaats. De poliklinische patiënten werden na hun bezoek aan de behandelend neuroloog beoordeeld. Bij 15 patiënten was ten gevolge van afasie of doofheid geen adequate communicatie mogelijk. Bij hen werd aanvullende informatie verzameld bij de partner (3 maal) of bij een verpleegkundige (5 maal); bij 7 werden de medische status en het verpleegkundig dossier geraadpleegd.

Doel van de analyse was een evaluatie van de betrouwbaarheid en de validiteit van de BI.

Betrouwbaarheid van de Barthel-index

Bij de betrouwbaarheid gaat het om de vraag of er goed wordt gemeten. Deze vraag werd beantwoord in termen van homogeniteit en inter-beoordelaarsbetrouwbaarheid. Homogeniteit verwijst naar de statistische coherentie van de beoordeelde items. Een maat voor homogeniteit is de Cronbach-?-correlatiecoëfficiënt, die gebaseerd is op het (gewogen) gemiddelde van de correlaties tussen de items.12 Bij ?-waarden > 0,80 wordt de homogeniteit als ‘goed’ beschouwd, en bij waarden > 0,90 als ‘uitstekend’. De inter-beoordelaarsbetrouwbaarheid verwijst naar de scoringsovereenkomsten tussen de waarnemers. Deze concordantie werd berekend met de kappa-coëfficiënt die de voor kans gecorrigeerde proportie-overeenkomsten uitdrukt.13 Voor elk paar waarnemers werd kappa berekend. De gemiddelde waarden werden vervolgens als een algemene concordantie-index opgevat.14 De kappa-waarden werden arbitrair geïnterpreteerd in termen van: ‘slecht’ (kappa 15

Validiteit van de Barthel-index

Bij de validiteit gaat het om de vraag of men datgene meet wat men wil meten. De BI werd langs factoranalytische weg geëvalueerd op de begripsvaliditeit: op grond van de lineaire samenhang tussen de itemscores werd nagegaan of de itemscores beschreven konden worden in een beperkt aantal factoren; deze factoren kan men opvatten als de onderliggende, niet direct observeerbare begrippen waarvan de schaalitems een uitdrukking zijn.

Alle analysen werden uitgevoerd met SPSSPC Statistics versie 4.0 (SPSS Inc, Illinois, USA).

Resultaten

In tabel 1 staan als voorbeeld de scorefrequenties van 1 waarnemer weergegeven voor 59 van de 60 patiënten (door deze waarnemer werd 1 van de patiënten niet gescoord). Herhaalde analysen door de andere 2 waarnemers lieten geen afwijkende resultaten zien. De wijze waarop de frequenties van de totaalscores waren verdeeld, wordt verklaard door de heterogene onderzoeksgroep van patiënten die al dan niet recentelijk een CVA hadden doorgemaakt. Uit de gemiddelde schaalscore van de klinische patiënten, die gemiddeld meer neurologische uitval hadden, bleek dat zij ernstig hulpbehoevend waren; het merendeel van hen (46) was volledig hulpbehoevend. De aanmerkelijk hogere gemiddelde schaalscore van de poliklinische groep wees op een ‘redelijk tot goede zelfstandigheid’; het overgrote deel van deze patiënten (71) had geen ADL-beperkingen. De geringe spreiding (variantie) van de item- en totaalscores in de poliklinische groep verwijst eveneens naar een clustering van de patiënten in de hoogste scoringsklassen.

Betrouwbaarheid

In tabel 2 worden de resultaten van de homogeniteitsanalysen vermeld, met de getallen van dezelfde waarnemer. De substantiële inter-item-correlaties en de hoge ?-coëfficiënt passen bij het unidimensionele karakter van de BI. Er werd nagegaan of specifieke items in gunstige zin bepalend waren voor de schaalbetrouwbaarheid: achter elk afzonderlijk item staat de homogeniteitswaarde van de BI vermeld bij verwijdering van het betreffende item uit de schaal (zie tabel 2). Alle items droegen op een evenwichtige wijze bij aan de betrouwbaarheid van de schaal. In de rechterkolom van tabel 2 zijn de resultaten weergegeven van een herhaalde analyse, maar nu met buiten beschouwing laten van de patiënten met een maximale score. De gemiddelde inter-item-correlatie en de ?-waarden lieten een geringe (en onbetekenende) vermindering zien van de homogeniteit.

In tabel 3 worden de gemiddelde kappa-waarden en de uitersten van de item- en totale scores weergegeven. In de linkerkolom wordt de interwaarnemersvariatie voor de gehele onderzoeksgroep vermeld. Scores van (in)continentie van blaas en darm kwamen zeer goed overeen. Voor de resterende items alsmede de totale scores golden nauwelijks afwijkende beoordelingen. De rechterkolom laat de kappa-waarden zien wanneer patiënten met een maximumscore van 20 buiten beschouwing werden gelaten. Deze selectie leidde, door een relatieve toename van de scoringsvariatie, tot enige daling van een aantal kappa-waarden. Maar ook dan liet de gemiddelde concordantie-index een substantiële overeenkomst zien voor de items ‘transfer en mobiliteit’, en een uitstekende tot perfecte overeenkomst voor zowel de resterende items als de totale scores. Een uitzondering was de beoordeling van het item ‘uiterlijke verzorging’. Hoewel de gemiddelde overeenkomst voldoende tot goed was, was kappa bij één paar waarnemers slechts ‘redelijk’ (0,41

Validiteit

De in tabel 4 weergegeven resultaten ondersteunden de begripsvaliditeit van de BI. Ongeveer 80 van de verklaarde schaalvariantie kwam voor rekening van factor 1. De tweede factor voegde relatief weinig toe, namelijk 7,1, en kon dan ook als minder relevant worden beschouwd. Met andere woorden: alle itemscores beschreven 1 gemeenschappelijk onderliggend kenmerk dan wel ADL-beperking, die een aanzienlijk deel van de waargenomen scorevarianties verklaarde (tabel 5).

Beschouwing

De Nederlandse versie van de Barthel-index is een klinimetrisch verantwoorde beperkingenschaal. De hier gepresenteerde onderzoeksresultaten komen overeen met die van onderzoek van de Engelstalige versie.7-11 Hoewel de hoge homogeniteitswaarden statistisch wijzen op enkele overbodige schaalitems, is een verkorting van de BI niet wenselijk. Een beoordeling van alle 10 de ADL-activiteiten is klinisch informatief en het afnemen van de schaal kost slechts enkele minuten. Ook is er het argument om niet op grond van één analyse wijzigingen aan te brengen in reeds bestaande schalen. De hoge homogeniteitswaarden hebben mogelijk wel geleid tot enige overschatting van de interbeoordelaarsbetrouwbaarheid. De mate waarin is onbekend. Het is echter niet waarschijnlijk dat deze overschatting onbetrouwbare waarnemingen heeft gecamoufleerd. De kappa-waarden zijn gebaseerd op een groot aantal waarnemingen die merendeels zijn ingedeeld in niet-dichotome scoringscategorieën (hoe meer scoringscategorieën, hoe lager meestal kappa). Ook bleven de scoringsovereenkomsten substantieel na verwijdering van de waarnemingen met een maximum totaalscore. Wel raden wij aan om, bij de training in de afname van de BI, extra aandacht te schenken aan het scoren van de vraag ‘uiterlijke verzorging’ (gezicht wassen, scheren, enzovoort), omdat wij bij dat item de geringste overeenkomst tussen de waarnemers vonden.

De bevinding dat door middel van totaalscores op de BI een onderscheid kan worden gemaakt tussen opgenomen patiënten en poliklinische patiënten in de mate van hun zorgafhankelijkheid, geeft aan dat de BI gevoelig is om tussen klinisch onderscheidbare patiënten te differentiëren. Het is echter niet uitgesloten dat dit onderscheidend vermogen op een overschatting berust, daar de onderzochte populatie zeer heterogeen was naar symptomenpatroon en tijdstip van optreden van het CVA. Een andere aspect van de gevoeligheid, namelijk het vermogen van de schaal om intra-individuele veranderingen in de tijd te meten, is in dit onderzoek niet geëvalueerd. Deze gevoeligheid is niet alleen belangrijk voor het meten van herstel of achteruitgang op het niveau van de individuele patiënt, maar ook van belang bij een wetenschappelijke evaluatie van een interventie met voor- en nameting. Diverse onderzoeken hebben de gevoeligheid van de Engelstalige BI aangetoond.9-11 Een verschil van 4 punten op de totaalscore en ook een verschuiving voor een bepaalde activiteit van volledig afhankelijk naar onafhankelijk, drukken waarschijnlijk een reële verandering uit in het functioneren van de individuele patiënt.11

De BI heeft, zoals de meeste ADL-schalen, het nadeel van het zogenaamde ‘plafond-effect’. Het instrument verwijst slechts naar eenvoudige activiteiten. De gevoeligheid van de schaal wordt door dit effect begrensd. Patiënten met een geringe maar wel verschillende mate van beperking kunnen ‘voorbij’ het uiteinde van de schaal niet worden onderscheiden en ook een functionele verbetering van de individuele patiënt kan dan niet worden gemeten. Dit plafond-effect was duidelijk zichtbaar in de poliklinische groep waarin het merendeel van de patiënten een maximale score behaalde. Hoewel deze patiënten ADL-zelfstandig zijn, garandeert een maximale score geenszins dat zij ook volledig zonder beperkingen zijn bij meer complexe activiteitsvormen. Om dat te kunnen beoordelen zijn aanvullende metingen op een instrumentele beperkingenschaal nodig. Wij willen dan ook benadrukken dat afname van de BI in de klinische praktijk of in onderzoek slechts dan zinvol is indien men bij de patiënt een aantasting in ADL verwacht. Is dat niet het geval dan zal een BI-meting weinig tot geen informatieve waarde hebben.

Sinds 1990 wordt op de neurologische afdeling van het Academisch Medisch Centrum bij elke CVA-patiënt 72 h na opname en vervolgens wekelijks de BI door de neuroloog of verpleegkundige afgenomen. Het is onze ervaring dat de schaal een bijdrage levert aan herkenning van aanwezige problemen, de communicatie tussen artsen en verpleegkundigen bevordert en een meer gericht revalidatie- en (na)zorgprogramma stimuleert. Deze voordelen gelden niet alleen voor de intramurale situatie, maar evenzeer voor de huisartsenpraktijk. Gezien de belangrijke rol van de huisarts bij de behandeling van chronisch zieken, kan het gebruik van de BI een bijdrage leveren aan deze zorg. Ook kan de maat van de functionele toestand een zinvolle uitkomstmaat zijn in wetenschappelijk patiëntgebonden onderzoek.

Het ontwikkelen van nieuwe ADL-schalen, als toevoeging aan de reeds bestaande, vinden wij niet wenselijk. Beter is het te kiezen voor een standaardmaat. Het gebruik van een zelfde maatstaf heeft tevens het voordeel dat verschillende onderzoeksresultaten beter vergeleken en geïnterpreteerd kunnen worden. De BI zou zo'n standaard kunnen zijn.

De auteurs danken prof.dr.H.van Crevel, neuroloog, afdeling Neurologie, Academisch Medisch Centrum, Amsterdam, voor zijn bijdrage aan dit onderzoek en voor zijn stimulans de Barthel-index te gebruiken.

Literatuur
  1. Crevel H van, Gijn J van. Klinimetrie: hoe gaat het met depatiënt? Ned Tijdschr Geneeskd1990; 134: 7-11

  2. World Health Organization. International classification ofimpairments, disabilities and handicaps. Geneva: WHO, 1980.

  3. Katz S, Ford AB, Moskowitz RW, Jackson BA, Jaffe MW.Studies of illness in the aged. The index of ADL: a standardized measure ofbiological and psychosocial function. JAMA 1963: 185: 914-9.

  4. Schoening HA, Anderegg L, Bergstrom D, Fonda M, Steinke N,Ulrich P. Numerical scoring of self-care status of patients. Arch Phys MedRehabil 1965; 46: 689-97.

  5. Moskowitz E, McCann CB. Classification of disability inthe chronically ill and aging. J Chronic Dis 1957; 5: 342-6.

  6. Mahoney FI, Barthel DW. Functional evaluation: the BarthelIndex. Md Med J 1965; 14: 61-5.

  7. Shah S, Vanclay F, Cooper B. Improving the sensitivity ofthe Barthel Index for stroke rehabilitation. J Clin Epidemiol 1989; 42:703-9.

  8. Wolfe CDA, Taub NA, Woodrow EJ, Burney PGJ. Assessment ofscales of disability and handicaps for stroke patients. Stroke 1991; 22:1242-4.

  9. Granger CV, Albrecht GL, Hamilton BB. Outcome ofcomprehensive medical rehabilitation: measurement by PULSES Profile and theBarthel Index. Arch Phys Med Rehabil 1979; 60: 145-54.

  10. Wade DT, Langton Hewer R. Functional abilities afterstroke: measurement, natural history and prognosis. J Neurol NeurosurgPsychiatry 1987; 50: 177-82.

  11. Collin C, Wade DT, Davies S, Horne V. The Barthel ADLIndex: a reliability study. Int Disabil Studies 1988; 10: 61-3.

  12. Cronbach LJ. Coefficient alpha and the internal structureof tests. Psychometrika 1951; 16: 297-334.

  13. Veldhuyzen van Zanten SJO, Hijdra A. Onderzoek naarvariatie tussen waarnemers met behulp van kappa.Ned Tijdschr Geneeskd 1988; 132:199-202.

  14. Feinstein AR. Clinimetrics. New Haven: Yale UniversityPress, 1987: 186.

  15. Landis RJ, Koch GG. The measurement of observer agreementfor categorical data. Biometrics 1977; 33: 159-74.

Auteursinformatie

Academisch Medisch Centrum, Meibergdreef 9, 1105 AZ Amsterdam.

Afd. Neurologie: R.de Haan, psycholoog (tevens: afd. Klinische Epidemiologie en Biostatistiek); M.Limburg, neuroloog; mw.J.Broeshart, mw.L.Jonkers en P.van Zuylen, medisch studenten.

Rijksuniversiteit, vakgroep Huisartsgeneeskunde, Groningen.

J.Schuling, huisarts.

Contact R.de Haan

Gerelateerde artikelen

Reacties