De voorspellende waarde van classificatie van mammografie-uitslagen volgens het 'Breast imaging reporting and data system' (BI-RADS): retrospectief follow-uponderzoek in een ziekenhuispopulatie
Open

Onderzoek
20-10-2004
H.M. Zonderland, T.L. Pope en A.J. Nieborg

Doel.

De bepaling van de positief voorspellende waarde (PVW) voor borstkanker van de eindcategorieën van mammografieverslagen, zoals aanbevolen in het ‘Breast imaging reporting and data system’ (BI-RADS) ten behoeve van kwaliteitsbewaking.

Opzet.

Retrospectieve follow-upstudie.

Methode.

In de periode juni 2000-mei 2001 werden 2762 mammografieën verricht; 654 (23,7) werden aangevuld met echografie, die werd betrokken bij de eindconclusie. Het verslag werd afgesloten met een eindcategorie volgens de BI-RADS-classificatie, waarmee een inschatting van de kans op maligniteit werd gegeven. Follow-upgegevens werden verkregen via het Ziekenhuis Informatie Systeem (pathologiediagnose: n = 215; resultaten van aanvullend onderzoek: n = 1477) en het Pathologisch-Anatomisch Landelijk Geautomatiseerd Archief (PALGA) (n = 1070).

Resultaten.

De prevalentie van het mammacarcinoom was 4,1; er waren 17 fout-negatieve diagnosen. De PVW van categorie BI-RADS 1 (‘normaal’) was 0,3, van categorie BI-RADS 2 (‘benigne’) 0,6, van categorie BI-RADS 3 (‘waarschijnlijk benigne’) 3,9, van categorie BI-RADS 4 (‘verdachte bevinding’) 52,7 en BI-RADS 5 (‘zeer verdachte bevinding’) 100. De waarden van de laatste drie categorieën lagen hoger dan in de Amerikaanse literatuur. Dit kon deels worden verklaard door een verschil in benadering: hier lag meer nadruk op het vermijden van onnodige ingrepen bij een fout-positieve bevinding, terwijl in de VS het risico op een fout-negatief onderzoek zwaarder weegt.

Conclusie.

Het toepassen van de BI-RADS-categorieën gaf naast duidelijkheid in de patiëntenzorg ook inzicht in de bijdrage van de radiologie binnen het mammateam.

Inleiding

In 2000 is door het Kwaliteitsinstituut voor de Gezondheidszorg CBO (CBO) een nieuwe richtlijn uitgegeven ten behoeve van de screening en diagnostiek van het mammacarcinoom.1 Verreweg de belangrijkste aanbevelingen in deze richtlijn vormen de implementatie van de ‘mammapolikliniek’ en het ‘mammateam’. Ook wordt in de richtlijn gewezen op het belang van continue kwaliteitscontrole ten behoeve van een hogere kwaliteit van zorg voor vrouwen bij wie een mammacarcinoom wordt vermoed. Een belangrijke eis is dat er een verband wordt gelegd tussen de klinische, radiologische en histologische bevindingen als onderdelen van de tripeldiagnostiek. Daarvoor is een heldere en systematische verslaglegging onontbeerlijk. Verslagen dienen te worden afgesloten met een conclusie en een advies, waarbij een classificatie in algemeen aanvaarde categorieën moet worden toegepast.2

Voor de radioloog is deze classificatie gebaseerd op het ‘Breast imaging reporting and data system’ (BI-RADS).3 Dit werd in 1993 ontwikkeld in de Verenigde Staten door het American College of Radiology, met als doel de terminologie bij de beschrijving van een mammografisch onderzoek te standaardiseren, compleet met conclusie en classificatie in verschillende eindcategorieen. Op dit moment is ook de aanvulling met betrekking tot de echografie voltooid.4 In deze eindcategorieën geeft de radioloog als het ware een inschatting van de kans op maligniteit. Deze eindcategorieën en een korte omschrijving daarvan zijn weergegeven in tabel 1. Door ze te koppelen aan de uiteindelijke diagnose kan worden berekend wat de opbrengst is aan maligniteiten per BI-RADS-eindcategorie. Dit wordt in de BI-RADS-atlas de ‘positief voorspellende waarde voor maligniteit’ (PVW) van de eindcategorieën genoemd. Hiermee kunnen de BI-RADS-eindcategorieën ook worden ingezet bij de kwaliteitsbewaking.

De BI-RADS-classificatie werd in het Leids Universitair Medisch Centrum (LUMC) ingevoerd medio 2000. Wij gingen na hoe de verdeling was van de eindcategorieën over onze patiëntenpopulatie en wij berekenden de PVW's voor maligniteit van de eindcategorieën.

patiënten en methoden

Patiënten.

De follow-upstudie werd uitgevoerd over de periode 1 juni 2000-31 mei 2001. In totaal werden 2762 onderzoeken geïncludeerd. Het betrof alle vrouwelijke patiënten bij wie mammografie werd verricht, al dan niet aangevuld met echografie, met als indicatie het aantonen of uitsluiten van maligniteit. Mammografieën met betrekking tot de controle van siliconenprothesen of de reactie op chemotherapie werden buiten beschouwing gelaten. De gemiddelde leeftijd van de patiënten was 51 jaar (uitersten: 21-92).

Van de geïncludeerde mammogrammen werden er 654 (23,7) aangevuld met echografie, ter nadere evaluatie van een palpabele afwijking of ter nadere specificatie van een afwijking op het mammogram conform de CBO-richtlijn.1 Als na de mammografie ook echografie had plaatsgevonden, was de eindcategorie gebaseerd op het resultaat van beide technieken.

BI-RADS-categorieën.

BI-RADS-categorie 0 werd uitsluitend als een voorlopige uitslag toegepast. Uiteindelijk werd ieder compleet onderzoek steeds afgesloten met een BI-RADS 1 of hoger. Bij patiënten met een BI-RADS 1 of 2 werd een expectatief beleid gevolgd. Bij BI-RADS-3-afwijkingen werd vervolgonderzoek geadviseerd. Afwijkingen die echografisch in beeld kwamen, bijvoorbeeld die waarbij een fibroadenoom werd vermoed, ondergingen aansluitend een cytologische punctie. Als de uitslag conform het vermoeden was, kwam verder vervolgonderzoek te vervallen. Ook de eerste postoperatieve controles na een mammasparende behandeling kregen als eindcategorie BI-RADS 3.

Bij afwijkingen met uitslag BI-RADS 4 of 5 werd zo mogelijk aansluitend cytologisch en histologisch onderzoek verricht. Het cytologisch onderzoek werd in deze categorieën gebruikt ten behoeve van de sneldiagnostiek. Op de wekelijkse multidisciplinaire bespreking werden alle onderzoeken met een eindcategorie BI-RADS 4 of 5 besproken, alsmede overige probleemgevallen. Mede op grond van het klinisch onderzoek en de pathologie-uitslagen werd nu het verdere beleid bepaald. Soms werd afgeweken van de uit de BI-RADS-eindcategorie voortvloeiende aanbeveling.

Aan de hand van het Ziekenhuis Informatie Systeem werd nagegaan bij hoeveel patiënten een weefseldiagnose werd verkregen en of er een follow-uponderzoek beschikbaar was. Voor de patiënten bij wie geen follow-upgegevens in het Ziekenhuis Informatie Systeem beschikbaar waren, werd gebruikgemaakt van het Pathologisch-Anatomisch Landelijk Geautomatiseerd Archief (PALGA). De gegevens werden door PALGA anoniem verstrekt, omdat geen schriftelijke toestemming van de patiënten vooraf was gevraagd.

Positief voorspellende waarde van de BI-RADS-uitslag.

Bij het bewerken van de data werd gebruikgemaakt van de definities en de richtlijnen van het American College of Radiology,3 te weten:

- terecht positieve diagnose = carcinoom vastgesteld binnen 1 jaar na een radiologisch onderzoek met eindcategorie BI-RADS 4 of 5;

- terecht negatieve diagnose = geen carcinoom bekend binnen 1 jaar na een onderzoek met eindcategorie BI-RADS 1, 2 of 3;

- fout-negatieve diagnose = carcinoom vastgesteld binnen 1 jaar na een onderzoek met eindcategorie BI-RADS 1, 2 of 3; in ons huidige onderzoek werden ook de carcinomen die werden vastgesteld tijdens de eerstvolgende jaarlijkse controle hiertoe gerekend;

- fout-positieve diagnose = geen carcinoom bekend binnen 1 jaar na een onderzoek met eindcategorie BI-RADS 4 of 5.

Uit deze gegevens werd de PVW voor maligniteit van de eindcategorieën berekend: het aantal maligniteiten per categorie gedeeld door het totaalaantal patiënten per categorie × 100. Ook de PVW voor de gezamenlijke categorieën 4 en 5 werd berekend. Statistische significantie werd berekend met behulp van de exacte toets van Fisher, waarbij een p-waarde < 0,05 als drempel werd aangehouden.

resultaten

Definitieve diagnose.

Bij 215 patiënten werd een weefseldiagnose verkregen, bij 1477 patiënten was een vervolgonderzoek verricht en bij de overige 1070 patiënten vond koppeling plaats van de patiëntengegevens met het PALGA. Derhalve was de prevalentie van het mammacarcinoom 4,1 (113 van 2762). In ons ziekenhuis werden 110 carcinomen gediagnosticeerd, koppeling met PALGA leverde nog 3 carcinomen op: 2 carcinomen in de BI-RADS-1-categorie en 1 carcinoom in BI-RADS-2. De verdeling van de carcinomen over de verschillende BI-RADS-categorieën met de daarbijbehorende PVW is weergegeven in tabel 2.

Fout-positieve resultaten.

Van alle 57 BI-RADS-5-patiënten was de weefseldiagnose ‘maligne’. Van de 74 BI-RADS-4-patiënten was bij 62 een weefseldiagnose bekend, bij 39 was de uitslag ‘maligne’. Bij de overige 12 patiënten werd, na overleg met het mammateam op de multidisciplinaire bespreking, volstaan met kortetermijnvervolgonderzoek of aanvullend beeldvormend onderzoek, door middel van MRI. Deze onderzoeken toonden geen aanwijzingen voor maligniteit. Het totaal aantal fout-positieve resultaten in deze categorie kwam daarmee op 35.

Fout-negatieve resultaten.

Bij 8 patiënten, bekend in het LUMC, was bij een BI-RADS-1- of -2-uitslag toch sprake van een carcinoom. Bij 4 patiënten werd de diagnose tijdig gesteld, doordat zij om klinische redenen een operatieve ingreep ondergingen wegens ziekte van Paget van de tepel of wegens preventieve ablatio bij dragerschap van een borstkankergenmutatie. Bij de 4 andere patiënten werd het carcinoom ten tijde van het routinevervolgonderzoek ontdekt, bij 3 patiënten ontdekten wij dit met behulp van PALGA.

Bij 6 patiënten was er bij een BI-RADS-3-uitslag toch een maligniteit: bij 3 patiënten werd de diagnose tijdig gesteld doordat er cytologisch onderzoek was verricht, bij de overige 3 patiënten werd de diagnose gesteld ten tijde van het geadviseerde follow-uponderzoek. Het aantal maligniteiten in de BI-RADS-3-categorie was significant groter dan in de BI-RADS-1- en -2-categorie (?2 = 26,90; p < 0,01; df = 1).

beschouwing

Het belangrijkste doel van de invoering van de BI-RADS-eindcategorieën is duidelijkheid in de communicatie tussen de behandelaar en de radioloog. De radioloog geeft na adequate beschrijving van de mammografische en echografische bevindingen aan hoe hoog hij de kans inschat dat er sprake is van een maligniteit.

Er is door de werkgroep van het CBO destijds bewust gekozen voor deze classificatie en niet voor eerdere, onder andere vanuit de radiologie of vanuit de huisarts-geneeskunde gebruikte classificaties, omdat de BI-RADS-classificatie op dit moment wereldwijd wordt geïmplementeerd en de precieze omschrijving van de BI-RADS-eindcategorieën vergelijking mogelijk maakt.3 De recent verschenen nieuwe, vierde druk voorziet in een aantal aanvullingen, maar laat het principe en de uitwerking daarvan intact.4

Een beperking van het systeem is de interobservervariatie. In een studie waarbij deze werd gemeten aan de hand van ?-waarden, was de mate van overeenstemming matig (? = 0,56) bij het toekennen van een eindcategorie als er een afwijking aanwezig was. Deze mate van overeenstemming bleek nog te verminderen (? = 0,46) in de subgroep van de maligniteiten.5 Ook kan het aandeel van de BI-RADS-3-eindcategorie uiteenlopen van 1,4 tot 14 van de gehele populatie.6 Deze variatie neemt af naarmate de introductie van BI-RADS meer gemeengoed wordt.7

Ten behoeve van de kwaliteitscontrole is de bepaling van de PVW per eindcategorie een doeltreffende methode. Veel studies met betrekking tot de PVW betreffen subgroepen van patiënten uit de Amerikaanse screeningspraktijk, waardoor de resultaten uit deze studies niet geheel vergelijkbaar zijn.8-11 De belangrijkste waarden uit deze studies zijn weergegeven in tabel 3. Ons follow-uponderzoek geeft een goede indruk van onze werkwijze en onze sterke en zwakke punten. Wij bespreken nu de BI-RADS-eindcategorieën; voorbeelden zijn afgebeeld in de figuren 1, 2, 3 en 4.

BI-RADS-eindcategorie 1 en 2.

Het onderscheid tussen BI-RADS 1 (‘normaal’) en BI-RADS 2 (‘benigne’) is enigszins artificieel, maar kan helpen in de discussie met de behandelend arts over een bevinding op het mammogram met radiologisch benigne kenmerken (zie figuur 1 en 2b). Het percentage carcinomen in deze categorieën hoort zeer klein te zijn, maar zal nooit nul zijn, omdat fout-negatieve bevindingen onvermijdelijk zijn. In een eerder uitgevoerde studie was de PVW voor de subgroep ‘benigne’ (vergelijkbaar met de gezamenlijke BI-RADS-1- en -2-categorieën) 0,7.12 De follow-up van deze categorieën is altijd problematisch, omdat de betreffende patiënten zich vaak tot een enkel bezoek beperken. De completering van de follow-up werd mogelijk gemaakt door de PALGA-gegevens.

BI-RADS-eindcategorie 4 en 5.

Het onderscheid tussen BI-RADS 4 (‘verdacht’) en BI-RADS 5 (‘zeer verdacht voor maligniteit’) is groter. Als de radioloog een afwijking als BI-RADS 4 classificeert, mag er rekening mee worden gehouden, dat de afwijking toch benigne is (zie figuur 3). De meeste patiënten die vanuit het bevolkingsonderzoek op borstkanker worden verwezen, horen tot deze groep. Bij een BI-RADS 5 wordt de afwijking daarentegen zó maligne ingeschat, dat een mogelijke benigne diagnose een uitzondering zal zijn (zie figuur 4). De PVW van 100 in deze categorie in onze studie (zie tabel 2) lag hoger dan in de literatuur: 81-97.8 10 11 Dit kan worden geduid als een na-effect van onze voorheen toegepaste classificatie, waarbij de afwijkingen met de classificatie ‘maligne’ primaire én secundaire maligniteitskenmerken moesten tonen, dat wil zeggen dat naast de (primaire) verdachte afwijking tevens sprake moest zijn van (secundaire) kenmerken geassocieerd met maligniteit, zoals huid- of tepelintrek king, huidverdikking en pathologische lymfklieren in de oksel. De PVW van de eindcategorieën 4 en 5 tezamen lag in onze studie met 73 mede hierdoor ver boven de door de American College of Radiology aanbevolen 25-40.3

BI-RADS-eindcategorie 3.

Dit is een categorie afwijkingen waarbij de radioloog de kans op maligniteit zo laag inschat, dat het verantwoord wordt geacht te volstaan met een controleonderzoek. Meestal gaat het om solide afwijkingen met ronde, ovale of enigszins gelobde contouren, een klein groepje ronde of ovale microcalcificaties of een focale asymmetrie van het klierweefsel. In het algemeen wordt hiervoor een controle over een termijn van 6 maanden aanbevolen, gevolgd door een tweetal follow-upmammografieën met een interval van 1 jaar (zie figuur 2a en 2b). Dit is een moeilijke categorie; de radioloog mag de behandelend arts en de patiënt niet belasten met het vermelden van een zeer klein risico op kanker, maar moet kunnen verdedigen dat controle noodzakelijk en verantwoord is.13 Deze categorie is het draaipunt tussen de onderzoeken met een benigne uitslag en de onderzoeken waarin aanwijzingen voor maligniteit werden gevonden. In deze categorie is de interobservervariatie dan ook het grootst.6 Als de bezorgdheid een carcinoom te missen sterk op de voorgrond staat, zal het aantal onderzoeken met een BI-RADS-3-classificatie klein zijn en zal vaker worden overgegaan tot een BI-RADS-4-classificatie. Het gevolg is een groter aantal biopsieën met meer fout-positieve ingrepen. Als men onnodige bezorgdheid bij de patiënt wil voorkomen, onnodige biopsieën wil vermijden en de kosten beheersbaar wil houden, zal een afwachtende houding, dus een BI-RADS-3-classificatie, vaker worden toegepast. Door de eerste controle uit te voeren na 6 maanden, is het gevaar dat de prognose verslechtert te verwaarlozen.13

Voorzover dat te vergelijken is met de Amerikaanse literatuur, was het percentage carcinomen in de BI-RADS-3-categorie in onze studie hoog: 3,9. In Amerika wordt gestreefd naar een PVW < 2 voor deze categorie.6 13 Dit illustreert dat aldaar de bezorgdheid een carcinoom te missen prevaleert boven het streven geen onnodige biopsieën uit te voeren en de kosten beheersbaar te houden. Dit neemt niet weg dat iedere fout-negatieve bevinding in deze categorie retrospectief dient te worden besproken, vooral om na te gaan of de afwijking wel voldeed aan de criteria van een BI-RADS-3-afwijking.14

conclusie

De invoering van de BI-RADS-eindcategorieën heeft geleid tot duidelijkheid in communicatie en beleid. De beschreven PVW van de categorieën gaf inzicht in de bijdrage van de radiologie binnen het mammateam. Aanvullend onderzoek en vergelijking met andere klinieken is noodzakelijk ter verkrijging van de voor de Nederlandse praktijk wenselijke referentiewaarden.

Dr.E.J.Th.Rutgers, chirurg, Nederlands Kanker Instituut, gaf commentaar op het manuscript.

Belangenconflict: geen gemeld. Financiële ondersteuning: geen gemeld.

Dit onderzoek werd eerder gepubliceerd in European Radiology (2004;14:1743-50) met als titel 'The positive predictive value of the breast imaging reporting and data system (BI-RADS) as a method of quality assessment in breast imaging in a hospital populat

Literatuur

  1. Kwaliteitsinstituut voor de Gezondheidszorg (CBO). Hetmammacarcinoom: richtlijn voor screening en diagnostiek. Utrecht: CBO;2000.

  2. Rutgers EJTh, Tuut MK. CBO-richtlijn‘Mammacarcinoom: screening en diagnostiek’.Ned Tijdschr Geneeskd2001;145:115-9.

  3. American College of Radiology. Breast imaging reportingand datasystem (BI-RADS). 3rd ed. Reston: American College of Radiology;1998.

  4. American College of Radiology. Breast imaging reportingand datasystem (BI-RADS). 4th ed. Reston: American College of Radiology;2003.

  5. Kerlikowske K, Grady D, Barclay J, Frankel SD, Ominsky SH,Sickles EA, et al. Variability and accuracy in mammographic interpretationusing the American College of Radiology Breast Imaging Reporting and DataSystem. J Natl Cancer Inst 1998;90:1801-9.

  6. Caplan LS, Blackman D, Nadel M, Monticciolo DL. Codingmammograms using the classification ‘probably benign finding –short interval follow-up suggested’. AJR Am J Roentgenol1999;172:339-42.

  7. Lehman C, Holt S, Peacock S, White E, Urban N. Use of theAmerican College of Radiology BI-RADS guidelines by community radiologists:concordance of assessments and recommendations assigned to screeningmammograms. AJR Am J Roentgenol 2002; 179:15-20.

  8. Yasmeen S, Romano PS, Pettinger M, Chlebowski RT, RobbinsJA, Lane DS, et al. Frequency and predictive value of a mammographicrecommendation for short-interval follow-up. J Natl Cancer Inst2003;95:429-36.

  9. Orel SG, Kay N, Reynolds C, Sullivan DC. BI-RADScategorization as a predictor of malignancy. Radiology1999;211:845-50.

  10. Lacquement MA, Mitchell D, Hollingsworth AB. Positivepredictive value of the Breast Imaging Reporting and Data System. J Am CollSurg 1999;189:34-40.

  11. Liberman L, Abramson AF, Squires FB, Glassman JR, MorrisEA, Dershaw DD. The breast imaging reporting and data system: positivepredictive value of mammographic features and final assessment categories.AJR Am J Roentgenol 1998;171:35-40.

  12. Zonderland HM, Coerkamp EG, Hermans J, Vijver MJ van de,Voorthuisen AE van. Diagnosis of breast cancer: contribution of US as anadjunct to mammography. Radiology 1999;213:413-22.

  13. Sickles EA. Probably benign breast lesions: when shouldfollow-up be recommended and what is the optimal follow-up protocol?Radiology 1999;213:11-4.

  14. Rosen EL, Baker JA, Soo MS. Malignant lesions initiallysubject to short-term mammographic follow-up. Radiology2002;223:221-8.