Computerbeoordeling van screeningsmammogrammen

More than one million mammograms are performed in the Netherlands each year. Today, these images are all in digital format and processed by various types of software for optimal display during radiological analysis.

As a result of continuous quality control on national public health screening for breast cancer, approximately 1000 cases of interval carcinoma and any T2 tumours identified during this screening are re-assessed.

The results of these retrospective analyses suggest that there is room for improvement in terms of the reliability of screening mammography without this resulting in an excessive increase of false positive results.

Research has shown that the more radiological evaluators are involved, the better the results.

Alternatively, a computer can be utilised for detecting abnormalities. Large-scale use of Computer -Assisted Detection (CAD) is already underway in some countries. For this reason, the option of adding CAD to the current practice of double assessment of mammograms could be considered a sensible option for the future.

Conflict of interest: none declared. Financial support: none declared.

Download PDF

Samenvatting

Jaarlijks worden er in Nederland meer dan 1 miljoen mammogrammen gemaakt. Deze zijn inmiddels allemaal in digitaal formaat. De beelden worden bewerkt door verschillende vormen van software voor optimale weergave bij de radiologische beoordeling.
Tijdens de continue kwaliteitsbewaking van het bevolkingsonderzoek op borstkanker worden jaarlijks ongeveer 1000 intervalcarcinomen en in de screening gevonden T2-tumoren herbeoordeeld.
De resultaten van deze retrospectieve analyses laten zien dat de betrouwbaarheid van mammografie verbeterd kan worden zonder tot een onaanvaardbaar aantal fout-positieve uitslagen te komen.
Naarmate er meer radiologen naar een mammogram kijken, wordt de sensitiviteit van het onderzoek groter.
Als alternatief kan de computer worden ingezet om afwijkingen op te sporen. Computerondersteunde detectie (CAD) wordt in sommige landen al op grote schaal toegepast. Het ligt in de rede om CAD naast de huidige dubbele beoordeling in te zetten.

artikel

In Nederland worden jaarlijks meer dan 1 miljoen mammogrammen gemaakt. Het grootste deel daarvan komt voor rekening van het Bevolkingsonderzoek Borstkanker. De rest wordt gemaakt in de ziekenhuizen, in een klinische setting of voor screening.

Tijdens de continue kwaliteitsbewaking van het bevolkingsonderzoek op borstkanker worden jaarlijks ongeveer 1000 intervalcarcinomen en in de screening gevonden T2-tumoren (diameter: 2-5 cm) herbeoordeeld. De resultaten van deze retrospectieve analyses laten zien dat er ruimte is om de betrouwbaarheid van mammografie te verbeteren zonder tot een onaanvaardbaar aantal fout-positieve uitslagen te komen.

In de Nederlandse screening is bekend dat circa 50% van de voorlopers van borstkanker al 2 jaar vóór detectie zichtbaar zijn in mammogrammen.1 Bij 25% lijken de zichtbare kenmerken achteraf duidelijk genoeg om deze carcinomen als ‘detecteerbaar’ te classificeren. De andere afwijkingen zijn zo subtiel dat doorverwijzing niet zinvol wordt geacht omdat het aantal onterecht doorverwezen vrouwen dan te hoog zou worden.

Om de radiologische beoordeling van de mammogrammen te verbeteren, zijn computerprogramma’s ontwikkeld die automatisch mammografische afwijkingen herkenen en beoordelen. Digitalisering van het bevolkingsonderzoek maakt het mogelijk deze techniek relatief eenvoudig in te voeren. Computerondersteunde detectie (CAD) wordt in sommige landen al op grote schaal toegepast.

In dit artikel bespreken wij de overwegingen voor gebruik van CAD in de voorscreening van mammogrammen.

Digitale beeldbewerking

Sinds 2010 is het bevolkingsonderzoek naar borstkanker gedigitaliseerd met een volledig landelijke dekking. Digitale mammografie werd in de meeste ziekenhuizen al veel eerder ingevoerd, nadat de eerste digitale mammograaf in 2000 door de Amerikaanse Food and Drug Administration (FDA) werd goedgekeurd. Verreweg de meeste digitale apparaten maken gebruik van ‘direct radiography’-detectoren, maar in enkele ziekenhuizen wordt nog ‘computed radiography’ gebruikt. Deze laatste techniek werkt met losse digitale cassettes, wat als nadeel heeft dat deze in een apart systeem moeten worden ingevoerd om ze te kunnen uitlezen.

Digitale mammografie heeft grote overeenkomsten met digitale fotografie: de detectoren zijn direct of indirect gevoelig voor invallende röntgenfotonen, en dat wordt in een elektrische lading vertaald. De ruimtelijke resolutie wordt bepaald door de afmetingen van de detectorelementen. Deze afmeting ligt tegenwoordig tussen de 50 en de 100 micron (1 micron = 1/1000 mm). Hiermee kunnen in principe de kleinste relevante details worden afgebeeld.

De gevoelige beeldelementen leggen het signaal vast en vormen zo een digitale afbeelding. Dit wordt ook wel het ‘ruwe beeld’ genoemd. De door de computer uitgevoerde beeldbewerking past het contrast van het beeld lokaal aan en zorgt zo voor een zo goed mogelijke weergave van subtiele details. Daarbij gaat wel een deel van de informatie verloren, want de kwantitatieve relatie tussen de elementen in het opgenomen röntgenbeeld en de grijswaarden in het uiteindelijke beeld blijft niet bewaard. Dit maakt voor de menselijke waarneming weinig uit, maar het kan juist grote voordelen bieden als de ruwe beelden door een computer bekeken worden.

In figuur 1 wordt een voorbeeld getoond waarbij door gecomputeriseerde beeldbewerking een artefact is veroorzaakt waardoor informatie rondom een verkalking verloren is gegaan. Ter vergelijking zijn de ruwe data zonder bewerking weergegeven. Zonder de originele ruwe data is het dus onmogelijk om erachter te komen wat voor informatie er vóór de beeldbewerking eigenlijk aanwezig was. Met andere woorden: wat de computer ‘ziet’ is niet hetzelfde als wat de radioloog ziet. Daarom kunnen de gecombineerde waarnemingen door de computer en de radioloog aanvullende informatie leveren.

Computerondersteunde detectie

Er zijn verschillende vormen van CAD. De techniek kan er in de eerste plaats voor zorgen dat relevante pathologische afwijkingen niet over het hoofd worden gezien (perceptie) (figuur 2 en 3). In de tweede plaats zijn er CAD-vormen in ontwikkeling die behulpzaam zijn bij de interpretatie van afwijkingen. Daarbij wordt soms gewerkt met een referentiedatabase, waarmee een specifieke pathologische afwijking vergeleken kan worden. Dit laatste is nog niet commercieel beschikbaar voor de mammografie.

Op dit moment wordt bij de routinescreening uitsluitend de eerste methode voor automatische detectie gebruikt. Dit is te vergelijken met spellingscontrole in een tekstverwerker. De computer vindt verdachte structuren en projecteert die over het originele beeld, waarna het geheel apart wordt bewaard. CAD maakt gebruik van complexe patroonherkenning. In de praktijk biedt men duizenden beelden met bekende gediagnosticeerde afwijkingen aan het computer-CAD-algoritme om het te trainen. Door digitalisering van mammogrammen wordt het veel makkelijker om aan dat soort voorbeelden te komen en worden CAD-programma’s steeds beter.

In de toekomst zullen CAD-programma’s niet alleen helpen met het detecteren, maar ook met het interpreteren van verdachte gebieden, bijvoorbeeld doordat ze de kans op aanwezigheid van ziekte kunnen presenteren, of vergelijkbare afwijkingen met bekende diagnose kunnen tonen.

Verbeteren van beoordelingen

In Nederland is vanaf de invoering van het bevolkingsonderzoek naar borstkanker in 1990 gepoogd een redelijke balans te bewaren tussen detectiecijfers en negatieve effecten van screening door onterechte doorverwijzingen. De positief voorspellende waarde van de onderzoeksuitslag lag lange tijd rond de 50%. De laatste 5 jaar is dit mede op basis van Nederlands onderzoek,2 en het beleid van het Landelijk Referentie Centrum voor het Bevolkingsonderzoek Borstkanker (LRCB) bijgesteld; op dit moment ligt de positief voorspellende waarde rond de 30%, met een dalende trend, bij een geleidelijk stijgend verwijscijfer van ongeveer 2% (cijfer 2007; bron: Nationaal Programma Kankerbestrijding; http://www.npknet.nl/index.php?item=966). Ook met dit gewijzigde beleid heeft Nederland nog steeds het laagste verwijscijfer ter wereld bij een goede detectie.

Toch worden nog veel carcinomen te laat gevonden. Bij een kwart van de patiënten zijn in de screening gevonden carcinomen al op eerdere screeningsopnamen achteraf zodanig zichtbaar dat verwijzing gerechtvaardigd zou zijn geweest. Van de 5000 in de screening gedetecteerde carcinomen per jaar zouden er dus theoretisch ruim 1000 2 jaar eerder gevonden kunnen worden als de beoordeling zou verbeteren. Daarnaast is de verhouding tussen carcinomen die bij gescreende vrouwen ontdekt worden buiten de screening (intervalcarcinomen) en carcinomen gedetecteerd door de screening ongeveer 1:3. Ook bij intervalcarcinomen blijkt dat 25% al zichtbaar is op voorgaande screeningsmammogrammen. Zo kan worden berekend dat in potentie ongeveer 1400 gevallen van borstkanker eerder ontdekt zouden kunnen worden. Daarbij kan CAD een belangrijke rol gaan spelen.

Vaak wordt gedacht dat het bij gemiste carcinomen in de screening gaat om perceptiefouten. Onderzoek heeft echter aangetoond dat het daar meestal niet om gaat. Radiologen zien vele structuren die in aanmerking zouden kunnen komen voor doorverwijzing, en moeten de belangrijkste daarvan selecteren. Het onterecht beslissen dat een gedetecteerde afwijking niet verdacht genoeg is voor doorverwijzing is de belangrijkste oorzaak van gemiste carcinomen. Het gaat daarbij dus om (achteraf) onjuiste interpretatie van beeldkenmerken. Om de kans op deze verkeerde beoordelingen te verminderen, worden in de screening de mammogrammen onafhankelijk van elkaar door 2 radiologen bekeken.

Studies over de effectiviteit van CAD

De basis van de evaluatie van de effectiviteit van een screeningsprogramma is de onderlinge relatie tussen het verwijspercentage, de voorspellende waarde en de detectie. Een hoger verwijspercentage gaat doorgaans gepaard met een lagere voorspellende waarde, doordat er dan meer doorverwijzingen plaatsvinden op basis van kleine of moeilijk zichtbare afwijkingen. Deze laatste zijn moeilijker te interpreteren en leiden vaker tot een fout positieve uitslag. Betere diagnostische hulpmiddelen kunnen dit effect tegengaan. Deze leiden normaal gesproken tot een hogere sensitiviteit, maar men moet er wel op bedacht zijn dat als daarnaast het aantal verwijzingen te veel toeneemt de totale winst gering kan zijn.

Om de effectiviteit van CAD te bepalen zijn talloze studies verricht, met name in de VS. Hoewel niet al deze studies een positief effect van CAD konden vaststellen, lijkt er consensus te bestaan dat CAD bijdraagt aan een toename van de sensitiviteit van screening, ten koste van een geringe daling van de specificiteit. Erg verrassend is dit resultaat niet. CAD wordt in de VS uitsluitend gebruikt om perceptiefouten te vermijden. Radiologen nemen volgens de richtlijn eerst een beslissing zonder CAD en kunnen daarna zo nodig extra doorverwijzen als CAD iets verdachts aangeeft wat nog niet herkend was. Terugkomen op een beslissing om een patiënt door te verwijzen als CAD niets aangeeft, is niet toegestaan. Op die manier kan de specificiteit alleen maar verder dalen.

Er is een review gepubliceerd van studies die beoordeling door 2 radiologen en CAD bij borstkankerscreening onderzochten.3 Gevonden werd dat er meer evidence bestaat voor een positief effect van dubbele beoordeling dan voor CAD, maar als gevolg van de geringe statistische power van de meeste studies kunnen geen eenduidige conclusies worden getrokken. Het uitvoeren van een betrouwbare studie naar gebruik van CAD-screening is niet eenvoudig en zeer kostbaar. Daarvoor moeten in een prospectief onderzoek mammogrammen over een langere periode op 2 manieren worden beoordeeld, zowel met als zonder CAD. Dit is in een recente Engelse studie gedaan. In een prospectieve gerandomiseerde trial (genaamd ‘CADET II’) waaraan bijna 30.000 vrouwen deelnamen, werd dubbele beoordeling vergeleken met 1 radioloog die CAD gebruikte.4 Gevonden werd dat het verwijspercentage bij gebruik van CAD (3,9%) iets hoger was dan bij dubbele beoordeling (3,4%). De sensitiviteit was vrijwel gelijk: 12,3% van de carcinomen werd niet bij dubbele beoordeling gevonden en 12,9% niet bij gebruik van CAD.

Met meer radiologen en CAD wordt de beoordeling beter

Wanneer een mammografische afwijking wordt gevonden, kan het beoordelen van de soms subtiele kenmerken moeilijk zijn. Menselijke waarnemers blijken sterk variabel te zijn. Om hier iets aan te doen, kunnen meerdere radiologen worden ingezet of kan CAD worden gebruikt, of beide. Dit wordt geïllustreerd in figuur 4.

In een onderzoek werd een serie van 250 mammogrammen met in de screening gemiste carcinomen aan een groep ervaren radiologen voorgelegd. De beelden werden gemengd met 250 normale mammogrammen.5 De figuur laat zien dat de sensitiviteit (fractie terecht-positieven) toeneemt als meer wordt doorverwezen. Omdat in de praktijk het aantal onterechte doorverwijzingen laag moet zijn, is alleen het linker deel van de grafiek relevant. Vooral in dit deel van de grafiek stijgt het aandeel terecht-positieven sterk door meerdere radiologen onafhankelijk te laten lezen en de resultaten daarna te combineren. De inzet van 1 extra onafhankelijke radioloog doet terecht-positieve fractie (bij een fout-positieve fractie van 0,1) ongeveer 20% toenemen. Die 20% vertaalt zich in Nederland tot ongeveer 1000 extra gevonden mammacarcinomen per jaar. Een 3e radioloog voegt daar gezien dit model nog eens 10% aan toe.

Kosten

De kosten van screeningsonderzoek in 2009 waren € 54,27 per onderzoek. Deze prijs zou met 5,5% stijgen indien we qua menskracht en logistiek in staat zouden zijn een 3e radioloog in te zetten. Dit gaat in de praktijk vrijwel zeker gepaard met een verdere daling van de positief voorspellende waarde. Over de kosten van de bijpassende groep fout-positieve verwijzingen zijn we veel minder goed geïnformeerd doordat deze in de ziekenhuizen worden gegenereerd. Wat we wel weten is dat ze in bepaalde regio’s een negatieve invloed hebben op de wachttijden voor mammapoliklinieken. Dit is de afweging die telkens weer gemaakt moet worden bij de introductie van innovaties in de screening. Het gaat immers om een gezonde populatie, waarbij in Nederland het uitgangspunt om alles te vinden ongeacht de kosten niet opgaat.

Uiteindelijk worden in bevolkingsonderzoeken dergelijke ingrepen beoordeeld op hun invloed op de mortaliteitsreductie.

Conclusie

Hoe computerondersteunde detectie in Nederland kosteneffectief kan worden ingezet bij de beoordeling van screeningsmammogrammen zal onderzocht moeten worden. De uiteindelijke benodigde licentiekosten voor de CAD-software zijn op dit moment nog niet bekend. Bij de huidige inzichten en afwegingen die we in Nederland op dit punt maken, lijkt het in onderzoeksopzet inzetten van 2 radiologen die beide met CAD werken meer voor de hand te liggen dan het vervangen van de huidige dubbele beoordeling door 1 radioloog met CAD. Dit om de effecten op de foutpositieve fractie goed te kunnen monitoren en in de hand te kunnen houden.

Leerpunten

Bij een georganiseerd screeningsprogramma wordt gepoogd een zekere balans te handhaven tussen een goede detectie en een zo laag mogelijk aantal foutpositieve doorverwijzingen.
De detectie van meer mammacarcinomen in vroegere stadia lijkt mogelijk; 2 jaar vóórdat een mammacarcinoom bij de screening gevonden wordt zijn retrospectief vaak al voorlopers detecteerbaar in een mammogram.
Computerondersteunde detectie (CAD) zou behulpzaam kunnen zijn bij de beoordeling van mammogrammen. CAD bestaat enige tijd maar het nut is sterk afhankelijk van de setting waarin ze wordt gebruikt.
In Nederland wordt CAD nog niet frequent toegepast. Echter, nu de screeningsmammografie digitaal wordt uitgevoerd, zijn er nieuwe mogelijkheden en zou de toepassing van computerondersteuning als aanvulling van de radiologische beoordeling overwogen kunnen worden.

Literatuur

Broeders MJ, Onland-Moret NC, Rijken HJ, Hendriks JH, Verbeek AL, Holland R. Use of previous screening mammograms to identify features indicating cases that would have a possible gain in prognosis following earlier detection. Eur J Cancer. 2003;39:1770-5 Medline. doi:10.1016/S0959-8049(03)00311-3
Otten JD, Karssemeijer N, Hendriks JH, et al. Effect of recall rate on earlier screen detection of breastcancers based on the Dutch performance indicators. J Natl Cancer Inst. 2005;97:748-54 Medline. doi:10.1093/jnci/dji131
Taylor P, Potts HW. Computer aids and human second reading as interventions in screening mammography: two systematic reviews to compare effects on cancer detection and recall rate. Eur J Cancer. 2008;44:798-807 Medline. doi:10.1016/j.ejca.2008.02.016
Gilbert FJ, Astley SM, Gillan MG, et al. CADET II Group. Single reading with computer-aided detection for screening mammography. N Engl J Med. 2008;359:1675-84 Medline. doi:10.1056/NEJMoa0803545
Karssemeijer N, Otten JD, Roelofs AAJ, van Woudenberg S, Hendriks JHCL. Effect of independent multiple reading of mammograms on detection performance. Proc SPIE. 2004;5372:82-9.

Artikelinformatie

30 maart 2011

In print verschenen in

week 13 2011

Citeer dit artikel als

Ned Tijdschr Geneeskd. 2011;155:A3035

Vakgebied

Kanker

Beeldvorming

Auteursinformatie

Academisch Medisch Centrum, afd. Radiologie, Amsterdam.

Prof.dr. G.J. den Heeten, radioloog.

Universitair Medisch Centrum St Radboud, afd. Radiologie, Nijmegen.

Dr. N. Karssemeijer, fysicus.

Contact dr. N. Karssemeijer (n.karssemeijer@rad.umcn.nl)

Verantwoording

Belangenconflict: geen gemeld. Financiële ondersteuning: geen gemeld.
Aanvaard op 7 februari 2011

Heb je nog vragen na het lezen van dit artikel?

Check onze AI-tool en verbaas je over de antwoorden.

ASK NTVG

Computerbeoordeling van screeningsmammogrammen

Samenvatting