In de rubriek Metamedica reflecteren auteurs op het geneeskundig handelen vanuit ethisch, juridisch, historisch of literair perspectief. Het doel is om de medische blik te verbreden en multidisciplinair denken te stimuleren.
Wat kan AI betekenen voor de toekomst van de zorg? Een hybride systeem waarin mens en machine samenwerken, kan leiden tot verlichting van de werkdruk én verbetering van de patiëntenzorg.
Samenvatting
De gezondheidszorg kampt wereldwijd met toenemende druk door vergrijzing en personeelstekorten. Kunstmatige intelligentie (AI) kan helpen door zorgprocessen te optimaliseren en zorgverleners te ondersteunen. Dit artikel verkent de voordelen van AI voor betere diagnoses, medicatieontwikkeling en efficiëntere zorgprocessen, maar belicht ook de uitdagingen rondom privacy, ethiek en bias in AI-systemen. Een nauwe samenwerking tussen zorgprofessionals en AI-experts, evenals gerichte investeringen, is essentieel voor een verantwoorde integratie van AI in de gezondheidszorg.
artikel
Mens en machine hebben fundamenteel verschillende capaciteiten in de gezondheidszorg. Waar zorgprofessionals uitblinken in klinisch redeneren, empathie en contextueel begrip, kan kunstmatige intelligentie (AI) enorme hoeveelheden data analyseren en subtiele patronen herkennen. Alleen door goede samenwerking kunnen technologische doorbraken hun weg vinden naar effectieve toepassing in de zorg.
Veelbelovende technologie
Door vergrijzing en maatschappelijke veranderingen staat de zorgsector onder toenemende druk. Innovatie is essentieel om hoogwaardige zorg te kunnen blijven garanderen. Recente doorbraken in kunstmatige intelligentie maken het mogelijk om data op revolutionaire wijze te verwerken, met potentieel grote impact op de gezondheidszorg. De mogelijkheden van AI in de zorg zijn veelbelovend en manifesteren zich op drie belangrijke gebieden.
Het eerste gebied betreft de logistieke en administratieve processen. Voormalig zorgminister Fleur Agema zag hierin een belangrijke rol voor AI, met name in het terugdringen van administratieve lasten om personeelstekorten aan te pakken.1 Deze toepassingen sluiten aan bij bestaande optimalisatieprocessen: AI kan bijvoorbeeld helpen bij het voorspellen van inkoop of het efficiënter afhandelen van vragen. Het zijn waardevolle toepassingen, maar niet meer dan een voortzetting van bestaande verbeterprocessen.
Het tweede, en wellicht meest revolutionaire gebied betreft AI voor het analyseren van tekst- en beelddata en de impact daarvan op de medische diagnostiek en medicijnontwikkeling. Deze toepassingen vragen om een fundamenteel andere benadering, waarbij nauwe samenwerking tussen zorgprofessionals en technologie essentieel is.
Het derde gebied is de continue monitoring van patiënten via sensoren en connected devices. AI-systemen kunnen deze realtimedata analyseren om vroegtijdig gezondheidsrisico's te signaleren en preventief in te grijpen. In dit artikel verkennen we de veelbelovende ontwikkelingen in het tweede en derde gebied en hun implicaties voor de toekomst van de gezondheidszorg.
AI bij diagnoses
Het toepassen van kunstmatige intelligentie bij diagnoses laat zien hoe mens en machine elkaar kunnen versterken. Een goed voorbeeld is de detectie van gastro-intestinale poliepen, waar AI-systemen en artsen samenwerken. In deze samenwerking spoort AI potentiële afwijkingen op, waarna de arts deze beoordeelt en in de klinische context plaatst. Deze combinatie leidt tot significant betere resultaten: het aantal gemiste diagnoses halveert vergeleken met artsen die zonder AI-ondersteuning werken.2 Daarnaast bestaan er modellen die helpen met hersentumoren detecteren, meer dan 750 huidziekten helpen onderscheiden en verschillende stadia van prostaatkanker classificeren.3-5
AI kan op steeds meer manieren ondersteunen bij het stellen van diagnoses. We moeten een belangrijk onderscheid maken tussen AI-modellen en AI-systemen. AI-modellen vormen de wiskundige kern die patronen in medische data herkent. AI-systemen daarentegen zijn de complete, gebruiksklare toepassingen die deze modellen combineren met interfaces, werkprocessen en veiligheidscontroles, zodat ze daadwerkelijk in de klinische praktijk kunnen worden ingezet. In de gezondheidszorg zijn AI-modellen alleen niet voldoende: om mens en machine effectief te laten samenwerken, zijn volwaardige AI-systemen nodig.
Machinelearing
De eerder genoemde doorbraken zijn allemaal gebaseerd op machinelearning: computers leren van bestaande gegevens. AI-modellen analyseren bijvoorbeeld röntgenfoto’s, MRI-scans, tekstuele dossiers en huidbeelden. Zo herkennen ze patronen en afwijkingen die mensen vaak ontgaan. Tegenwoordig gebeurt dit vaak met zogenoemde transformer-architecturen die gebruikmaken van ‘self-attention’. Dit zijn AI-modellen die zelfstandig leren bepalen welke datapunten belangrijk zijn om context en betekenis te begrijpen. Hierdoor kunnen meerdere gegevens tegelijkertijd worden beoordeeld en worden relaties tussen woorden of pixels berekend.6 Deze techniek is inmiddels toonaangevend bij vrijwel alle vormen van dataverwerking en vormt een belangrijk onderdeel van moderne beeldverwerking en tekstgeneratie, zoals bij ChatGPT.
Deze efficiënte verwerking maakt het mogelijk om zowel tekstuele als complexe beelden te analyseren. Omdat verschillende soorten informatie op een vergelijkbare manier worden geanalyseerd, zijn deze modellen ook geschikt om multimodale data te integreren. Door recente technologische ontwikkelingen kunnen AI-modellen steeds grotere hoeveelheden data effectief verwerken. Tegelijkertijd worden ze wel complexer en moeilijker te doorgronden.
Indrukwekkend maar minder uitlegbaar
Het gebruik van computermodellen in de gezondheidszorg is niet nieuw, het bestaat al sinds de jaren 70. Expertsystemen zoals MYCIN diagnoseerden bacteriële infecties en schreven antibiotica voor op basis van eenvoudige data, zoals labuitslagen en vragenlijsten.7 MYCIN, dat stamt uit de jaren zeventig, was eenvoudiger en beter uit te leggen dan moderne AI-systemen. MYCIN volgde vaste regels, bijvoorbeeld: ‘als deze waarde hoger is dan die waarde, stel dan deze diagnose’. Daardoor waren beslissingen duidelijk. Toch waren er ook toen al zorgen over aansprakelijkheid, omdat onjuiste antibiotica-adviezen tot fouten kunnen leiden.
Hedendaagse geavanceerde AI-modellen gebruiken miljoenen parameters die zelf via machinelearning worden bepaald en AI-systemen bevatten op hun beurt weer een breed scala aan modellen. Deze geavanceerde modellen werken niet met eenvoudige regels, maar met complexe statistische methoden. Dat maakt ze moeilijk te doorgronden. Niemand kan de individuele parameters interpreteren, daarom hebben we technieken nodig die ons helpen de onderliggende modellen te doorgronden. Zelfs als we inzicht hebben in de statistiek van het systeem, blijft het bepalen van de aansprakelijkheid bij een foutieve diagnose ingewikkeld: ligt de verantwoordelijkheid bij de zorgverlener, de AI-ontwikkelaar of het ziekenhuis?
Machinaal leren versterkt bias
Hoewel AI veel potentie biedt, brengt de technologie ook belangrijke uitdagingen met zich mee. Zo kunnen datasets die niet representatief zijn, leiden tot modellen met bias. Een van de grootste zorgen is dan ook vooringenomenheid in AI-modellen, wat kan resulteren in bijvoorbeeld discriminatie of seksisme. Voorbeelden hiervan zijn de toeslagenaffaire bij de Belastingdienst en fraudedetectiemodellen bij DUO, die mensen met een migratieachtergrond vaker selecteerden.8,9 In de gezondheidszorg bleek het Optum-algoritme Afro-Amerikanen ten onrechte als gezonder te classificeren, waardoor zij minder zorg kregen.10
De kwaliteit van AI-modellen is sterk afhankelijk van de wijze waarop de trainingsdata worden gelabeld. Bij medische beeldvorming moeten medische experts bijvoorbeeld handmatig aangeven welke afwijkingen zichtbaar zijn op scans of foto’s. Dit arbeidsintensieve proces, waarbij artsen duizenden beelden moeten beoordelen en annoteren, kan onbedoeld bias introduceren. Als de artsen die de data labelen bijvoorbeeld vooral ervaring hebben met bepaalde patiëntgroepen, kan dit leiden tot minder accurate labels voor andere groepen. Daarnaast kunnen verschillen in interpretatie tussen artsen leiden tot inconsistente labels, wat de betrouwbaarheid van het AI-model nadelig beïnvloedt. Het is dus essentieel dat zowel de dataverzameling, als de datalabelling door experts op een correcte manier plaatsvindt.
Bias ontstaat wanneer trainingsgegevens niet representatief zijn voor de gehele bevolking – vergelijkbaar met het gebruik van een niet-representatieve steekproef in medisch onderzoek. Zo presteert een dermatologie-AI, getraind op witte patiënten, mogelijk slechter bij donkere huidtypes.
Samenwerking
Voor medisch specialisten is het essentieel om inzicht te hebben in de techniek en statistiek achter AI-modellen. Alleen zo kunnen ze voorkomen dat uitkomsten op een verkeerde manier worden geïnterpreteerd of dat er blindelings op wordt vertrouwd. Vanwege vragen rondom aansprakelijkheid kunnen complexe modellen diagnoses vrijwel nooit volledig autonoom stellen, zelfs niet als ze beter presteren dan mensen. Bovendien ontbreekt het deze modellen aan volledige klinische context, wat samenwerking tussen medische en AI-specialisten noodzakelijk maakt.11
Een voorbeeld van wat er mis kan gaan bij gebrekkige samenwerking is een AI-model voor longontstekingen uit 2017. Hoewel het model in experimenten betere resultaten liet zien dan radiologen, bleek de dataset meerdere beelden van dezelfde patiënten te bevatten.12 Door een onzorgvuldige splitsing kwamen deze beelden zowel in de trainings- als in de evaluatieset terecht, wat leidde tot kunstmatig hoge prestaties die niet reproduceerbaar waren. Pas na herziening werd de fout opgemerkt en gecorrigeerd.
Hybride model
Wat nodig is zijn hybride systemen waarin professionals samenwerken met AI-modellen om nauwkeuriger diagnoses te kunnen stellen. AI-modellen analyseren grote hoeveelheden medische data en markeren bijvoorbeeld verdachte gebieden in radiologische beelden, inclusief een inschatting van de onzekerheid.13 Geavanceerde interfaces maken de resultaten inzichtelijk en op een eenvoudige manier toegankelijk. Zorgprofessionals gebruiken deze systemen als een second opinion en corrigeren waar nodig op basis van klinische observaties en patiëntgeschiedenis. Dit verhoogt de nauwkeurigheid en vermindert gemiste afwijkingen.
Met deze systemen worden minder vaak afwijkingen gemist, door een extra laag aan validatie. Dit zal de efficiëntie van de procedure als geheel verbeteren. Bovendien kunnen AI-systemen mogelijk meer en sneller data analyseren dan handmatig mogelijk is, waardoor er in minder tijd meer informatie nauwkeurig verwerkt kan worden. Ook is de feedback van de medische professionals waardevol om het systeem in zijn geheel continu te blijven verbeteren.
Om hybride systemen succesvol te laten zijn, is het belangrijk dat er sprake is van gepast vertrouwen in AI-modellen, en dat artsen voldoende digitale vaardigheden hebben om de uitkomsten via een geschikte interface te interpreteren en modeltypische fouten te herkennen.14
Praktische problemen
Hoewel AI veelbelovend is, kent de implementatie in de gezondheidszorg praktische problemen. Een voorbeeld is Kepler Night Nurse in Nederlandse zorginstellingen, een systeem dat aan de hand van slimme sensoren gevaarlijke situaties tijdig kan herkennen. Volgens CEO Harro Stokman verloopt de toepassing ervan traag omdat de AI-software slimme sensoren vereist die door schaarse monteurs met specialistische kennis geïnstalleerd moeten worden.15 Een vergelijkbare uitdaging zien we bij de implementatie van AI-ondersteunde röntgenanalyse. Hoewel algoritmes steeds beter worden in het detecteren van afwijkingen op röntgenfoto's, vereist de implementatie vaak nieuwe scanners of aanpassingen aan bestaande apparatuur die compatibel zijn met de AI-software. Deze hardware-upgrades zijn kostbaar en tijdrovend. Doorgaans gaat hardwarevervanging veel trager dan software-implementaties. De snelle groei van ChatGPT illustreert het verschil in adoptiesnelheid tussen software en hardware. Integratie van AI in bestaande, vaak verouderde zorgsystemen blijft complex en vereist aanzienlijke investeringen. In de medische sector gaat het vaak om nieuwere hardwaresystemen met innovatieve software waarin AI toegepast kan worden. Maar terwijl software in veel andere sectoren snel op schaal uitgerold wordt, vormt de vaak verouderde IT-infrastructuur in de zorg een uitdaging.
Conclusie
AI-technologie biedt nieuwe kansen voor de gezondheidszorg, met name op het gebied van diagnostiek, monitoring en medicijnontwikkeling. Om deze potentie te realiseren zijn substantiële investeringen nodig, niet alleen in de technologie zelf, maar ook in fundamenteel onderzoek naar de effectieve integratie van AI in de klinische praktijk. Dit onderzoek moet zich richten op het ontwikkelen van betrouwbare en representatieve AI-modellen, het verbeteren van de samenwerking tussen mens en machine, en het waarborgen van zorgkwaliteit. Zorgprofessionals blijven hierbij cruciaal door hun expertise en klinisch inzicht, terwijl AI ondersteuning biedt met geavanceerde data-analyse en patroonherkenning.
Door te investeren in zowel de technologische ontwikkeling als het wetenschappelijk onderzoek kunnen we ervoor zorgen dat AI op een verantwoorde manier bijdraagt aan betere zorg voor alle patiënten. Zoals CPME vicepresident prof. dr. Ray Walley benadrukt, mag de implementatie van AI niet leiden tot desinvestering in andere gebieden van de gezondheidszorg.16 Het succesvol implementeren van AI vereist een langetermijnvisie waarin fundamenteel onderzoek, klinische validatie en implementatiestudies hand in hand gaan met de ontwikkeling van nieuwe AI-toepassingen. De toekomst van de zorg ligt niet in AI alleen, maar in de intelligente combinatie van mens én machine.
Literatuur
- Agema ziet revolutionaire rol voor AI in zorg, praktijk tempert verwachting. NOS Nieuwsuur. https://nos.nl/nieuwsuur/artikel/2541029-agema-ziet-revolutionaire-rol-voor-ai-in-zorg-praktijk-tempert-verwachting, geraadpleegd 20 november 2024.
- Wallace MB, Sharma P, Bhandari P, et al. Impact of artificial intelligence on miss rate of colorectal neoplasia. Gastroenterology. 2022;163(1):295-304.e5. doi:10.1053/j.gastro.2022.03.007 . Medline
- Pati S, Baid U, Edwards B, et al. Federated learning enables big data for rare cancer boundary detection. Nat Commun. 2022;13(1):7346. doi:10.1038/s41467-022-33407-5 . Medline
- Beljaards RC, de Roos KP, Sangers TE. Beeldalgoritmes in de dermatologie. Ned Tijdschr Dermatol Venereol. 2023;33:13-15.
- Overal langs zijn behandeltraject komt de patiënt kunstmatige intelligentie tegen. NRC. 22 februari 2023. www.nrc.nl/nieuws/2023/02/22/overal-langs-zijn-behandeltraject-komt-de-patient-kunstmatige-intelligentie-tegen-a4157687, geraadpleegd 20 november 2024.
- Vaswani A, Shazeer N, Parmar N, et al. Attention is all you need. Adv Neural Inf Process Syst. 2017;30:5998-6008.
- van Melle W. MYCIN: a knowledge-based consultation program for infectious disease diagnosis. Int J Man Mach Stud. 1978;10(3):313-322. doi:10.1016/S0020-7373(78)80049-2 .
- De Belastingdienst/Toeslagen discrimineert een man op grond van ras bij de harde fraudeaanpak in het kader van de kinderopvangtoeslag. College voor de Rechten van de Mens. https://oordelen.mensenrechten.nl/oordeel/2023-103 , geraadpleegd 20 november 2024.
- Fraudeaanpak DUO discriminerend en illegaal. Autoriteit Persoonsgegevens. 2023. www.autoriteitpersoonsgegevens.nl/actueel/fraudeaanpak-duo-discriminerend-en-illegaal , geraadpleegd 20 november 2024.
- Experts waarschuwen voor AI-bias in zorg. SmartHealth. 23 september 2021. https://smarthealth.live/2021/09/23/experts-waarschuwen-voor-ai-bias-in-zorg/ , geraadpleegd 20 november 2024.
- AI kan zijn doel mislopen door gebrek aan context van de patiënt. ICT&health. 21 oktober 2024. https://icthealth.nl/nieuws/ai-kan-zijn-doel-mislopen-door-gebrek-aan-context-van-de-patient , geraadpleegd 20 november 2024.
- Algorithm outperforms radiologists in diagnosing pneumonia. Stanford News. 27 november 2017. https://news.stanford.edu/stories/2017/11/algorithm-outperforms-radiologists-diagnosing-pneumonia , geraadpleegd 20 november 2024.
- De integratie van AI en machine learning in radiologie. Kennisportal. www.kennisportal.com/de-integratie-van-ai-en-machine-learning-in-radiologie , geraadpleegd 20 november 2024.
- Mori Y, Jin EH, Lee D. Enhancing artificial intelligence-doctor collaboration for computer-aided diagnosis in colonoscopy through improved digital literacy. Dig Liver Dis. 2024;56(7):1140-1143. doi:10.1016/j.dld.2023.11.033 . Medline
- 59 Dutch Care Locations Solve Staff Shortages. https://www.linkedin.com/pulse/59-dutch-care-locations-solve-staff-shortages-harro-stokman-hhabe/ , geraadpleegd 20 november 2024.
- European doctors’ recommendations for artificial intelligence to meet the needs of clinical practice . Standing Committee of European Doctors (CPME), 14 november 2024.
Reacties