5 december 2021

SDB

dagelijks nieuws en blogs

De Belastingdienst heeft jarenlang specifiek burgers met een laag inkomen geselecteerd voor extra controle op fraude

belasting

Om toeslagen te controleren op fouten en fraude gebruikte de Belastingdienst een zelflerend algoritme. Dat selecteerde vooral lage inkomens voor controle.

De Belastingdienst heeft jarenlang specifiek burgers met een laag inkomen geselecteerd voor extra controle op fraude met de kinderopvangtoeslag. Hogere inkomens werden juist bewust ontzien. Dat erkent de Belastingdienst in antwoorden op vragen van Trouw en RTL Nieuws over het zogeheten risicoclassificatiemodel van Toeslagen.

Het risicoclassificatiemodel werd vanaf april 2013 gebruikt om te bepalen welke aanvragen voor toeslagen extra controle zouden krijgen. In juli vorig jaar werd het uit de lucht gehaald, na een kritisch rapport van consultancybureau KPMG. Het gaat om een zelflerend algoritme, dat zelfstandig bepaalt welke indicatoren erop zouden kunnen wijzen dat bepaalde aanvragen voor toeslagen een verhoogde kans op fouten of fraude kennen. Alle aanvragen krijgen aan de hand van die indicatoren een zogeheten risicoscore toebedeeld. De aanvragen met de hoogste risicoscore worden vervolgens extra gecontroleerd.

Elf keer zoveel

De Belastingdienst erkent dat ‘in ieder geval sinds maart 2016′ het inkomen van mensen ‘met variabele grenswaarden’ werd gebruikt. In de praktijk betekent dit dat lage inkomens een hogere risicoscore kregen, hogere inkomens kregen juist een lagere risicoscore. Volgens de Belastingdienst bleek er ‘een statistisch verband tussen de hoogte van het inkomen en de kans op een (on)juiste aanvraag’.

De fiscus stelt dat het inkomen maar een klein gewicht had in de risicoselectie voor de kinderopvangtoeslag, omdat de hoogte van de toeslag vooral afhangt van het aantal kinderen dat naar de opvang gaat. Welke indicatoren precies gebruikt werden om de risicoscore te bepalen, en met welk gewicht, wil de Belastingdienst niet zeggen omdat het toezicht vertrouwelijk zou zijn.

In de praktijk bleek het model toch vooral lagere inkomens de hoogste risicoscore te geven, zo blijkt uit documenten die eerder zijn vrijgegeven. Van de duizend hoogste risicoscores had 82,3 procent een huishoudinkomen van minder dan 20.000 euro per jaar. Dat is ruim 11 keer zoveel als het gemiddelde: van alle aanvragen had slechts 7,3 procent een huishoudinkomen van minder dan 20.000 euro.

Alarmbellen

Experts op het gebied van verantwoorde toepassing van zelflerende algoritmes reageren ontzet op die uitkomst. “Hoe het model precies werkt, is op basis van openbare informatie niet na te gaan. Maar als de uitkomst zo inzoomt op een specifieke groep, in dit geval lage inkomens, dan moeten er alarmbellen afgaan bij de ambtenaren die met die modellen werken”, reageert Cynthia Liem, universitair hoofddocent op het gebied van Kunstmatige Intelligentie aan de Technische Universiteit Delft.

Volgens Liem wijst de enorme oververtegenwoordiging van lage inkomens op zogeheten selectiebias in het model. Kort gezegd: als het model vermoedt dat bij lagere inkomens meer kans is op fraude, worden vooral die aanvragen gecontroleerd. Dat leidt ertoe dat vooral aanvragen van lage inkomens worden gecorrigeerd. Omdat het model weer getraind wordt met die uitkomsten, wordt er steeds verder ingezoomd op lage inkomens.

Selectiebias

“Iedereen die iets weet van risicoselectie weet dat je alert moet zijn op selectiebias”, zegt Liem. Bijvoorbeeld door ook aselect aanvragen te controleren. Maar dat gebeurde niet bij Toeslagen, zo blijkt uit een zelfonderzoek van het model uit maart van dit jaar dat de Belastingdienst ter inzage gaf aan Trouw en RTL Nieuws. “Wij onderzoeken alleen de hoge scores en er is geen toezichtproces dat ook andere kenmerken onderzoekt”, schrijft de dienst over het risico dat er sprake is van selectiebias.

Eerder bleek al uit onderzoek van Trouw en RTL Nieuws dat de Belastingdienst ook een indicator gebruikte om te selecteren op het al dan niet hebben van de Nederlandse nationaliteit. Naar aanleiding van kritische rapporten over het gebruik daarvan door de Autoriteit Persoonsgegevens en Amnesty International, heeft Tweede Kamerlid Renske Leijten (SP) eind oktober al verzocht om het model openbaar te maken. Staatssecretaris Alexandra van Huffelen (Toeslagen) wil dat pas doen als ‘een zorgvuldige inhoudelijke reactie’ is voorbereid. Die zou eind volgende week naar de Tweede Kamer gaan, zo liet zij weten.

SDB is al meer dan 10 jaar vrij, eerlijk en onafhankelijk. Geen miljardair bezit ons, geen adverteerders controleren ons. Wij zijn een door lezers ondersteunde non-profitorganisatie. In tegenstelling tot veel andere publicaties, houden we onze inhoud gratis voor lezers, ongeacht waar ze wonen of het zich kunnen veroorloven om te betalen.

We hebben geen paywalls en alles blijft gratis zonder censuur. In het post-truth-tijdperk van nepnieuws, echokamers en filterbubbels publiceren we meerdere perspectieven van over de hele wereld.

Iedereen kan bij ons publiceren, maar iedereen doorloopt een rigoureus redactioneel proces. U krijgt dus op feiten gecontroleerde, goed gemotiveerde inhoud in plaats van ruis.

Dit is niet goedkoop. Servers, redacteuren fees en web ontwikkelaars kosten geld. Overweeg alstublieft om ons te steunen als donateur of ondersteunend lid, ook wij hebben onze inkomsten zien dalen in deze heftige tijden daarom, KLIK HIER voor IBAN of via PayPal hieronder!, hartelijke dank en veel leesplezier.

Steun SDB via PayPal veilig en simpel.