Twe politie korpsen houden zich niet aan de wer voor de bescherming van persoonsgegevens door kentekengegevens van niet-verdachten te bewaren. Toen ze hier op werden aangesproken was de reactie dat ze zich best aan de wet willen houden, als die maar aan hun eisen wordt aangepast. Dit onder het mott van “u bent nu nog wel geen crimineel, maar wie weet wat de toekomst brengt”. Alsof een inbreker voor de rechter zegt dat zijn inbraken zo ontzettend nuttig zijn omdat hij zo misschien wel eens een moordenaar op het spoor kan komen, dat hij zich voortaan best aan de wet wil houden zolang inbreken maar legaal wordt.
Dit beperkt zich trouwens niet tot Nederland. De politie in Engeland is al meerdere malen in opspraak gekomen o.a. door het blijven bewaren van DNA materiaal van mensen die nergens verdacht van worden. Voor de politie blijft iedereen nu eenmaal een potentieel misdadiger en hoe meer ze van ons weten, hoe sneller ze een verdachte kunnen vinden bij een nieuwe misdaad. Niet erg vindt je misschien, maar de kans op fouten en slordigheden neemt drastisch toe hoe meer data er wordt verzameld.
Want bij de productie van data kunnen altijd fouten worden gemaakt, bij het vastleggen ervan meer fouten en dan praten we nog geeneens over de interpretatie ervan. Geloof me, ik verdien de kost als software test consultant, werk veel met grote databases en dataverzamelingen en weet dus hoe snel er fouten in kunnen slopen, ook als iedereen zijn stinkende best doet ze te voorkomen. Voor een organisatie als bv. het UWV is de betrouwbaarheid van data van cruciaal belang omdat ze het nodig hebben voor de dagelijkse bedrijfsvoering — stuur de verkeerde brief naar de verkeerde mensen en het UWV staat op de voorpagina van de Telegraaf.
Maar in een politie database wordt het merendeel van de data alleen getoets op hefeit of het overeenkomt met een nieuw gevonden stukje data, niet op correctheid. Een kenteken wordt gereigstreerd en opgeslagen, maar wat wordt er daarna mee gedaan? Voor de politie is het alleen interessant als het overeenkomt met een kenteken waar ze naar op zoek zijn. Maar dan is het al te laat om vast te stellen of dit kenteken wel goed was vastgesteld en of alle bijbehorende gegevens wel correct waren… En kentekens zijn nog relatief eenvoudig; meer complexe data zal sneller valse positieve overeenkomsten vertonen, ook voor zogenaamde unique kenmerken als vingerafdrukken of DNA…
Het wordt nog erger als je op zoek gaat naar verbanden en connecties in je database. Dat is bv. de reden waarom de overheid zo gebrand is op het kunnen raadplegen van gespreksgegevens en internetgedrag –het gaat niet om wie er wat zegt, maar met wie ze praten. Door de gesprekken van een verdachte na te gaan kan de politie zo eventuele andere bendeleden op het spoor komen, puur door analyse van met wie de verdachte belt, hoe en wanneer. Deze data verzamelen is makkelijk, maar de verbanden leggen en vooral correct uitleggen is veel moeilijker en foutgevoeliger, zeker aan de randen van een netwerk waar het juist interessant wordt. Denk aan hoe een organisatie als de mafia in elkaar zit, waar als je een verdachte hebt, deze waarschijnlijk een aantal vaste bendeleden heeft waar hij of zij veel mee belt, maar als je het hele netwerk in kaart wilt brengen juist de mensen met wie ze af en toe contact hebben interessant zijn, want die kunnen weer leiden naar andere bendes. Maar hoe zie je het verschil tussen zo’n bendelid en iemand die compleet toevallig aan het opsporingsprofiel voldoet, voor compleet onschuldige redenen? Alleen door zo iemand ook onder observatie te nemen en zo kan het onderzoek zich als een olievlek uitbreiden, met alle gevolgen vandien.
Daarom is het belangrijk dat de politiek goed nadenkt over hoeveel en welke data de politie mag verzamelen en behandelen. De politie zelf zal altijd zeggen dat ze meer data nodig hebben en argumenteren dat de voordelen tegen de bijwerkingen opwegen.