Anonimiseren van ongestructureerde data - KPMG Nederland
close
Share with your friends

Hoe anonimiseer je terabytes aan ongestructureerde data?

Anonimiseren van ongestructureerde data

Persoonsgegevens anonimiseren in ongestructureerde data is een lastige taak vooral als het om terabytes aan data gaat. Hoe kun je dit slim aanpakken?

Gerelateerde content

Data

​Met het ingaan van de nieuwe GDPR-wetgeving op 25 mei, wordt beoogd de  beveiliging van persoonsgegevens in de EU te verbeteren. Zo zijn bedrijven verplicht om zich te houden aan de GDPR, wanneer er persoonsgegevens worden  verwerkt. Deze GDPR-wetgeving brengt een hoop extra werk met zich mee voor grote  bedrijven. Laten we in het specifiek inzoomen op de regelgeving dat  persoonsgegevens voldoende moeten worden beveiligd. Stel je voor: jouw bedrijf  is verwikkeld in een juridische procedure buiten de EU. De rechter beslist in deze procedure dat er grote hoeveelheden gegevens, waaronder e-mailcommunicatie  en interne brondocumenten, moeten worden aangeleverd ter onderbouwing van de  positie van jouw bedrijf. Gegarandeerd dat deze gegevens persoonsgegevens  zullen bevatten. Aangezien in een dergelijke situatie de persoonsgegevens de EU1 verlaten, mogen deze gegevens niet worden verstuurd zonder  toestemming van de betreffende personen. Het feit dat het in een dergelijke situatie gaat om ongestructureerde data (data die geen specifieke opmaak volgt, zoals pdf-documenten, Word-bestanden, e-mails en plaatjes.) maakt het lastig maakt om alle persoonsgegevens even snel te verwijderen. Het lastige van ongestructureerde data is namelijk dat je over het algemeen niet weet welke  persoonsgegevens de data bevat en waar deze persoonsgegevens zich exact  bevinden. De vraag die in dit soort situaties opkomt is: Hoe anonimiseer je op efficiënte wijze grote hoeveelheden ongestructureerde data?

Het vinden van persoonsgegevens
Nu is alle ongestructureerde data handmatig doorzoeken op persoonsgegevens  een mogelijkheid, echter dit is een tijdrovende klus en foutgevoelige klus, vooral omdat het bijna altijd om grote hoeveelheden data gaat. Een manier om dit slimmer aan te pakken is door eDiscovery tools te gebruiken die de ongestructureerde data kan verwerken en doorzoeken. Met behulp van zo'n eDiscovery tool kun je snel en automatisch alle documenten doorzoeken op  bepaalde zoekwoorden die in verband staan met persoonsgegevens. Hierbij kun je denken aan burgerservicenummers of telefoonnummers. De documenten kunnen dan worden beoordeeld of deze daadwerkelijk persoonlijke informatie bevatten welke vervolgens onleesbaar kan worden gemaakt. Daarnaast kijken wij als KPMG samen met de klant naar documenten die eventueel in hun geheel kunnen worden uitgesloten, omdat deze volledig bestaan uit persoonsgegevens; denk hierbij aan een persoonlijk e-mail over een doktersbezoek. Naast specifieke zoektermen kan er ook op een andere manier worden gezocht naar persoonsgegevens. Neem bijvoorbeeld een telefoonnummer, deze nummers volgen altijd een specifieke opmaak, namelijk tien cijfers met of zonder een landcode. Een ander voorbeeld zijn e-mailadressen: deze zijn altijd zonder spaties geschreven en hebben slechts één apenstaartje (@) en een extensie gescheiden door een punt (bijvoorbeeld .nl of .com). Doordat bepaalde persoonsgegevens steeds een specifiek patroon volgen kan er ook aan de hand van verschillende patronen worden gezocht naar persoonsgegevens. Op deze manieren kunnen persoonsgegevens automatisch en snel worden gevonden in de data zonder dat alle documenten handmatig doorzocht hoeven te worden. 

Onleesbaar maken van persoonsgegevens
KPMG helpt klanten door met de hierboven genoemde technieken persoonsgegevens op te sporen in ongestructureerde data en deze vervolgens onleesbaar te maken. In het geval van ongestructureerde data is het uitzwarten van persoonsgegevens de meest praktische oplossing. Door alle eerder geïdentificeerde  persoonsgegevens samen te voegen tot een lijst, kunnen aan de hand van deze lijst automatisch alle persoonsgegevens worden uitgezwart. Na het uitzwarten van de persoonsgegevens en het uitsluiten van specifieke documenten kunnen deze verstuurd worden zonder eventuele risico's op het overtreden van de  GDPR-wetgeving. Zo is er op een slimme manier rekening gehouden met de GDPR-wetgeving en een hoop tijd bespaard door automatisch alle data te doorzoeken naar persoonsgegevens!

Neem voor meer informatie contact op met Chris Hoekmeijer, (020) 656 8549.

Neem contact met ons op

 

Wilt u een offerte van ons ontvangen?

 

Offerteaanvraag (RFP)