Expertisepunt Open Overheid

Over welke data beschikt de overheid? Vanuit het oogpunt van transparantie ligt het voor de hand dat de overheid inzichtelijk maakt over welke gegevens zij beschikt, en een dergelijk overzicht, het dataportfolio of dataregister, komt ook van pas bij het organiseren van het beheer van deze data.

Transparantie is niet de enige reden om inzichtelijk te maken welke data de overheid heeft. Vanuit meerdere invalshoeken ontstaat de behoefte om regie op data te voeren. Naast transparantie gaat het ook om de bescherming van persoonsgegevens (op grond van art. 30 van de AVG moeten persoonsgegevens worden geanalyseerd), het sturen op datakwaliteit en het optimaliseren van processen bij de overheid. De volgende figuur, de Doelenboom Dataportfoliomanagement, is opgesteld bij het bespreken van het onderzoeksrapport binnen OCW en vat deze doelen samen:

Model

Het dataportfolio is dus een overzicht van aanwezige data dat tegelijkertijd meerdere doelen bedient. Om meerdere doelen te kunnen bedienen, vormt het dataportfolio een overzicht van de aanwezige data dat niet alleen voor specialisten begrijpelijk is, maar ook voor generalisten en eventueel geïnteresseerde burgers.

In opdracht van OCW deden VKA en Berenschot onderzoek naar het beheer en de vormgeving van dit dataportfolio bij OCW, en rondden dit af met dit rapport en een eerste, voorlopig dataportfolio voor OCW dat moet worden gezien als ‘werk in uitvoering’. VKA en Berenschot maakten het dataportfolio van OCW inzichtelijk door dataverzamelingen te ordenen naar actoren, wettelijke taken en kerngegevens. Daarmee legden ze ook een link naar andere overzichten: architectuurmodellen (kaders) en gegevenswoordenboeken. Deze laatste zijn nuttig om de betekenis van gegevens op detailniveau vast te leggen (het gegevenswoordenboek van DUO kent ruim 1000 begrippen), terwijl het dataportfolio vooral een helicopterview biedt.

Voor open data en transparantie betekent het dataportfolio dat data inzichtelijk zijn op het niveau waarop besluiten over openbaarheid worden genomen. Voor de problematiek rond persoonsgegevens en open data betekent de clustering van dataverzamelingen rondom kernbegrippen dat afspraken over anonimiseren in samenhang kunnen worden gemaakt. Hiermee wordt voorkomen dat natuurlijke personen kunnen worden herkend door het combineren van verschillende, geanonimiseerde datasets.

Het volledig rapport is hier te downloaden Rapport_dataportfoliomanagement_OCW_