14.2 C
Alba Iulia
woensdag, oktober 28, 2020
No menu items!

Data Science & Overheid

Verslag van de webinar georganiseerd vanuit JADS. Onderwerp: ‘Data Science & Overheid – Unraveling the complexity of casuistry with help of public sector data’.

John Goedee en Jurgen van der Jagt voerden het woord.

John Goedee begon met het schetsen van de context voor deze webinar. Hij lichtte kort toe dat de context van de webinar ging over een wereldwijd probleem namelijk: huiselijk geweld en kindermishandeling. Deze casus loopt sinds 2015 en raakt het hele publieke domein.

Eerst werd er gekeken naar de data achter dit soort casussen. Dit bestaat uit drie verschillende stappen:

  • Informatie verzamelen, binnen de informatie verzameling zijn er drie typen data:
    – Statische informatie, informatie of data die je mag delen (bijv. NAW gegevens).
    – Dynamische informatie, wat is er nou eigenlijk aan de hand (in bijvoorbeeld dat gezin).
    – Excepties, wat kun je verwachten (bijvoorbeeld als je naar dat gezin toegaat).
  • Informatie analyseren, om een gezamenlijk beeld van de aard en omvang van de thematiek neer te zetten. Dit is erg belangrijk.
  • Transparantie in operatie, om op een operationeel, tactisch en strategisch niveau duidelijk te krijgen wat er is.

De probleemstelling die hier werd beantwoord was als volgt: ‘Hoe krijg je grip op complexe casuïstiek?’ Volgens John was er maar een manier om dit te doen namelijk patronen herkennen die in die casuïstiek afspeelt en dat vervolgens visualiseren.

Ook behandelde hij onderstaand figuur daarbij, dit was een goede eerste stap om grip te krijgen op complexe casuïstiek.

Verloop complete casuïstiek
Aan de hand hiervan maakte hij de overgang naar hoe hij dit grip krijgen op complexe casuïstiek zelf aanpakte in het onderzoek. Dit werd volledig handmatig gedaan. Dit kostte ontzettend veel werk doordat er veel documentatie was en honderden stukken aan data. Om dit in perspectief te zetten gaf hij ons een voorbeeld (zie voorbeeld hieronder) van hoe een cliënt map eruit zag waar zij wel twee weken mee bezig waren. Vanuit daar kwam John met zijn vraag bij Jurgen van der Jagt terecht of hij een oplossing kon bedenken om de data te structureren.

Client map
Client map, visualisatie van wat er in zo een gezin gebeurt (waar huiselijk geweld en/of kindermishandeling plaatsvind) en wie hierbij zijn betrokken.
 ‘Hoe wordt de privacy gewaarborgd in deze aanpak met het vergaren van data?’

John antwoordde hierop dat er vijf strenge voorwaarden zijn waar een complex casuïstiek project aan moet voldoen voordat zij data mogen vergaren of delen (in een kernteam die casuïstiek behandelen). Deze vijf voorwaarden zijn als volgt:

  1. Er moet een gezamenlijk doel zijn.
  2. Deelnemers moeten formeel door hun organisatie zijn afgevaardigd om deel te nemen aan een traject.
  3. Er moet van te voren helder zijn hoe de data wordt geregistreerd, vast gelegd of opgeslagen.
  4. Als er een medisch- of advocaten dossier is moet er rekening mee gehouden worden dat je bijvoorbeeld: wel mag weten dat iemand in behandeling is van een arts, maar dat je niet mag weten welke medicijnen hij of zij slikt of dat je wel mag weten dat iemand wordt verdedigd door een advocaat, maar niet waarvoor.
  5. Als een systeem, gezin of omgeving in gevaar is dan moet je informatie delen.

Naast deze vijf voorwaarden is het ook belangrijk dat er op drie niveaus wordt gesproken als je zo een traject op zet. Dit is met de bestuurders (gemeente, aanleverende instelling, etc), beleidsmatig (hoe gaan we die data verzamelen?) en operationeel (welke data gaan we verzamelen met welk doel?).

Door deze vijf strenge voorwaarden en communicatie op drie niveaus wordt de privacy goed gewaarborgd en kan de data gewoon gedeeld worden zonder deze privacy te schenden.

Jurgen begon zijn verhaal met de uitleg van een clientmap. “De clientmap is een weergave van het verloop van de casus van één of meer personen binnen een bepaalde tijdspanne. Met als doel de opdrachtgever een data gedreven inzicht te geven in het proces en activiteiten die plaatsvinden binnen deze periode om zo de kwaliteit en effectiviteit in kaart te brengen” (van der Jagt, J. 2020). De verkorte uitleg is: in kaart brengen wat er in de loop van zo een complexe casus heeft plaatsgevonden. Wie heeft met elkaar contact gehad, wanneer heeft dit contact plaatsgevonden, waarover is dit contact geweest en wat is de intensiteit van het contact geweest.

Om dat te kunnen automatiseren is het belangrijk om eerst alle ongestructureerde data die bij klanten wordt opgehaald te structureren. Uiteindelijk kan er dan vanuit de gestructureerde data gebouwd worden zodat er relationele data (betekenisvolle data) ontstaat.

Om dit te kunnen bereiken heeft Jurgen van der Jagt met zijn bedrijf een tool ontwikkeld. Deze tool bevat onder andere de INKIS Research Module. Het begint bij de documenten. Deze worden bij de klanten opgehaald en moeten verwerkt worden, dit doen zij in de research module. Belangrijke onderdelen/vereisten voor deze research module:

  • Tijdswinst.
  • Ondersteunend, de data moet ondersteunend zijn aan het hele proces.
  • Privacy (data masking).
  • Classificeren, de data wegen om de juiste conclusie aan de data te kunnen geven.

Doel is om informatie te halen uit alle data die erin wordt gestopt.

Naast de INKIS Research Module bestaat de tool ook uit de Regex (regular expression analyzer). Regular expression is een expressie over hoe je in data patronen kunt herkennen en in data kunt zoeken. Met de regular expressions kun je verschillende tekstuele documenten analyseren en daar de juiste data uithalen.

 

Netwerk animatie client map
 

 

Auteur: Anouk Verhagen

LAAT EEN REACTIE ACHTER

Vul alstublieft uw commentaar in!
Vul hier uw naam in