Introductie Data Science processen, analyse en ethiek

Deze tweedaagse leergang biedt professionals uit verschillende disciplines een stevige basis in verantwoord gebruik van data science-technieken. Aan de hand van het CRISP-DM model (zie voor een korte uitleg hierover dit artikel door Medium) en instrumenten zoals De Ethische Data Assistent (DEDA), Impact Assessment Mensenrechten en Algoritmen (IAMA), worden deelnemers uitgedaagd om complexe data-analyse te benaderen met oog voor ethiek, onzekerheid en maatschappelijke impact. Geen standaard stappenplan, maar een praktische toolkit voor kritische besluitvorming in data science- en AI-projecten.

Wat biedt dit programma?

De deelnemers leren:

  • Inzicht in de ethische risico’s en maatschappelijke gevolgen van data science
  • Werken met CRISP-DM als raamwerk voor het volledige ontwikkelproces van AI
  • Reflecteren op de rol van onzekerheid, dark data en verkeerde aannames
  • Vertalen van wetenschappelijke inzichten naar praktische toepassingen in hun eigen organisatie
  • Technieken selecteren die passen bij specifieke data-uitdagingen
  • Casuïstiek analyseren met impact assessments zoals IAMA en DEDA

Voor wie is de leergang bedoeld?

Deze cursus is bedoeld voor managers, ontwikkelaars, beleidsmakers en (data)wetenschappers die willen leren hoe zij data science verantwoord kunnen inzetten.

Vaste programma-onderdelen

Programma-onderdeel

Beschrijving

Data ethiek I

Introductie op ethische afwegingen met DEDA en IAMA

De anatomie van een antwoord

Omgaan met onzekerheid, missing data en modelvaliditeit

CRISP-DM en het cyclische proces van AI

Structuur in het data science-proces

Verbinding met de praktijk

Reflectie op toepassing binnen eigen organisatie

Uitdagingen in data: technieken

Verkenning van actuele analysetechnieken op maat (zoals time series of missing data)

Keuzemodules (selectie van 2 of 3 modules)

Programma-onderdeel

Beschrijving

Data curation & wrangling

Van ruwe data naar bruikbare datasets

Data ethiek II

Toepassing van IAMA op eigen casus

Concept drift & non-stationarity

technieken om de tijdsdimensie in data science te integreren

Dark Data & Missingness

Onvolledige data herkennen en hanteren

Digital Twins

Technische en ethische implicaties van digital twins

Monitoring ML & evaluatie

Controle op algoritmische besluitvorming

Praktische informatie

  • Duur: 2 dagen (aaneengesloten of met tussenruimte)
  • Locatie: Universiteit Utrecht of in-house
  • Opzet: Modulair en op maat ontwikkeld.
  • Docenten: Iris Muis, Gerko Vink, Stef van Buuren, Georg Krempl, Hakim Qahtan, Laurence Frank.

Neem contact op met: Laurence Frank, coordinator onderwijs voor professionals op coordinator Onderwijs voor Professionals op het gebied van Data Science & AI. E-mail: PE.DSAI@uu.nl

Deze leergang is tot stand gekomen door een samenwerking tussen het Departement Informatica aan de Bètafaculteit, Data School aan de Faculteit Geesteswetenschappen en Methoden en Statistiek aan de Faculteit Sociale Wetenschappen.