Deel je vraag!

Of je nu al precies weet wat je zoekt of nog geen idee hebt: we denken graag met je mee.

We gaan ermee aan de slag!
Oeps! Er is iets misgegaan tijdens het versturen.
Lange Viestraat 2b, 3511BK Utrecht,
The Netherlands

Guardrails voor Nederlandse Generatieve AI-modellen

In dit project ontwikkelen wij Nederlandstalige AI-vangrails om de veiligheid en betrouwbaarheid van taalmodellen te garanderen en zo onze digitale soevereiniteit te versterken. Dit project is nog ontwikkeling.

Diensten

Strategie
Kennis
Innovatie

Sector

Publieke sector

Uitdaging van klant

De uitdaging

De uitdaging

Taalmodellen spreken steeds beter Nederlands, maar hun veiligheidsmechanismen zijn vrijwel allemaal afgesteld op het Engels. Dat levert in de praktijk duidelijke problemen op. Bedrijven, overheden en kennisinstellingen gebruiken zogeheten vangrails en content filters om AI verantwoord in te zetten. Deze bepalen wat gebruikers met het taalmodel kunnen doen en voorkomen bijvoorbeeld dat persoonsgegevens onnodig worden gedeeld.

Omdat deze filters minder geoptimaliseerd zijn voor ons taalgebied, presteren ze simpelweg slechter. Typisch Nederlandse persoonsgegevens, zoals een BSN of een lokaal adres, blijven daardoor soms onbedoeld zichtbaar. Ook glippen schadelijke situaties, wanneer deze in het Nederlands worden beschreven, er ongemerkt doorheen. Tegelijkertijd gebeurt het regelmatig dat een doodnormale Nederlandse zin juist onterecht wordt geblokkeerd.

Wij geloven in digitale autonomie. Het zou niet zo moeten zijn dat een buitenlands techbedrijf bepaalt wat in jouw specifieke context veilig of acceptabel is. Dat is een taak voor de mensen en domeinexperts die er dagelijks mee werken.

Om die transitie naar digitale autonomie aan te jagen, is een aantal weken geleden ons nieuwe project officieel toegekend. Samen met Algorithm Audit, de Rechtspraak en de Universiteit Leiden gaan we open-source vangrails ontwikkelen die specifiek zijn gericht op de Nederlandse taal en cultuur.

Dit project is mede mogelijk gemaakt door het SIDN fonds en Digital Holland

Taalmodellen spreken steeds beter Nederlands, maar hun veiligheidsmechanismen zijn vrijwel allemaal afgesteld op het Engels. Dat levert in de praktijk duidelijke problemen op. Bedrijven, overheden en kennisinstellingen gebruiken zogeheten vangrails en content filters om AI verantwoord in te zetten. Deze bepalen wat gebruikers met het taalmodel kunnen doen en voorkomen bijvoorbeeld dat persoonsgegevens onnodig worden gedeeld.

Omdat deze filters minder geoptimaliseerd zijn voor ons taalgebied, presteren ze simpelweg slechter. Typisch Nederlandse persoonsgegevens, zoals een BSN of een lokaal adres, blijven daardoor soms onbedoeld zichtbaar. Ook glippen schadelijke situaties, wanneer deze in het Nederlands worden beschreven, er ongemerkt doorheen. Tegelijkertijd gebeurt het regelmatig dat een doodnormale Nederlandse zin juist onterecht wordt geblokkeerd.

Wij geloven in digitale autonomie. Het zou niet zo moeten zijn dat een buitenlands techbedrijf bepaalt wat in jouw specifieke context veilig of acceptabel is. Dat is een taak voor de mensen en domeinexperts die er dagelijks mee werken.

Om die transitie naar digitale autonomie aan te jagen, is een aantal weken geleden ons nieuwe project officieel toegekend. Samen met Algorithm Audit, de Rechtspraak en de Universiteit Leiden gaan we open-source vangrails ontwikkelen die specifiek zijn gericht op de Nederlandse taal en cultuur.

Dit project is mede mogelijk gemaakt door het SIDN fonds en Digital Holland

Contact us

Stap 1

Stap 2

Stap 3

Stap 4

Stap 5

Impact

Dit project zal resulteren in open source code die gebruikt kan worden om AI-modellen verantwoord in te zetten.

De vangrails die het consortium ontwikkelt, komen kosteloos beschikbaar voor publieke en private organisaties. Zij kunnen hiermee hun eigen generatieve AI-toepassingen betrouwbaar evalueren. Gebruikers krijgen de mogelijkheid om een open-source referentie-dataset zelf aan te passen aan hun specifieke context en use case. Bovendien worden de vangrails zo ontworpen dat ze flexibel en gemakkelijk binnen verschillende tech stacks te gebruiken zijn, of dit nu in de cloud is of on-premise.

Contact