Guardrails voor Nederlandse Generatieve AI-modellen

In dit project ontwikkelen wij Nederlandstalige AI-vangrails om de veiligheid en betrouwbaarheid van taalmodellen te garanderen en zo onze digitale soevereiniteit te versterken. Dit project is nog ontwikkeling.

‍

Diensten

Sector

Publieke sector

Uitdaging van klant

De uitdaging

Taalmodellen spreken steeds beter Nederlands, maar hun veiligheidsmechanismen zijn vrijwel allemaal afgesteld op het Engels. Dat levert in de praktijk duidelijke problemen op. Bedrijven, overheden en kennisinstellingen gebruiken zogeheten vangrails en content filters om AI verantwoord in te zetten. Deze bepalen wat gebruikers met het taalmodel kunnen doen en voorkomen bijvoorbeeld dat persoonsgegevens onnodig worden gedeeld.

Omdat deze filters minder geoptimaliseerd zijn voor ons taalgebied, presteren ze simpelweg slechter. Typisch Nederlandse persoonsgegevens, zoals een BSN of een lokaal adres, blijven daardoor soms onbedoeld zichtbaar. Ook glippen schadelijke situaties, wanneer deze in het Nederlands worden beschreven, er ongemerkt doorheen. Tegelijkertijd gebeurt het regelmatig dat een doodnormale Nederlandse zin juist onterecht wordt geblokkeerd.

Wij geloven in digitale autonomie. Het zou niet zo moeten zijn dat een buitenlands techbedrijf bepaalt wat in jouw specifieke context veilig of acceptabel is. Dat is een taak voor de mensen en domeinexperts die er dagelijks mee werken.

Om die transitie naar digitale autonomie aan te jagen, is een aantal weken geleden ons nieuwe project officieel toegekend. Samen met Algorithm Audit, de Rechtspraak en de Universiteit Leiden gaan we open-source vangrails ontwikkelen die specifiek zijn gericht op de Nederlandse taal en cultuur.

Dit project is mede mogelijk gemaakt door het SIDN fonds en Digital Holland

‍

Taalmodellen spreken steeds beter Nederlands, maar hun veiligheidsmechanismen zijn vrijwel allemaal afgesteld op het Engels. Dat levert in de praktijk duidelijke problemen op. Bedrijven, overheden en kennisinstellingen gebruiken zogeheten vangrails en content filters om AI verantwoord in te zetten. Deze bepalen wat gebruikers met het taalmodel kunnen doen en voorkomen bijvoorbeeld dat persoonsgegevens onnodig worden gedeeld.

Omdat deze filters minder geoptimaliseerd zijn voor ons taalgebied, presteren ze simpelweg slechter. Typisch Nederlandse persoonsgegevens, zoals een BSN of een lokaal adres, blijven daardoor soms onbedoeld zichtbaar. Ook glippen schadelijke situaties, wanneer deze in het Nederlands worden beschreven, er ongemerkt doorheen. Tegelijkertijd gebeurt het regelmatig dat een doodnormale Nederlandse zin juist onterecht wordt geblokkeerd.

Wij geloven in digitale autonomie. Het zou niet zo moeten zijn dat een buitenlands techbedrijf bepaalt wat in jouw specifieke context veilig of acceptabel is. Dat is een taak voor de mensen en domeinexperts die er dagelijks mee werken.

Om die transitie naar digitale autonomie aan te jagen, is een aantal weken geleden ons nieuwe project officieel toegekend. Samen met Algorithm Audit, de Rechtspraak en de Universiteit Leiden gaan we open-source vangrails ontwikkelen die specifiek zijn gericht op de Nederlandse taal en cultuur.

Dit project is mede mogelijk gemaakt door het SIDN fonds en Digital Holland

‍

Contact us

Deel je vraag!

Guardrails voor Nederlandse Generatieve AI-modellen

Uitdaging van klant

De uitdaging

De uitdaging

Impact

AI-oplossingen waar jevrolijk van wordt