Belgische Textgain ontwikkelt LLM om haatspraak te detecteren

Beschikbaar in alle Europese talen

Belgische Textgain ontwikkelt LLM om haatspraak te detecteren

In België wordt aan het eerste AI-model gebouwd die online haatspraak kan detecteren in alle officiële Europese talen. Het resultaat wordt verwacht in de zomer van 2025.

Textgain ontwikkelt AI die maatschappelijke problemen in kaart brengen en bijdragen aan de oplossing voor deze problemen. Het LLM CaLICO zal daar het resultaat van zijn. CaLICO gaat online haatspraak detecteren in alle officiële Europese talen.

Geen bekende LLM’s hergebruiken

De ontwikkeling van het taalmodel vindt plaats in de komende twaalf maanden, in België. Textgain is namelijk een spin-off van de Universiteit Antwerpen.

Deze verbondenheid is volgens Textgain-CEO Guy De Pauw de reden dat het bedrijf kan ontwikkelen voor dergelijke maatschappelijke problemen. “Grote taalmodellen, zeker de commerciële, weigeren om toxische taal te verwerken. Daardoor is het zo goed als onmogelijk om ze in te zetten om bijvoorbeeld haatspraak te verwerken. Wij bouwen nu from scratch een eigen taalmodel dat dit soort content wél kan verwerken, maar niet zelf produceert.” Hierin ligt ook onmiddellijk de reden waarom Textgain een eigen LLM ontwikkelt en geen producten bouwt met bijvoorbeeld het model van OpenAI of Google.

Guy De Pauw, CEO van Textgain.

Haatspraak als online probleem

Hoewel commerciële bedrijven volgens De Pauw geen interesse tonen in het bestrijden van haatspraak, is er wel reden om dit slimmer en beter tegen te gaan. Online platformen zijn binnen Europa namelijk verplicht de verspreiding van haatspraak zo goed en zo snel mogelijk weg te werken. Deze regels werden opgenomen in de Digital Services Act. Een model als CaLICO kan deze platformen ondersteunen in de naleving van dergelijke wetgeving.