Mysterie van de dag: waarom vindt een automatisch vertaalsysteem soms nieuwe woorden uit?

Lieve Macken Vertaalwetenschapper UGent

Vertaalwetenschapper UGent 18-07-2019, 07:21 Bijgewerkt op: 21-01-2021, 07:53

De kwaliteit van automatische vertaalsystemen zoals Google Translate of DeepL is de laatste jaren enorm verbeterd. Maar af en toe creëert zo’n systeem nieuwe woorden zoals bekinnen, klotterend of zetmeelarchitect. Hoe komt dat?

Een automatisch vertaalsysteem is datagebaseerd. Aan de hand van enorm veel voorbeeldvertalingen leert zo’n systeem hoe het moet vertalen. Om eender welke tekst over eender welk onderwerp te kunnen vertalen heb je echter een quasi oneindige lijst van woorden nodig. En daar zit nu het probleem. Automatische vertaalsystemen zijn beperkt in het aantal woorden dat ze kunnen coderen. Daarom werken ze met eenheden die kleiner zijn dan woorden, `subwoorden’ zeg maar. Dat heeft veel voordelen. Door te werken met subwoorden weet een automatisch vertaalsysteem dat laugh, laughing, laughed, laughter allemaal gerelateerde woorden zijn.

Een automatisch vertaalsysteem leert die subwoorden op basis van frequentie. Vaak voorkomende karaktersequenties onder het woordniveau vormen telkens een subwoord. Een automatisch vertaalsysteem vertaalt dus niet enkel op basis van woorden maar ook op basis van subwoorden. Heel vaak gaat het goed, maar af en toe gaat het mis en dan krijg je als lezer heel vreemde woorden voorgeschoteld zoals bekinnen voor pelvic fins (pelvic = bekken + fins = vinnen).

Een ander voordeel van het werken met subwoorden is dat een automatisch vertaalsysteem ook woorden die het zelf nooit heeft geleerd, zoals bijvoorbeeld neologismen, of foutief gespelde woorden, kan vertalen. Neologismen zijn nieuwe woorden in een taal. Een voorbeeld van een neologisme is starchitect, een nieuw Engels woord voor een gerenomeerde of beroemde architect, dat door DeepL vertaald werd aan de hand van subwoorden als zetmeelarchitect (starch = zetmeel + architect = architect).

Mensen zijn echter niet altijd in staat om te begrijpen wat de automatische vertaalmachine nu precies bedoelt met die nieuwe creaties. Onderzoek heeft aangetoond dat in 60% van de gevallen lezers die nieuw uitgevonden woorden niet begrijpen, alhoewel ze soms zelf van het tegendeel overtuigd zijn.

Mysterie van de dag

Mysterie van de dag: waarom vliegt een zwaluw lager bij slecht weer?

Waarom geloven mensen de meest waanzinnige complottheorieën?

Waarom bestaat er geen geneesmiddel of vaccin tegen een verkoudheid?

Waarom hitte ons agressiever maakt

Mysterie van de dag: Waarom zijn er oneindig veel priemgetallen?

Lees alle artikelen over Mysterie van de dag

Fout opgemerkt of meer nieuws? Meld het hier

Deel dit artikel:

Partner Content

Meest gelezen

Obesitaschirurg Yves Van Nieuwenhove over de afslankrevolutie: ‘Je hebt nog altijd het recht om dik te zijn’

Apache-journalist over Chinese contacten Filip Dewinter: ‘Een blamage voor de deontologische commissie van het Vlaams Parlement’

Marc Van Ranst en Dominique Willaert: ‘We mogen de Go Back-bus van Filip Dewinter toch nog racistisch vinden?

Oud-president Nicolas Sarkozy over de Oekraïne-oorlog: ‘Deze crisis heeft al te lang geduurd. We dansen op de rand van de vulkaan’

Datawetenschapper Hannah Ritchie: ‘De magnetron is de meest efficiënte manier om te koken'

Meest recent

Traangas, knuppels en loterijsysteem: slecht rapport voor Italiaans onthaalbeleid voor migranten

Wet op alcoholreclame zorgt voor ongenoegen: ‘Elk gebruik van alcohol wordt gestigmatiseerd’

'Één lesdag in de buitenlucht maakt de lente niet'

Het Rwandaplan van Rishi Sunak: ‘Zelfs ambtenaren willen dit niet uitvoeren’

Knack is er voor mensen met een lenige geest. Want wie slim is, durft twijfelen. Kritisch, doordacht, diepgaand, open voor alle meningen en invalshoeken. Dat voedt de twijfel en zorgt voor meer inzichten. Word Knack-abonnee.

Abonneer nu

€ 14,95 /maand

Schrijf je in voor onze nieuwsbrief.
Mis niet langer het belangrijkste nieuws van de dag.
Inschrijven

Abonneren

Mijn Magazines App

Adverteren

Contact & Info

Corrections Policy

Redactionele richtlijnen

AI: redactioneel charter Roularta Media Group

Knack

Factcheck

Auto

België

Cultuur

Geschiedenis

Gezondheid

Milieu

Sport

Technologie

Wereld

Wetenschap

Opinie

Rubrieken

Verkiezingen 2024

Het Grote Voorzittersdebat

Dirk Draulans' Beestenboel

De Leraarskamer van Knack

Maai Mei Niet

Dossiers

Knack voordelen

Knack Club

Knack puzzelclub

Knack shop

Knack reizen

Kortingscodes

Video

Podcast

Politiek ABC

Bekijk ook…

Artsenkrant

Data News Jobs

de Apotheker

De Zondag

Feeling

Flair

Gocar.be

Immovlan.be

KW.be

Libelle

Regiotalent

Vakantieweb

Jobs bij Roularta

Partners

Blijf op de hoogte

Knack is er voor mensen met een lenige geest. Want wie slim is, durft twijfelen. Kritisch, doordacht, diepgaand, open voor alle meningen en invalshoeken. Dat voedt de twijfel en zorgt voor meer inzichten. Word Knack-abonnee.

Abonneer nu

€ 14,95 /maand

Partners:

Artsenkrant

Data News Jobs

de Apotheker

De Zondag

Feeling

Flair

Gocar.be

Immovlan.be

KW.be

Libelle

Regiotalent

Vakantieweb

Jobs bij Roularta

Knack is een onderdeel van de Roularta Media Group
© 2024 Roularta Media Group Alle rechten voorbehouden

Copyright

Disclaimer

Privacy Policy

Cookie Instellingen

Cookiebeleid

© 2024 Roularta Media Group
Alle rechten voorbehouden