'Soms hebben we gewoon gegoogled om te weten te komen welke meervoudsvorm het meest wordt gebruikt, of welke woorden in België meer voorkomen dan in Nederland', zegt Jeannine Beeken van het Instituut voor Nederlandse Lexicologie (INL), dat de herziening van de Woordenlijst Nederlandse Taal heeft voorbereid. 'Als je merkt dat het ene meervoud drie keer voorkomt en het andere 500.000 keer, dan weet je het wel.' Achteraf worden die bevindingen vergeleken met gegevens uit uitgebreide corpora met heel uiteenlopende teksten, onder meer uit boeken, kranten en...

'Soms hebben we gewoon gegoogled om te weten te komen welke meervoudsvorm het meest wordt gebruikt, of welke woorden in België meer voorkomen dan in Nederland', zegt Jeannine Beeken van het Instituut voor Nederlandse Lexicologie (INL), dat de herziening van de Woordenlijst Nederlandse Taal heeft voorbereid. 'Als je merkt dat het ene meervoud drie keer voorkomt en het andere 500.000 keer, dan weet je het wel.' Achteraf worden die bevindingen vergeleken met gegevens uit uitgebreide corpora met heel uiteenlopende teksten, onder meer uit boeken, kranten en tijdschriften. Beeken: 'Docenten, auteurs en journalisten zijn gewend om te schrijven en op hun taalgebruik te letten. Wat je in hun teksten vindt, kun je niet zomaar naar alle taalgebruikers extrapoleren. Op internet kom je ook de taal tegen van gewone taalgebruikers die er niet zo bewust mee bezig zijn.' Voor ze bij het INL met die enorme stapel teksten aan de slag konden, moest de juridische dienst een hele krachttoer leveren. Voor elke tekst die de taalkundigen onderzoeken, moeten contracten worden afgesloten met de betrokken uitgever. 'Soms volstaat één contract voor alle teksten van een bepaalde publicatie, maar andere uitgevers vragen dat er een handtekening wordt gezet voor elke jaargang of zelfs voor elke afzonderlijke tekst', aldus Beeken. 'En lang niet alle uitgevers stellen hun teksten gratis ter beschikking.'Zodra de rechten waren vrijgegeven, onderzochten de lin-guïsten hoe frequent nieuwe woorden opdoken, maar ook of verouderde woorden nog wel werden gebruikt. Beeken: 'Er moet ook wat tijd over gaan. Woorden die pas een paar maanden voorkomen, zoals podcasten, hebben we nog niet opgenomen. Dat zouden eendagsvliegen kunnen zijn, of er kan later een ander woord voor in de plaats komen. Maar iets als sms'en, dat in 1995 nog niet eens werd gebruikt, moest er natuurlijk wel in.' Naast de haast natuurlijke aangroei en afvloeiing van woorden, kregen de makers van het Groene Boekje ook de opdracht om een reeks Hebreeuws-Jiddische, Arabische en Surinaamse woorden op te nemen, net als vijfhonderd extra Vlaamse woorden. Omdat Suriname in december 2004 tot de Taalunie is toegetreden, was het vanzelfsprekend om op zoek te gaan naar lemma's uit het Surinaamse taalgebruik. 'Een eerste vingeroefening als het ware', zegt Beeken. 'Suriname is er namelijk pas drie maanden voor de deadline van de lijst bij gekomen. Mensen uit Suriname hebben een selectie gemaakt, en de Werkgroep Spelling heeft ervoor gezorgd dat de woorden in de juiste spelling kwamen. Cellenhuis, het Surinaamse woord voor gevangenis, moet bijvoorbeeld een tussen-n krijgen.'Het aantal Arabische woorden in de lijst moest veeleer worden beperkt. Sinds de aanslagen van 11 september 2001 komen die immers erg veel in Nederlandse teksten voor. Beeken: 'Dat moest voor de uitgave van 2005 wel enigszins binnen de perken blijven. Maar dat neemt niet weg dat mensen vandaag moeten weten hoe ze boerka moeten schrijven.'