Voor geld hoefde Luis von Ahn (35) niks meer te doen nadat hij zijn uitvinding – dat irritante vervormde woord dat je op internet soms moet overtikken om te laten zien dat je een mens bent – had verkocht. Dus ging hij de wereld maar verbeteren. ‘Ik ken de technologie die de NSA gebruikt en de helft van de tijd denk ik: Google kan dit veel en veel beter.’

Iedere internetgebruiker kent ze: de captcha’s. De onbegrijpelijke woorden die je nog even moet intikken nadat je een internetformulier hebt ingevuld, om te bewijzen dat je een mens bent. ‘Prioerloep’. Of is het ‘pnoerloep’? Maak je een foutje, kun je weer opnieuw beginnen. Ze zijn irritant en zelfs een beetje beledigend.

De captcha’s zijn verzonnen door de 35-jarige Luis von Ahn, een wiskundetalent uit Guatemala, die naar Duke University in Durham, North Carolina vertrok om op niveau te kunnen studeren. Hij studeerde summa cum laude af en was nog maar net begonnen als promovendus aan de Carnegie Mellonuniversiteit in Pittsburgh toen hij de captcha verzon, op 22-jarige leeftijd. Zijn proefschrift is de eerste tekst waarin de term human computation opduikt, een techniek voor problemen die niet door mensen en niet door computers kunnen worden opgelost, maar wel door een combinatie daarvan.

Hij is nu 35, succesvol, slim en multimiljonair, met een chronische glimlach en slimme ogen achter een bril met zwart montuur. Geen vederlichte Silicon-Valley-Bill-Gatesbril, meer een bril in de stijl van een jazzy bigbandleider uit het begin van de jaren zestig.

Voordat je een hekel aan hem krijgt: hij is ook de man achter Duolingo. Duolingo is een nieuw revolutionair gratis taalleersysteem, iPhone-app van het jaar 2013 en geschenk uit de hemel voor de vele immigranten die in Amerika en Engeland aan de slag willen. Het idee achter Duolingo zou er niet geweest zijn zonder die irritante captcha.

Waar kwam het idee van de captcha vandaan?

LUIS VON AHN: We zochten iets wat mensen kunnen en computers niet. Na een tijdje kwamen we op het idee van de vervormde letters. Die werken echt goed. Wat is het verschil tussen een l die en beetje gebogen is en een c? Als twee letters elkaar aanraken, hoe weet je dan dat het twee letters zijn? Het is moeilijk om dat aan een computer te leren. En het is niet alleen iets wat mensen beter kunnen dan computers, het vereist ook weinig intelligentie. Een persoon hoeft alleen maar de letters te kunnen herkennen. Hij hoeft niet eens de taal te kennen. Veel van de eerdere tests die we bedachten, hadden een vorm van menselijke intelligentie nodig en dat is een probleem omdat niet iedereen ze dan kan doen.

Was u niet bang dat computers snel beter zouden worden en de captcha’s zouden kraken?

VON AHN: Ja, maar dat bleek gelukkig niet zo te zijn. We hebben geluk gehad. De captcha’s zijn er nu al vijftien jaar en computers zijn er nog steeds niet goed in om ze op te lossen. Er zijn nu wel algoritmes die sommige captcha’s op kunnen lossen, maar als we de vervorming van de captcha een beetje sterker maken, werken ze al niet meer. Het blijkt erg moeilijk te zijn. Zeker als letters elkaar aanraken.

Een groot succes voor een promovendus.

VON AHN: We maakten de captcha’s en Yahoo begon ze te gebruiken. Daarna begon iedereen ze te gebruiken. Toen ik hoorde dat er tientallen miljoenen captcha’s per dag ingetikt werden, was ik aanvankelijk trots. Maar daarna schaamde ik me. Nu worden er per dag 200 miljoen captcha’s ingetikt. Ervan uitgaande dat het invullen van een captcha tien seconden kost, betekent het dat internetgebruikers elke dag 500.000 manuren verspillen. Dat was mijn schuld.

Sportschool-energie

Ongeveer op hetzelfde moment dat hij zich dit realiseerde, kreeg Von Ahn, toen 27, de MacArthur Genius Grant van 500.000 dollar. Bill Gates hing aan de telefoon en bood hem een baan aan bij Microsoft. Von Ahn begon zich slecht te voelen over de captcha. Een genie is toch niet iemand die ervoor zorgt dat er elke dag 500.000 manuren worden weggegooid?

Von Ahn weigerde het aanbod van Gates en werkte aan een beter idee: de recaptcha.

Als schooljongen bracht hij veel tijd door in de snoepfabriek van zijn familie, in Guatemala. De draaiende machines en ingenieuze constructies brachten hem op een idee. Hij wilde een keten van sportscholen beginnen die zelfvoorzienend was. De klanten die de trappers rondduwden en gewichten omhoogtakelden, zouden generatoren aandrijven die energie opwekten. De energie kon verkocht worden en zo konden de klanten gratis sporten.

Een goed idee… Tot je pen en papier erbij pakt. Als je heel hard fietst, kun je een lamp van 200 watt laten branden. Hou je het vijf uur vol, dan heb je een kilowattuur bij elkaar gefietst. Een kilowattuur kost ongeveer 25 eurocent. Een paar cent verdienen met vijf uur lang keihard doortrappen, daar raakt niemand van onder de indruk.

Ook Von Ahn kwam daar achter. Maar het idee bleef in zijn achterhoofd rondspoken, en na het bedenken van de captcha was het idee weer terug. Alleen wilde hij het niet mogelijk maken om spierkracht te verkopen, maar breinkracht: het herkennen van woorden en letters. Zo kwam hij op de recaptcha: De recaptcha bestaat niet uit één, maar uit twee woorden, die allebei afkomstig zijn uit boeken die gedigitaliseerd worden met behulp van optical character recognition (OCR)-software. Deze software herkent in teksten die ouder zijn dan vijftig jaar maar twee op de drie woorden.

Het idee van de recaptcha is een captcha samen te stellen uit een woord dat de computer wél herkend heeft – en dat dus bekend is – en een woord dat de computer niet herkend heeft en dus nog onbekend is. Beide woorden worden weer vervormd. Het bekende woord heeft de functie van de oude captcha, het kijkt of je wel een mens bent. Door het andere woord in te tikken, help je de computersoftware met het digitaliseren van oude boeken en kranten. Wereldwijd gebruiken 350.000 websites nu recaptcha’s. Het is gratis te gebruiken. The New York Times en andere klanten betalen om archieven op harde schijven te zetten. Mensen die recaptcha’s oplossen, digitaliseren elke dag – zonder dat ze het zich realiseren – 100 miljoen woorden. Per jaar zijn dat 2,5 miljoen boeken.

In 2009 verkocht u recaptcha aan Google. Hoe gaat dat? Staat er dan ineens een enorm bedrag op de bankrekening?

VON AHN: Yep.

Genoeg om te gaan rentenieren?

VON AHN: Ja, maar na twee weken nooit meer werken begon het al op mijn zenuwen te werken.

Voor geld hoefde u niks meer te doen. Dus ging u de wereld maar verbeteren?

VON AHN: Mensen denken vaak dat onderwijs de kloof tussen arm en rijk kleiner maakt, maar ik heb in Guatemala gezien dat het juist andersom werkt. Rijke mensen kunnen fantastisch onderwijs betalen voor hun kinderen. Arme mensen niet. De kloof wordt alleen maar groter.

Gratis lessen

Elk jaar moeten dertig miljoen werkzoekenden en immigranten een test doen om aan te tonen dat ze Engels voldoende beheersen, zoals de TOEFL (Test of English as a Foreign Language). Anders worden deze mensen niet toegelaten op een school of krijgen ze een baan niet. Deze tests kosten honderden dollars en kunnen alleen afgenomen worden in grote steden. Ook de Engelse lessen, al dan niet online, kosten honderden dollars. Alleen immigranten met geld kunnen het zich permitteren om goed Engels te leren, het examen te doen en de juiste papieren te verzamelen. Von Ahn bedacht een oplossing.

Samen met de Zwitserse computerdeskundige Severin Hacker – en geholpen door investeerders als acteur Ashton Kutcher en Timothy ‘The 4-Hour Workweek’ Ferriss – maakte hij de app Duolingo: taallessen die voor een deel bestaan uit het vertalen van zinnen. De truc lijkt weer op het fitnessidee. De oefenzinnen zijn afkomstig van de sites van Buzzfeed en CNN. Spaanstalige cursisten vertalen terwijl ze Engels oefenen – zonder dat ze het weten – stukjes tekst van CNN en Buzzfeed uit het Engels in het Spaans. Alle cursisten samen doen dit beter dan Google Translate. CNN en Buzzfeed betalen Duolingo voor het vertaalwerk. De lessen zijn daarom gratis.

Stel dat ik deze tekst – zeg 2500 woorden – via Duolingo in het Engels zou willen laten vertalen, wat zou me dat kosten?

VON AHN: We doen nog geen Nederlands naar Engels. Maar als het van Spaans naar Engels was, dan zou dat zes uur kosten, voor drie dollarcent per woord. Dat zou dus zestig dollar kosten.

Niet alleen blijkt Duolingo even goed te werken als de dure software van Rosetta’s Stone, het zal ook alleen maar beter worden omdat het programma leert van de leerlingen.

VON AHN: We doen eenvoudige tests om uit te vinden hoe mensen beter leren. Voor iedere persoon houden we alles bij. Dus we weten hoe lang iemand over een vraag gedaan heeft. Wat hij goed deed en fout, en waarom. Uiteindelijk kunnen we zeggen: deze persoon is niet zo goed in meervoud, of werkwoordvervoegingen, en daarom moet hij nu deze les doen. Maar we staan pas aan het begin. We gebruiken nu nog dezelfde teksten en oefeningen voor iedereen, maar voor verschillende cursisten in een andere volgorde. Voor sommige mensen zouden we compleet andere oefeningen moeten hebben. Het doel is om voor iedereen een cursus compleet op maat te maken.

Maakt Duolingo verschillende manieren van leren zichtbaar?

VON AHN: We zien niet dat er echt afgescheiden manieren van leren zijn. Jammer genoeg kunnen we op basis van onze data niet zoiets zeggen als: deze persoon is visueel ingesteld, of auditief. Het is een continuüm. Iedereen leert een beetje anders. Maar we zien wel dat sommige mensen heel anders leren dan andere. En ik weet zeker dat we mensen die niet makkelijk door de huidige leersystemen komen, straks goed kunnen bedienen.

Hoe zit het met de privacy van de Duolingo-leerlingen? Blijkt uit de data die Duolingo verzamelt hoe goed ze kunnen leren?

VON AHN: Het gaat altijd om een compromis tussen privacy en de mogelijkheid om iemand te helpen. Als iemand veel privacy wil, zal hij voor sommige diensten moeten betalen of zullen sommige diensten niet beschikbaar zijn. Hoe minder privacy, hoe meer we ons aan de gebruiker kunnen aanpassen en hoe beter de service die we kunnen verlenen.

Rond alle technologische ontwikkelingen zijn twee geluiden te horen. Aan de ene kant de optimisten, die denken dat er heel veel problemen opgelost zullen worden door de geweldige mogelijkheden van big data en nieuwe technologische ontwikkelingen, zoals Duolingo. Aan de andere kant zijn er mensen die waarschuwen voor bedrijven als Facebook en Google, die te groot worden en meer kennis verzamelen dan goed voor ons is.

VON AHN: Allereerst denk ik dat de meeste mensen denken dat deze bedrijven een groter verlangen hebben naar data dan ze eigenlijk hebben. Toen ik na de verkoop van recaptcha een jaartje bij Google rondliep, zag ik dat er veel zorg is over het beschermen van privacy. Google bedoelt het echt niet verkeerd. Veel mensen denken dat het bedrijf duistere motieven heeft, maar dat is volgens mij niet zo. Ik denk wél dat deze vragen over privacy nieuwe vragen zijn waar we mee moeten dealen. Het is goed dat mensen hierover nadenken en vragen blijven stellen.

Twee jaar geleden waren Google en Facebook heel coole bedrijven. Dat is veranderd. Nu is het: stop. Jullie worden te groot. En ik denk dat dat goed is. Ze moeten actie ondernemen. En dat doen ze ook. Dat komt in orde. Daar ben ik van overtuigd. We komen steeds dichter bij het moment waarop iedereen begint te begrijpen wat bedrijven als Google en Facebook eigenlijk willen. Google focust bijvoorbeeld op de zelfrijdende auto. Dat ding werkt. Dat gaat gebeuren. Ik heb erin gezeten. Het is opzienbarend. Als er meer helderheid is over wat ze van ons willen, kunnen we beginnen met het uitwerken van een deal. Dan zal het volgens mij geen probleem meer zijn, omdat ik er vrij zeker van ben dat deze bedrijven geen slechte bedoelingen hebben.

Met het soort werk dat u doet, zult u ongetwijfeld de belangstelling hebben getrokken van de geheime diensten.

VON AHN: Dat klopt. Maar daar heb ik geen interesse in.

Hebt u een andere wereld leren kennen? Een technocratie met machtige mannen achter de schermen?

VON AHN: Die wereld is er zeker. Er zijn mensen met heel veel technologische macht. Maar ze werken niet voor de geheime diensten. Ik ken de technologie die de NSA gebruikt en de helft van de tijd denk ik: Google kan dit veel en veel beter. En die wetenschap is voor mij op een of andere manier niet zo beangstigend. Ik ben soms eerder verbaasd over wat de overheden nog níét kunnen. Als je veel films kijkt, zou je kunnen denken dat gezichtsherkenning al heel goed is. Ze zitten nu misschien op 95 procent. Maar als je probeert een gezicht te vinden in een populatie van 300 miljoen mensen, is een 5 procent foutenmarge niet indrukwekkend. Gezichtsherkenning is pas bruikbaar als die honderd procent goed is. Ik ben niet zo bang wat dat betreft.

Is er nog een droom? Iets wat u na Duolingo graag zou bereiken?

VON AHN: Het klinkt misschien hoogdravend, maar de sociale psychologie inspireert mij. In het bijzonder een experiment van de psycholoog Muzafer Sherif in de jaren vijftig en zestig. Hij organiseerde een zomerkamp voor een groep kinderen van een jaar of twaalf. Hij verdeelde de kinderen over twee groepen, die hij tegen elkaar opzette. Hij vertelde kinderen dat iemand iets lelijks over hem of haar had gezegd. Dat soort dingen. Daarna probeerde Sherif om ze weer vrienden te laten worden. Hij vond twee krachtige manieren om dat te doen. Eén was door een gezamenlijke vijand te introduceren. Een tweede door een gezamenlijk doel te vinden. Sherif zette alle kinderen in een bus en liet de bus kapotgaan. Hij liet de kinderen geloven dat de enige manier om de bus weer in gang te zetten was door met zijn allen te duwen. Toen dat lukte, waren ze allemaal weer vrienden. Als mensen een gezamenlijke vijand hebben óf als ze samenwerken, vinden ze elkaar aardiger. Dus om alle mensen op aarde te verenigen, zijn er óf aliens nodig, óf we moeten met zijn allen samen aan één project werken.

Aan wat voor projecten zouden miljarden mensen tegelijkertijd kunnen werken?

VON AHN: Dat is een goede vraag. Ik weet niet precies wat we zouden kunnen doen. Ik hoop dat we met z’n allen het onderwijs kunnen verbeteren: uitzoeken wat de beste manier is om iedereen op te leiden. We weten nu hoe we met internet honderden miljoenen mensen kunnen laten samenwerken. Dat is nieuw. Voor het internet was het vrijwel onmogelijk om meer dan honderdduizend mensen te coördineren en te betalen. Projecten als de maanlanding, de piramides in Egypte en het graven van het Suezkanaal waren het hoogst haalbare. Via de recaptcha hebben 750 miljoen mensen geholpen met het digitaliseren van menselijke kennis. Als je zo’n grote groep mensen zo zou kunnen aansturen dat ze samen een geneesmiddel tegen een ziekte zouden ontdekken… Zoiets zou natuurlijk fantastisch zijn.

DOOR GERARD JANSSEN, FOTO’S CHANTAL HEIJNEN

‘Je kunt nu honderden miljoenen mensen laten samenwerken’

‘Rijke mensen kunnen fantastisch onderwijs betalen voor hun kinderen. Arme mensen niet. De kloof wordt alleen maar groter.’

‘Ervan uitgaande dat het invullen van een captcha tien seconden kost, betekent het dat internetgebruikers elke dag 500.000 manuren verspillen. Dat was mijn schuld.’

Reageren op dit artikel kan u door een e-mail te sturen naar lezersbrieven@knack.be. Uw reactie wordt dan mogelijk meegenomen in het volgende nummer.

Partner Content