Als het van Roberto Martínez afhangt, wordt het geld dat de Koninklijke Belgische Voetbalbond heeft verdiend op het WK in Rusland geïnvesteerd in een revolutionair videoproject. De bondscoach wil elke wedstrijd in België, zowel bij de profs als bij de amateurs, laten filmen met gesofisticeerde breedhoekcamera's. Die beelden moeten dan terechtkomen in een databank die alle clubs vrij kunnen raadplegen. Het gaat de bondscoach niet om de kijkervaring van de supporter, wel om wat de clubs met die wedstrijdgegevens kunnen aanvangen. Martínez is een 'laptoptrainer' die via data en algoritmes het voetbal naar een hoger niveau wil stuwen. Vooral in Duitsland zijn de laptoptrainers een begrip: jonge, blitse types zonder noemenswaardige voetbalcarrière zoals Jürgen Klopp, Thomas Tuchel en Julian Nagelsmann boeken er opzienbarende resultaten.

Als u de volgende keer Arsenal ziet spelen, weet dan dat een paar honderd Cambodjanen mee hebben gewerkt aan hun aanvalspatronen.

Laat het woord 'data' vallen en het enthousiasme van Martínez valt nauwelijks te temperen. 'Alles wat je kunt meten kan je iets bijleren, soms zaken waarvan je niet wist dat je ze niet wist', zegt hij. 'Ik heb het over trainingsdata, wedstrijdstatistieken, tactische analyses. Ik geef een voorbeeld: het is bewezen dat er een limiet zit op het aantal sprints en zogeheten high intensity actions die een speler per wedstrijd aankan. Overschrijdt hij die grens, dan wordt het minder. Niet dat ik daarom ga wisselen wanneer een speler aan zijn sprintlimiet zit, maar het is wel iets om bij stil te staan wanneer je een match voorbereidt. Je kunt sturen dat de ene speler vaker sprint, een ander iets minder. We zijn er nog niet uit wat nuttig is en wat niet in zo'n statistische benadering. Ik ben als trainer veel bezig met balbezit, maar het percentage balbezit laat me koud: het houdt geen rekening met wat een ploeg met de bal dóét. Zaken die ik subjectief aanvoel en die bevestigd worden door de cijfers: daar zit voor mij vandaag de grote meerwaarde van data-analyse.'

De statistieken vinden die ertoe doen: daar ligt de uitdaging voor de quants of wiskundige bollebozen die allerhande data in algoritmes gieten. Types die normaliter beursvoorspellingen maken voor hedgefondsen, doen nu iets soortgelijks voor voetbalploegen, gebaseerd op gegevens over goals, passes en tackles. Daar wordt fors in geïnvesteerd: Manchester City heeft elf voltijdse quants in dienst. Arsenal betaalde 4 miljoen dollar voor StatDNA: een databedrijf uit Chicago dat voortaan exclusief voor de Gunners werkt. De Rode Duivels gaan te rade bij SciSports, een spin-off van de Universiteit Twente. De eigenaars zijn jonge twintigers die op hun studentenkamer urenlang Football Manager speelden: een computerspel waarbij je virtueel spelers koopt en de ploeg opstelt. Een algoritme dat de NASA gebruikt om astronautenteams te selecteren, passen ze toe op de voetbalwereld. Op het WK in Rusland leverde SciSports analyses over de tegenstander, met focus op zwaktes bij het team, de coach of individuele spelers. Saillant detail: de scouts van de nationale ploeg, mensen met een voetbalachtergrond, verbaasden zich over hun beperkte budget in Rusland. De bollebozen van SciSports - met functieprofielen als Computer Vision Expert en Deep Learning Engineer - namen hun werk gedeeltelijk over. Na het behalen van de bronzen medaille stuurde Martínez een kaartje om SciSports te bedanken.

In de Amerikaanse sporten wisselt geen enkele coach nog spelers zonder zijn laptop te raadplegen.

Doelkansberekening

Hét kernbegrip om de statistische revolutie te begrijpen is Expected Goals of xG, in het jargon. Simpel gezegd berekent xG de waarschijnlijkheid dat een schot tot een doelpunt leidt. De eerste parameter is de positie van waaruit de speler schiet: een schot vanaf de penaltystip maakt meer kans dan een vanaf de middellijn. xG houdt nog met andere zaken rekening. Was de bal in beweging toen er werd getrapt? Hoe ver stond de dichtstbijzijnde verdediger? Met welk deel van de voet werd de bal geraakt? Hoe kreeg de schietende speler de bal aangespeeld? De kansberekening - eigenlijk: doelkansberekening - wordt almaar uitgebreider. Analisten putten uit databases met tienduizenden schoten vanuit elke mogelijke hoek. Eigenlijk zoeken ze naar algemene, altijd geldende waarheden die de toevalligheden van één geslaagde of mislukte actie overstijgen.

De Nederlandse chirurg Sander IJtsma is een hobbyquant, die op Twitter onder de schuilnaam 11tegen11 xG-analyses deelt. Voor de match Lokeren-Anderlecht becijferde hij dat de thuisploeg een xG van 0,42 bijeenvoetbalde, terwijl Anderlecht op 0,85 uitkwam. Het werd uiteindelijk 1-2. Expected Goals doet twee dingen: het geeft van een concrete spelsituatie weer wat de kans is op een doelpunt, en als je dat extraheert naar spelers hun volledige carrière, dan krijgt het een voorspellende waarde. Je kunt de xG van een heel team optellen en afwegen tegenover dat van de tegenstander. Via xG kom je dus tot: wie maakt de meeste kans om de match te winnen?

Pass of assist

Statistici perfectioneren momenteel de Expected Assists of xA. De assist is van oudsher een van de meest bedrieglijke statistieken in het voetbal. Kevin De Bruyne heeft een gouden pass in de voet, maar wanneer de spitsen zijn perfecte voorzetten niet afwerken, krijgt De Bruyne toch slechte statistieken. Het omgekeerde bestaat evengoed. Als Lionel Messi de bal komt halen op de eigen helft, het veld oversteekt, iedereen voorbij dribbelt en scoort, dan heeft degene die hem toevallig een makkelijke pass gaf ook een assist. Die valse positieven moeten eruit en xA blijkt nog niet zo betrouwbaar als xG.

De gevolgen van die wiskundige benadering uiten zich almaar nadrukkelijker op het veld. Iedereen die topvoetbal kijkt, heeft dat ervaren, al is het u misschien niet opgevallen. De rol van de flankaanvaller is bijvoorbeeld totaal veranderd, dankzij de statistieken. Vroeger dweilde een flankspeler de lijn af tot bij de cornervlag. Daar trapte hij een verre voorzet richting spits. Uit de statistieken blijkt dat amper één op de vijftig verre voorzetten tot een doelpunt leidt. De verklaring is logisch. De flankaanvaller moet een bijzonder precieze pass trappen, terwijl hij zelf in beweging is en vaak ook een verdediger moet afhouden. Zelfs als die bal aankomt bij de spits, moet die er nog iets nuttigs mee doen. Niet vanzelfsprekend, want de verdedigers die rond hem staan, kunnen makkelijk anticiperen. De laptoptrainers kennen die statistieken. Ze spelen ofwel zonder flankaanvallers of ze geven hen de richtlijn om zo'n vijf meter voor het strafschopgebied naar binnen te snijden en een boogbal te trappen naar de verste hoek. Types als Arjen Robben, Philippe Coutinho of Leandro Trossard beheersen zulke schoten tot in de perfectie.

© Getty Images/iStockphoto

Via Expected Goals en Expected Saves is het ook mogelijk om de pechscore van een ploeg te berekenen. Dat is minder futiel dan het lijkt. Wanneer een team een belangrijke match verliest, lijkt het of de wereld instort. Het management moet zich pijnlijke vragen stellen: is er iets fundamenteel mis of zat het gewoon tegen? Bijsturen of volgende keer beter: van die vraag hangen miljoenen af. De pechscore heet de PDO, een afkorting waarvan niemand weet waarvoor ze staat. De gokindustrie is bijzonder geïnteresseerd in de PDO, want die geeft aan welke teams onder hun waarde presteren en het wellicht dus beter zullen gaan doen. Geluksvogels wier rijk op instorten staat, detecteert de PDO evengoed.

Brad Pitt

Het WK in Rusland was het eerste toernooi waarop de Wereldvoetbalbond FIFA gegevensopslag tijdens de wedstrijden toeliet. De Brazilianen gingen daar het verst in. Neymar en co. en droegen gps-trackers in hun truitje, die live data doorstraalden naar een analyseteam in Rio de Janeiro. Of er ook daadwerkelijk spelers zijn gewisseld op basis van die gegevens, is onbekend: bondscoach Tite reageerde kregelig op vragen in die zin. Tite interpreteerde het als een aanval op zijn gezag, maar in de Amerikaanse sporten bekijkt men dat anders. Daar wisselt geen enkele coach nog spelers zonder zijn laptop te raadplegen. De voorloper van die benadering was honkbalmanager Billy Beane van de Oakland Athletics, een staartploeg die nooit schitterde omdat ze financieel niet opkon tegen de topclubs. Beane luisterde niet langer naar de kenners en kocht spelers op basis van hun statistieken. 'Waarom ik mijn eigen ogen minder vertrouw dan de stats? Ik zie goochelaars konijnen uit een hoge hoed toveren, hoewel ik weet dat er in die hoed heus geen konijn zit', zei Beane. Na één uitermate succesvol seizoen kopieerden alle teams zijn aanpak. Beanes verhaal werd verfilmd als Moneyball, met Brad Pitt in de rol van honkbalmanager.

De voornaamste les uit Moneyball: onze ogen bedriegen ons. Mensen denken in clichés en voetbalscouts zijn daarop geen uitzondering. Scouts blijken opvallend vaak blonde spitsen aan te bevelen, waarschijnlijk omdat zij meer in het oog springen. Dat effect speelt overal, behalve in Scandinavische landen, waar blonde spitsen minder ongewoon zijn. Braziliaanse voetballers worden doorgaans overgewaardeerd, alsof we met z'n allen onbewust denken: een Braziliaan, die zal er wel wat van kunnen. Maar in een land van 207 miljoen inwoners lopen niet alleen Pelé's rond. Bij Belgische spelers kennen we dat fenomeen ook: sinds de doorbraak van Eden Hazard en co worden ook voor matige Belgen hoge bedragen betaald. De statistiek helpt om door die vooroordelen te kijken. Er bestaan databedrijfjes die zich specialiseren in 'objectieve scouting' en een percentage op de transfersom opstrijken wanneer een club hun suggesties volgt.

Pakweg Panama had met onze algoritmes niet de halve finale gehaald.

Gazastrook

Een cruciale kwestie is: hoe worden de statistieken verzameld? Dat ligt minder voor de hand dan je zou denken: hoekschoppen tellen kan iedereen, maar hoe bepaal je of een gemiste kans een fantastische redding was of eerder een slecht schot? Over het algemeen zijn de spreadsheetnerds niet te spreken over de wedstrijdgegevens die op televisie worden getoond. En terecht: vaak is dat in handen van een stagiair die streepjes zet bij elk gelukte pass. Om er mee aan de slag te kunnen, moeten de gegevens zuiverder zijn. StatDNA, het bedrijf van Arsenal, vond een originele oplossing. Het richtte een spin-off op die ondertussen zo'n 1000 werknemers telt in Cambodja, Laos, Kenia, de Gazastrook en de Filipijnen. Zij analyseren nauwgezet wedstrijdbeelden van over de hele wereld. Elke actie wordt tot in het absurde gelabeld. Van een assist noteert men niet alleen welke spelers betrokken waren, maar ook in welk tempo de actie verliep, of het in één vloeiend patroon ging en van welk deel van de voet de bal vertrok. Als u de volgende keer Arsenal ziet spelen, weet dan dat een paar honderd Cambodjanen mee hebben gewerkt aan hun aanvalspatronen.

Het Nederlandse SciSports werkt aan een systeem dat met 14 camera's 25 keer per seconde de positie van de voeten, knieën, handen, ellebogen en het hoofd registreert, en dat voor alle 22 spelers en de scheidsrechter. Het levert een verbluffende 11.000 datapunten per seconde op. Over een hele wedstrijd, laat staan over een heel seizoen, spreken we over een lawine aan gegevens. Het voorstel van Roberto Martínez lijkt een aanzet om een Belgische variant van dat systeem te ontwikkelen. Welke firma die data zal verwerken, daarover wil Martínez pas in een latere fase beslissen. Het is overigens lang niet zeker of zijn dure videoproject er komt: de amateurclubs zien naar verluidt de meerwaarde niet. De federatie van profclubs is wel aan boord.

De vraag blijft of voetbal wel de exacte wetenschap is die de quants erin zien. Voetbalkenners van de oude stempel beweren dat de sport daar te dynamisch voor is en te onvoorspelbaar. Voetbal golft voortdurend over en weer en telt meer onzekere variabelen dan sporten als honkbal en American football, die eerder een opeenvolging zijn van oorzaak en gevolg. Er vallen weinig goals, de rol van toeval is bijgevolg groot. De spreadsheettovenaars brengen daartegen in dat het gewoon een kwestie is van meer en preciezere data, van eindelijk kunnen meten wat we willen meten. Number crunchen levert tot nu toe niet alleen succesverhalen op. Neem Fulham, dat vorige zomer naar de Premier League is gepromoveerd. De club spendeerde een smak geld aan nieuwe spelers, stuk voor stuk gescreend met ' data driven scouting'. Fulham staat vandaag op een degradatieplek en het voetbal is niet om aan te zien.

Neveneffecten

De toegenomen aandacht voor kansberekening heeft soms geestige neveneffecten. Zo schijnt het niet ongewoon dat keepers slechter beginnen te presteren bij strafschoppen zodra ze de schotstatistieken van de tegenstander bestuderen. In dat geval geven de statistieken de raad om... niet meer naar de statistieken te kijken.

JAKKO SLOT VAN SCISPORTS: 'WIJ GAVEN AAN WAAR BRAZILIË KWETSBAAR WAS'

© Reuters

Voetbaldatabedrijf SciSports stond de Rode Duivels bij op het WK in Rusland en kreeg naderhand een bedankbrief van de technische staf. 'Wij kwamen vooral in de knock-outfase van het toernooi in beeld', vertelt Jakko Slot, Head of Football bij SciSports. 'Wedstrijden volgen elkaar snel op tijdens een WK. We stelden een schaduwlijst op van mogelijke tegenstanders van de Rode Duivels en hoe zij voetballen. Dankzij die input konden de videoanalisten van de Belgische nationale ploeg snel ter zake komen. Ons bedrijf wil de voetbalprofessional niet vervangen maar zijn werk makkelijker maken.


'Neem de wedstrijd tegen Brazilië. Iedereen weet dat Neymar een topspeler is, wij hebben in kaart gebracht hoe hij exact werd aangespeeld tijdens het WK. We analyseerden dat Casemiro een van de bepalende figuren was in de opbouw bij de Brazilianen (Casemiro ontbrak tegen België door schorsing, nvdr) en hebben aangestipt waar het team volgens de data kwetsbaar was.'


Heeft dat een verschil gemaakt? Slot lacht de suggestie weg: 'Nee, Roberto Martínez heeft het tactische plan bepaald en zijn ploeg heeft geweldig gevoetbald. Onze data reikten de Belgische bondscoach inzichten aan, maar de successen behoren toe aan het team zelf. Want heel eerlijk: als we hadden samengewerkt met Panama, dan hadden zij door onze algoritmes heus de halve finale niet gehaald.'

Reageren op dit artikel kan u door een e-mail te sturen naar lezersbrieven@knack.be. Uw reactie wordt dan mogelijk meegenomen in het volgende nummer.