Een team van wetenschappers van het ArtificiaI Intelligence Experience Center aan de Vrije Universiteit Brussel heeft een zelfrijdende rolstoel ontwikkeld die bovendien autonoom nieuwe handelingen aanleert. Dankzij een innovatief algoritme experimenteert de rolstoel in zijn eigen omgeving en wordt het leerproces versneld.
Het algoritme dat de wetenschappers uitvonden, stuurt de rolstoel aan volgens een combinatie van vormen van reinforcement learning. Bij het klassieke principe van reinforcement learning pikt de computer zelf nieuwe zaken op door te experimenteren binnen zijn werkomgeving, maar dat vereist veel interacties en zorgt voor een leerproces van zeer lange duur. Het nieuwe algoritme dringt de leertijd stevig terug.
Gebaseerd op trial-and-error
‘Reinforcement learning is eigenlijk een systeem gebaseerd op trial-and-error’, legt hoofdonderzoeker Denis Steckelmacher uit. ‘De rolstoel wordt beloond als die iets goed doet, bijvoorbeeld een obstakel vermijden. Wanneer de rolstoel een ongewenste actie uitvoert, wordt die bestraft. Ons algoritme combineert op een slimme manier verschillende types van reinforcement learning, waardoor de ene methode de zwaktes van de andere compenseert. Dit resulteert in een leerproces dat heel snel gaat als we voldoende zeker zijn, en voorzichtig bijstuurt bij onzekerheid’.
Volgens Steckelmacher zorgt de nieuwe technologie voor veiligere en comfortabelere rolstoelen die meteen ingezet kunnen worden.