- Sustav se temelji na ‘reinforcement learning modelu’, a to je grana strojnog učenja kojom program uči kroz nagrade i kazne. Znači, ako cilj postavimo na to da vozač što manje čeka na semaforu, sustav dobije ‘nagradu’ kada to postigne. Ubrzo počinje sve svoje postupke prilagođavati isključivo tome da dobije nagradu i bude što manje kažnjen - objašnjava nam Luka Mandić, 23-godišnji student posljednje godine zagrebačkog FER-a koji se u timu “Smart Traffic” bavi developmentom.
Sadašnji model
Naravno, nije riječ o fizičkom kažnjavanju ili nagrađivanju čokoladom, sve je to u virtualnom svijetu brojeva. Softvera, za koji se nadaju da bi u budućnosti mogao riješiti problem prometnih gužvi u gradu, u svakom bi trenutku pratio promet na jednom raskrižju, komunicirajući...
Za sudjelovanje u komentarima je potrebna prijava, odnosno registracija ako još nemaš korisnički profil....