Príklady realizácie strojového učenia na predmete SMAD

Interakcia medzi agentom a prostredím

Šikovní študenti pod vedením Juraja Gazdu v rámci predmetu SMAD (1. ročník Ing. štúdia, LS) implementovali rozličné algoritmy strojového učenia s posilňovaním (reinforcement learning) a hlbokých neurónových sietí v známom softvérovom rámci Gym spoločnosti OpenAI. Ich snahou bolo naučiť softvérového agenta (bez prídavných informácií o prostredí) pristávať s raketkou na mesiaci (prostredie LunarLander), pretekať formulu (prostredie CarRacer), či naučiť robota vykonávať zrýchlený beh (prostredie BiPedalWalker). Riešenie týchto problémov vyžaduje pomerne rozsiahle vedomosti o hlbokom strojovom učení a súčasne tieto riešenia ilustrujú obrovský potenciál strojového učenia vo vybraných informatických doménach v budúcnosti. Vybrané práce si môžete pozrieť na YouTube videách:

Ak sa chcete aj vy naučiť využívať strojové učenie na riešenie zložitých úloh, prihláste sa na predmet Stochastické modelovanie a analýza dát (SMAD).