Tantárgyi Adatlap

PDF letöltése
Budapesti Műszaki és Gazdaságtudományi Egyetem
Közlekedésmérnöki és Járműmérnöki Kar
1. Tantárgy neve Megerősítéses tanulás a járműirányításban
2. Tantárgy angol neve Reinforcement Learning for vehicle control
3. Tantárgykód BMEKOKAD017 4. Követelmény vizsga 5. Kredit 3
6. Óraszám 2 (0) Előadás 0 (0) Gyakorlat 0 (0) Labor
7. Tanterv
Doktori képzés (D)
8. Szerep
Szak
9. A tantágy elvégzéséhez szükgésges tanulmányi munkaóra összesen 90
Kontakt óra 28 Órára készülés 14 Házi feladat 30
Írásos tananyag 0 Zárthelyire készülés 0 Vizsgafelkészülés 18
10. Felelős tanszék Közlekedés- és Járműirányítási Tanszék
11. Felelős oktató Dr. Bécsi Tamás
12. Oktatók Dr Bécsi Tamás, Dr. Aradi Szilárd
13. Előtanulmány  
14. Előadás tematikája
Probléma-megfogalmazás, elhelyezés a gépi tanulás területén. Heurisztikák, dinamikus és statikus heurisztikák. Algoritmusok hatékonysága, komplexitása. A dimenziók átka. A Markov döntési modell, rejtett Markov dontési modell. Megfigyelhetőségi probléma. Klasszikus megoldások öntanuló rendszerek esetén, esettanulmány útvonalkereső algoritmusokra. Neurális hálózatok alapjai, a felügyelt tanítás, általános hálózati struktúrák. Diszkrét, folytonos és sztályozás típusó feladatok. Fordított tanulás, Imitation learning. A demonstrátor és a demonstráció, policy, veszteségfüggvény és algoritmusok. Value based learning, Q-learning. Az exploration-exploitation dilemma. A Q learning változatai, Deep Q, DQN. Viselkedés alapú tanulóalgoritmusok, a Policy gradients, determinisztikus, és sztochasztikus policy.
15. Gyakorlat tematikája
 
16. Labor tematikája
 
17. Tanulási eredmények
A. Tudás   B. Képesség   C. Attitűd   D. Önállóság és felelősség
18. Az aláírás megszerzésének feltétele, az aláírás érvényessége
Vizsga és három egyéni házi feladat.
19. Pótlási lehetőségek
 
20. Jegyzet, tankönyv, felhasználható irodalom
 
Tantárgyleírás érvényessége 2019. november 27. Jelen TAD az alábbi félévre érvényes Nem induló tárgyak