single-speaker

Michal Chovanec

Slovakia

Som výskumník v oblasti hlbokého učenia. Momentálne pracujem v Bratislave, vo firme Tachyum, kde riešim problematiku návhru procesora pre AI. PhD. som získal na Fakulte Riadenia a Infromatiky na Žilinskej univerzite - v téme reinforcement learning.

Vo voľnom čase chodím na hory, leziem, strieľam z luku a venujem sa bojovým umeniam.

deep reinforcement learning pomocou pytorch frameworku Talk

Slovenský jazyk

Pytorch predstavuje silný nástroj pre ľudí precujúcich v oblasti deep learningu. Najčastejšie aplikácie sú z počítačového videnia, rozpoznávania textu a reči - rôzne úlohy klasifikácie alebo segmentácie.

Reinforcement learning (RL, učenie odmenou a trestom) predstavuje menej známi prístup. Bol to práve RL - program AlphaGO, ktorý v roku 2016 porazil svetového majstra v hre GO a v roku 2019 pro-gamera v hre StarCraft (program AlphaStar).

Spôsob učenia spočíva v hraní tisícok hier, získavania odmien a učenie sa z nich. Takýto agent je schopný hraním hry sám so sebou prekonať ľudských hráčov, aj ""hard coded"" botov.

V prednáške ukážem základne myšlienky RL, ako vyzerá kód s použitím knižníc pytorch a aigym, ak nezabudnem, aj nejaké typy čo sa nedajú nájsť a čím sa trebalo popasovať - ono je pekné keď veci idú, ale keď nejdú je to ozaj boj ...

Pre nedočkavých prikladám video ako to pracuje : https://www.youtube.com/watch?v=rQIShnTz1kU

A podobne aj kód (pre účely pyconu ale urobím menší repozitár) : https://github.com/michalnand/reinforcement_learning/tree/master/src

kde budú jednoduhšie príklady a tréning sieti bude trvať len pár minút (namiesto pár dní)