-
1
المؤلفون: Ozretić, Petar
المساهمون: Mladenović, Saša, Perišić, Ana, Gotovac Đogaš, Vesna
مصطلحات موضوعية: SARSA strategy, TEHNIČKE ZNANOSTI. Računarstvo, Markov property, strategija, Markovljevo svojstvo, PRIRODNE ZNANOSTI. Matematika, TECHNICAL SCIENCES. Computing, učenje s vremenskom razlikom, pohlepno istraživanje, Bellman equations, dinamičko programiranje, dynamic programming, vrijednosna funkcija, SARSA vrednovanje strategije, greedy strategy, agent, Monte Carlo kontrola, Bellmanove jednadžbe, value function, action, temporal difference learning, environment model, NATURAL SCIENCES. Mathematics, model okoline, strategy, akcija, Monte Carlo control
وصف الملف: application/pdf
URL الوصول: https://explore.openaire.eu/search/publication?articleId=dedup_wf_001::f075e23a422f0c8d1b47197b32e8af85
https://repozitorij.svkst.unist.hr/islandora/object/pmfst:1451/datastream/PDF