par Křetínský, Jan;Perez, Guillermo A. ;Raskin, Jean-François
Référence Leibniz international proceedings in informatics, 118, 8
Publication Publié, 2018-08
Article révisé par les pairs
Titre:
  • Learning-based mean-payo optimization in an unknown MDP under omega-regular constraints
Auteur:Křetínský, Jan; Perez, Guillermo A.; Raskin, Jean-François
Informations sur la publication:Leibniz international proceedings in informatics, 118, 8
Statut de publication:Publié, 2018-08
Sujet CREF:Généralités
Mots-clés:Beyond worst case
Phrases Markov decision processes
Reinforcement learning
Note générale:SCOPUS: cp.p
Langue:Anglais
Identificateurs:urn:issn:1868-8969
info:doi/10.4230/LIPIcs.CONCUR.2018.8
info:scp/85053629887