Harm Van Seijen, Hadi Nekoei, Evan Racah et Sarath Chandar Anbil Parthipan
Communication écrite (2020)
Ce document n'est pas archivé dans PolyPublieDépartement: | Département de génie informatique et génie logiciel |
---|---|
URL de PolyPublie: | https://publications.polymtl.ca/48689/ |
Nom de la conférence: | 34th Conference on Neural Information Processing Systems (NeurIPS 2020) |
Date(s) de la conférence: | 2020-12-06 - 2020-12-12 |
Maison d'édition: | Neural Information Processing Systems Foundation |
Date du dépôt: | 18 avr. 2023 15:01 |
Dernière modification: | 25 sept. 2024 16:37 |
Citer en APA 7: | Van Seijen, H., Nekoei, H., Racah, E., & Anbil Parthipan, S. C. (décembre 2020). The LoCA regret: A consistent metric to evaluate model-based behavior in reinforcement learning [Communication écrite]. 34th Conference on Neural Information Processing Systems (NeurIPS 2020). |
---|---|
Statistiques
Aucune statistique n'est disponible.