Harm Van Seijen, Hadi Nekoei, Evan Racah et Sarath Chandar Anbil Parthipan
Communication écrite (2020)
Ce document n'est pas archivé dans PolyPublie| Département: | Département de génie informatique et génie logiciel |
|---|---|
| ISBN: | 9781713829546 |
| URL de PolyPublie: | https://publications.polymtl.ca/48689/ |
| Nom de la conférence: | 34th Conference on Neural Information Processing Systems (NeurIPS 2020) |
| Date(s) de la conférence: | 2020-12-06 - 2020-12-12 |
| Maison d'édition: | Neural Information Processing Systems Foundation |
| Date du dépôt: | 18 avr. 2023 15:01 |
| Dernière modification: | 25 sept. 2024 16:37 |
| Citer en APA 7: | Van Seijen, H., Nekoei, H., Racah, E., & Anbil Parthipan, S. C. (décembre 2020). The LoCA regret: A consistent metric to evaluate model-based behavior in reinforcement learning [Communication écrite]. 34th Conference on Neural Information Processing Systems (NeurIPS 2020). |
|---|---|
Statistiques
Aucune statistique n'est disponible.
