<  Retour au portail Polytechnique Montréal

The LoCA regret: A consistent metric to evaluate model-based behavior in reinforcement learning

Harm Van Seijen, Hadi Nekoei, Evan Racah et Sarath Chandar Anbil Parthipan

Communication écrite (2020)

Ce document n'est pas archivé dans PolyPublie
Département: Département de génie informatique et génie logiciel
URL de PolyPublie: https://publications.polymtl.ca/48689/
Nom de la conférence: 34th Conference on Neural Information Processing Systems (NeurIPS 2020)
Date(s) de la conférence: 2020-12-06 - 2020-12-12
Maison d'édition: Neural Information Processing Systems Foundation
Date du dépôt: 18 avr. 2023 15:01
Dernière modification: 05 avr. 2024 11:50
Citer en APA 7: Van Seijen, H., Nekoei, H., Racah, E., & Anbil Parthipan, S. C. (décembre 2020). The LoCA regret: A consistent metric to evaluate model-based behavior in reinforcement learning [Communication écrite]. 34th Conference on Neural Information Processing Systems (NeurIPS 2020).

Statistiques

Aucune statistique n'est disponible.

Actions réservées au personnel

Afficher document Afficher document