<  Retour au portail Polytechnique Montréal

TDprop: Does Adaptive Optimization With Jacobi Preconditioning Help Temporal Difference Learning?

Joshua Romoff, Peter Henderson, David Joel Sylvain Kanaa, Emmanuel Bengio, Ahmed Touati, Pierre-Luc Bacon et Joëlle Pineau

Communication écrite (2021)

Un lien externe est disponible pour ce document
Département: Département de génie informatique et génie logiciel
URL de PolyPublie: https://publications.polymtl.ca/78382/
Nom de la conférence: 20th International Conference on Autonomous Agents and Multiagent Systems (AAMAS 2021)
Date(s) de la conférence: 2021-05-03 - 2021
Maison d'édition: Association for Computing Machinery
DOI: 10.65109/mpbl3656
URL officielle: https://doi.org/10.65109/mpbl3656
Date du dépôt: 23 juin 2026 14:13
Dernière modification: 23 juin 2026 14:13
Citer en APA 7: Romoff, J., Henderson, P., Kanaa, D. J. S., Bengio, E., Touati, A., Bacon, P.-L., & Pineau, J. (mai 2021). TDprop: Does Adaptive Optimization With Jacobi Preconditioning Help Temporal Difference Learning? [Communication écrite]. 20th International Conference on Autonomous Agents and Multiagent Systems (AAMAS 2021). https://doi.org/10.65109/mpbl3656

Statistiques

Dimensions

Actions réservées au personnel

Afficher document Afficher document