<  Retour au portail Polytechnique Montréal

Dissecting Deep RL with high update ratios : combatting value divergence

Marcel Hussing, Claas A. Voelcker, Igor Gilitschenski, Amir-Massoud Farahmand et Eric Eaton

Communication écrite (2024)

Un lien externe est disponible pour ce document
Département: Département de génie informatique et génie logiciel
URL de PolyPublie: https://publications.polymtl.ca/63160/
Nom de la conférence: Reinforcement Learning Conference (RLC 2024)
Lieu de la conférence: Amherst, Massachusetts, USA
Date(s) de la conférence: 2024-08-09 - 2024-08-12
URL officielle: https://openreview.net/forum?id=ofwv9VYp3h
Date du dépôt: 03 mars 2025 18:46
Dernière modification: 03 mars 2025 18:57
Citer en APA 7: Hussing, M., Voelcker, C. A., Gilitschenski, I., Farahmand, A.-M., & Eaton, E. (août 2024). Dissecting Deep RL with high update ratios : combatting value divergence [Communication écrite]. Reinforcement Learning Conference (RLC 2024), Amherst, Massachusetts, USA (24 pages). https://openreview.net/forum?id=ofwv9VYp3h

Statistiques

Aucune statistique n'est disponible.

Actions réservées au personnel

Afficher document Afficher document