<  Retour au portail Polytechnique Montréal

Categorical Distributional Reinforcement Learning with Kullback-Leibler Divergence: Convergence and Asymptotics

Tyler Kastner, Mark Rowland, Yunhao Tang, Murat A. Erdogdu et Amir-Massoud Farahmand

Communication écrite (2025)

Un lien externe est disponible pour ce document
Département: Département de génie informatique et génie logiciel
URL de PolyPublie: https://publications.polymtl.ca/76482/
Nom de la conférence: 42nd International Conference on Machine Learning (PMLR 2025)
Lieu de la conférence: Vancouver, BC, Canada
Date(s) de la conférence: 2025-07-13 - 2025-07-19
Maison d'édition: PMLR
URL officielle: https://proceedings.mlr.press/v267/kastner25a.html
Date du dépôt: 12 mai 2026 11:13
Dernière modification: 12 mai 2026 11:13
Citer en APA 7: Kastner, T., Rowland, M., Tang, Y., Erdogdu, M. A., & Farahmand, A.-M. (juillet 2025). Categorical Distributional Reinforcement Learning with Kullback-Leibler Divergence: Convergence and Asymptotics [Communication écrite]. 42nd International Conference on Machine Learning (PMLR 2025), Vancouver, BC, Canada. https://proceedings.mlr.press/v267/kastner25a.html

Statistiques

Aucune statistique n'est disponible.

Actions réservées au personnel

Afficher document Afficher document