< Retour au portail Polytechnique Montréal

Polytechnique Montréal

Se connecter

Categorical Distributional Reinforcement Learning with Kullback-Leibler Divergence: Convergence and Asymptotics

Tyler Kastner, Mark Rowland, Yunhao Tang, Murat A. Erdogdu et Amir-Massoud Farahmand

Communication écrite (2025)

Un lien externe est disponible pour ce document

Afficher le résumé

Cacher le résumé

Département:	Département de génie informatique et génie logiciel
URL de PolyPublie:	https://publications.polymtl.ca/76482/
Nom de la conférence:	42nd International Conference on Machine Learning (PMLR 2025)
Lieu de la conférence:	Vancouver, BC, Canada
Date(s) de la conférence:	2025-07-13 - 2025-07-19
Maison d'édition:	PMLR
URL officielle:	https://proceedings.mlr.press/v267/kastner25a.html
Date du dépôt:	12 mai 2026 11:13
Dernière modification:	12 mai 2026 11:13

Citer en APA 7:	Kastner, T., Rowland, M., Tang, Y., Erdogdu, M. A., & Farahmand, A.-M. (juillet 2025). Categorical Distributional Reinforcement Learning with Kullback-Leibler Divergence: Convergence and Asymptotics [Communication écrite]. 42nd International Conference on Machine Learning (PMLR 2025), Vancouver, BC, Canada. https://proceedings.mlr.press/v267/kastner25a.html

Statistiques

Aucune statistique n'est disponible.

Actions réservées au personnel

Afficher document

Afficher document

PolyPublie est le dépôt institutionnel de Polytechnique Montréal.
Site développé à l'aide du logiciel libre EPrints.