<  Retour au portail Polytechnique Montréal

Maximum reward formulation in reinforcement learning

Sai Krishna Gottipati, Yashaswi Pathak, Rohan Nuttall, Sahir, Raviteja Chunduru, Ahmed Touati, Sriram Ganapathi Subramanian, Matthew E. Taylor et Sarath Chandar Anbil Parthipan

Communication écrite (2020)

Un lien externe est disponible pour ce document
Département: Département de génie informatique et génie logiciel
URL de PolyPublie: https://publications.polymtl.ca/46904/
Nom de la conférence: 2020 NeurIPS Deep RL Workshop
Date(s) de la conférence: 2020-12-11
URL officielle: https://drive.google.com/file/d/1GFMiR1ZrsXqDZiF19...
Date du dépôt: 18 avr. 2023 15:00
Dernière modification: 25 sept. 2024 16:35
Citer en APA 7: Gottipati, S. K., Pathak, Y., Nuttall, R., Sahir, Chunduru, R., Touati, A., Subramanian, S. G., Taylor, M. E., & Anbil Parthipan, S. C. (décembre 2020). Maximum reward formulation in reinforcement learning [Communication écrite]. 2020 NeurIPS Deep RL Workshop (15 pages). https://drive.google.com/file/d/1GFMiR1ZrsXqDZiF19-As9FApUl4AaE4y/view?usp=sharing

Statistiques

Aucune statistique n'est disponible.

Actions réservées au personnel

Afficher document Afficher document