Sai Krishna Gottipati, Yashaswi Pathak, Rohan Nuttall, Sahir, Raviteja Chunduru, Ahmed Touati, Sriram Ganapathi Subramanian, Matthew E. Taylor et Sarath Chandar Anbil Parthipan
Communication écrite (2020)
Un lien externe est disponible pour ce documentDépartement: | Département de génie informatique et génie logiciel |
---|---|
URL de PolyPublie: | https://publications.polymtl.ca/46904/ |
Nom de la conférence: | 2020 NeurIPS Deep RL Workshop |
Date(s) de la conférence: | 2020-12-11 |
URL officielle: | https://drive.google.com/file/d/1GFMiR1ZrsXqDZiF19... |
Date du dépôt: | 18 avr. 2023 15:00 |
Dernière modification: | 25 sept. 2024 16:35 |
Citer en APA 7: | Gottipati, S. K., Pathak, Y., Nuttall, R., Sahir, Chunduru, R., Touati, A., Subramanian, S. G., Taylor, M. E., & Anbil Parthipan, S. C. (décembre 2020). Maximum reward formulation in reinforcement learning [Communication écrite]. 2020 NeurIPS Deep RL Workshop (15 pages). https://drive.google.com/file/d/1GFMiR1ZrsXqDZiF19-As9FApUl4AaE4y/view?usp=sharing |
---|---|
Statistiques
Aucune statistique n'est disponible.