![]() | Monter d'un niveau |
Bedaywi, M., Rakhsha, A., & Farahmand, A.-M. (août 2024). PID accelerated temporal difference algorithms [Communication écrite]. Reinforcement Learning Conference (RLC 2024), Amherst, Massachusetts, USA (25 pages). Lien externe
Rakhsha, A., Kemertas, M., Ghavamzadeh, M., & Farahmand, A.-M. (mai 2024). Maximum entropy model correction in reinforcement learning [Présentation]. Dans 12th International Conference on Learning Representations (ICLR 2024), Vienna, Austria. Lien externe