<  Retour au portail Polytechnique Montréal

Documents dont l'auteur est "Ghavamzadeh, Mohammad"

Monter d'un niveau
Pour citer ou exporter [feed] Atom [feed] RSS 1.0 [feed] RSS 2.0
Grouper par: Auteurs ou autrices | Date de publication | Sous-type de document | Aucun groupement
Aller à : F | R
Nombre de documents: 8

F

Farahmand, A.-M., Ghavamzadeh, M., Szepesvari, C., & Mannor, S. (2016). Regularized policy iteration with non parametric function spaces. Journal of Machine Learning Research, 17(139), 66 pages. Lien externe

Farahmand, A.-M., Precup, D., Barreto, A. M., & Ghavamzadeh, M. (2015). Classification-Based Approximate Policy Iteration. IEEE Transactions on Automatic Control, 60(11), 2989-2993. Lien externe

Farahmand, A.-M., Precup, D., Barreto, A. M. S., & Ghavamzadeh, M. (octobre 2013). CAPI : generalized classification-based approximate policy iteration [Communication écrite]. Multi-Disciplinary Conference on Reinforcement Learning and Decision Making (RLDM 2013), Princeton, NJ, USA. Non disponible

Farahmand, A.-M., Ghavamzadeh, M., Szepesvári, C., & Mannor, S. (juin 2009). Regularized Fitted Q-Iteration for planning in continuous-space Markovian decision problems [Communication écrite]. American Control Conference (ACC 2009), St. Louis, MO, USA. Lien externe

Farahmand, A.-M., Ghavamzadeh, M., Szepesvári, C., & Mannor, S. (juin 2008). Regularized Fitted Q-Iteration: Application to Planning [Communication écrite]. 8th European Workshop on Recent Advances in Reinforcement Learning (EWRL 2008), Villeneuve d'Ascq, France. Lien externe

Farahmand, A.-M., Ghavamzadeh, M., Szepesvari, C., & Mannor, S. (décembre 2008). Regularized policy iteration [Communication écrite]. 22th annual Conference on Neural Information Processing Systems (NeurIPS 2008), Vancouver, CB, Canada (8 pages). Lien externe

R

Rakhsha, A., Kemertas, M., Ghavamzadeh, M., & Farahmand, A.-M. (mai 2024). Maximum entropy model correction in reinforcement learning [Présentation]. Dans 12th International Conference on Learning Representations (ICLR 2024), Vienna, Austria. Lien externe

Rakhsha, A., Wang, A., Ghavamzadeh, M., & Farahmand, A.-M. (décembre 2022). Operator splitting value iteration [Présentation]. Dans 37th annual Conference on Neural Information Processing Systems (NeurIPS 2022), New Orleans, Louisiana, USA (13 pages). Lien externe

Liste produite: Sat Dec 6 04:30:33 2025 EST.