<  Retour au portail Polytechnique Montréal

Documents dont l'auteur est "Riemer, Matthew"

Monter d'un niveau
Pour citer ou exporter [feed] Atom [feed] RSS 1.0 [feed] RSS 2.0
Grouper par: Auteurs ou autrices | Date de publication | Sous-type de document | Aucun groupement
Nombre de documents: 3

Communication écrite

Thakkar, M., Fournier, Q., Riemer, M., Chen, P.-Y., Zouaq, A., Das, P., & Anbil Parthipan, S. C. (juillet 2025). Combining Domain and Alignment Vectors Provides Better Knowledge-Safety Trade-offs in LLMs [Communication écrite]. 63rd Annual Meeting of the Association for Computational Linguistics (ACL 2025), Vienna, Austria. Lien externe

Anbil Parthipan, S. C., Khetarpal, K., Rajendran, J., & Riemer, M. (décembre 2024). Balancing Context Length and Mixing Times for Reinforcement Learning at Scale [Communication écrite]. 38th Conference on Neural Information Processing Systems (NeurIPS 2024), Vancouver, BC, Canada. Lien externe

Thakkar, M., Fournier, Q., Riemer, M., Chen, P.-Y., Zouaq, A., Das, P., & Anbil Parthipan, S. C. (août 2024). A Deep Dive into the Trade-Offs of Parameter-Efficient Preference Alignment Techniques [Communication écrite]. 62nd Annual Meeting of the Association for Computational Linguistics (ACL 2024), Hybrid, Bangkok, Thailand. Lien externe

Liste produite: Wed Apr 29 05:27:05 2026 EDT.