< Retour au portail Polytechnique Montréal

Polytechnique Montréal

No train no gain: revisiting efficient training algorithms for transformer-based language models

Jean Kaddour, Oscar Key, Piotr Nawrot, Pasquale Minervini et Matt J. Kusner

Communication écrite (2023)

Document publié alors que les auteurs ou autrices n'étaient pas affiliés à Polytechnique Montréal

Un lien externe est disponible pour ce document

URL de PolyPublie:	https://publications.polymtl.ca/65852/
Nom de la conférence:	37th Conference on Neural Information Processing Systems (NeurIPS 2023)
Lieu de la conférence:	New Orleans, LA, USA
Date(s) de la conférence:	2023-12-10 - 2023-12-16
Maison d'édition:	Neural Information Processing Systems Foundation, Inc. (NeurIPS)
DOI:	10.5555/3666122.3667244
URL officielle:	https://dl.acm.org/doi/10.5555/3666122.3667244
Date du dépôt:	30 mai 2025 10:10
Dernière modification:	12 mars 2026 12:11

Citer en APA 7:	Kaddour, J., Key, O., Nawrot, P., Minervini, P., & Kusner, M. J. (décembre 2023). No train no gain: revisiting efficient training algorithms for transformer-based language models [Communication écrite]. 37th Conference on Neural Information Processing Systems (NeurIPS 2023), New Orleans, LA, USA. https://dl.acm.org/doi/10.5555/3666122.3667244

Statistiques

Dimensions

Actions réservées au personnel

Afficher document

Afficher document

PolyPublie est le dépôt institutionnel de Polytechnique Montréal.
Site développé à l'aide du logiciel libre EPrints.