<  Retour au portail Polytechnique Montréal

SEQ-VCR : preventing collapse in intermediate transformer representations for enhanced reasoning

Md. Rifat Arefin, Gopeshh Subbaraj, Nicolas Gontier, Yann LeCun, Irina Rish, Ravid Shwartz-Ziv et Christopher J. Pal

Communication écrite (2025)

Document en libre accès chez l'éditeur officiel
Un lien externe est disponible pour ce document
Renseignements supplémentaires: Scripts : https://github.com/rarefin/SEQ_VCR/blob/main/README.md
Département: Département de génie informatique et génie logiciel
URL de PolyPublie: https://publications.polymtl.ca/66812/
Nom de la conférence: 13th International Conference on Learning Representations (ICLR 2025)
Lieu de la conférence: Singapore, Singapore
Date(s) de la conférence: 2025-04-24 - 2025-04-28
URL officielle: https://proceedings.iclr.cc/paper_files/paper/2025...
Date du dépôt: 28 juil. 2025 15:22
Dernière modification: 28 juil. 2025 15:35
Citer en APA 7: Rifat Arefin, M., Subbaraj, G., Gontier, N., LeCun, Y., Rish, I., Shwartz-Ziv, R., & Pal, C. J. (avril 2025). SEQ-VCR : preventing collapse in intermediate transformer representations for enhanced reasoning [Communication écrite]. 13th International Conference on Learning Representations (ICLR 2025), Singapore, Singapore. https://proceedings.iclr.cc/paper_files/paper/2025/hash/b577c062bd4f894b7e05fab6440373ed-Abstract-Conference.html

Statistiques

Aucune statistique n'est disponible.

Actions réservées au personnel

Afficher document Afficher document