<  Retour au portail Polytechnique Montréal

XC-Cache: Cross-Attending to Cached Context for Efficient LLM Inference

João Monteiro, Étienne Marcotte, Pierre-André Noël, Valentina Zantedeschi, David Vázquez, Nicolas Chapados, Christopher J. Pal et Perouz Taslakian

Communication écrite (2024)

Un lien externe est disponible pour ce document
Département: Département de génie informatique et génie logiciel
URL de PolyPublie: https://publications.polymtl.ca/74682/
Nom de la conférence: Findings of the Association for Computational Linguistics (ACL 2024)
Lieu de la conférence: Miami, FL, USA
Date(s) de la conférence: 2024-11-12 - 2024-11-16
Maison d'édition: Association for Computational Linguistics
DOI: 10.18653/v1/2024.findings-emnlp.896
URL officielle: https://doi.org/10.18653/v1/2024.findings-emnlp.89...
Date du dépôt: 10 avr. 2026 10:20
Dernière modification: 10 avr. 2026 10:20
Citer en APA 7: Monteiro, J., Marcotte, É., Noël, P.-A., Zantedeschi, V., Vázquez, D., Chapados, N., Pal, C. J., & Taslakian, P. (novembre 2024). XC-Cache: Cross-Attending to Cached Context for Efficient LLM Inference [Communication écrite]. Findings of the Association for Computational Linguistics (ACL 2024), Miami, FL, USA. https://doi.org/10.18653/v1/2024.findings-emnlp.896

Statistiques

Dimensions

Actions réservées au personnel

Afficher document Afficher document