João Monteiro, Étienne Marcotte, Pierre-André Noël, Valentina Zantedeschi, David Vázquez, Nicolas Chapados, Christopher J. Pal et Perouz Taslakian
Communication écrite (2024)
Un lien externe est disponible pour ce document| Département: | Département de génie informatique et génie logiciel |
|---|---|
| URL de PolyPublie: | https://publications.polymtl.ca/74682/ |
| Nom de la conférence: | Findings of the Association for Computational Linguistics (ACL 2024) |
| Lieu de la conférence: | Miami, FL, USA |
| Date(s) de la conférence: | 2024-11-12 - 2024-11-16 |
| Maison d'édition: | Association for Computational Linguistics |
| DOI: | 10.18653/v1/2024.findings-emnlp.896 |
| URL officielle: | https://doi.org/10.18653/v1/2024.findings-emnlp.89... |
| Date du dépôt: | 10 avr. 2026 10:20 |
| Dernière modification: | 10 avr. 2026 10:20 |
| Citer en APA 7: | Monteiro, J., Marcotte, É., Noël, P.-A., Zantedeschi, V., Vázquez, D., Chapados, N., Pal, C. J., & Taslakian, P. (novembre 2024). XC-Cache: Cross-Attending to Cached Context for Efficient LLM Inference [Communication écrite]. Findings of the Association for Computational Linguistics (ACL 2024), Miami, FL, USA. https://doi.org/10.18653/v1/2024.findings-emnlp.896 |
|---|---|
Statistiques
Dimensions
