<  Retour au portail Polytechnique Montréal

Context-Aware Assistant Selection for Improved Inference Acceleration with Large Language Models

Jerry Huang, Prasanna Parthasarathi, Mehdi Rezagholizadeh et Sarath Chandar Anbil Parthipan

Communication écrite (2024)

Un lien externe est disponible pour ce document
Département: Département de génie informatique et génie logiciel
URL de PolyPublie: https://publications.polymtl.ca/65059/
Nom de la conférence: Conference on Empirical Methods in Natural Language Processing
Lieu de la conférence: Miami, Florida, USA
Date(s) de la conférence: 2024-11-12 - 2024-11-16
Maison d'édition: Association for Computational Linguistics
DOI: 10.18653/v1/2024.emnlp-main.332
URL officielle: https://doi.org/10.18653/v1/2024.emnlp-main.332
Date du dépôt: 09 mai 2025 09:33
Dernière modification: 09 mai 2025 09:33
Citer en APA 7: Huang, J., Parthasarathi, P., Rezagholizadeh, M., & Anbil Parthipan, S. C. (novembre 2024). Context-Aware Assistant Selection for Improved Inference Acceleration with Large Language Models [Communication écrite]. Conference on Empirical Methods in Natural Language Processing, Miami, Florida, USA. https://doi.org/10.18653/v1/2024.emnlp-main.332

Statistiques

Dimensions

Actions réservées au personnel

Afficher document Afficher document