<  Retour au portail Polytechnique Montréal

MMLU-ProX: A Multilingual Benchmark for Advanced Large Language Model Evaluation

Weihao Xuan, Rui Yang, Heli Qi, Qingcheng Zeng, Yunze Xiao, Aosong Feng, Dairui Liu, Yun Xing, Junjue Wang, Jinghui Lu, Fan Gao, Yuang Jiang, Huitao Li, Xin Li, Kunyu Yu, Ruihai Dong, Shangding Gu, Yuekang Li, Xiaofei Xie, Felix Juefei-Xu, Foutse Khomh, Osamu Yoshie, Qingyu Chen, Douglas Teodoro, Nan Liu, Randy Goebel, Lei Ma, Edison Marrese-Taylor, Shijian Lu, Yusuke Iwasawa, Yutaka Matsuo et Irene Li

Communication écrite (2025)

Un lien externe est disponible pour ce document
Renseignements supplémentaires: https://mmluprox.github.io/
Département: Département de génie informatique et génie logiciel
URL de PolyPublie: https://publications.polymtl.ca/73878/
Nom de la conférence: Conference on Empirical Methods in Natural Language Processing (EMNLP 2025)
Lieu de la conférence: Suzhou, China
Date(s) de la conférence: 2025-11-04 - 2025-11-09
Maison d'édition: ACL
DOI: 10.18653/v1/2025.emnlp-main.79
URL officielle: https://doi.org/10.18653/v1/2025.emnlp-main.79
Date du dépôt: 17 mars 2026 15:36
Dernière modification: 17 mars 2026 15:36
Citer en APA 7: Xuan, W., Yang, R., Qi, H., Zeng, Q., Xiao, Y., Feng, A., Liu, D., Xing, Y., Wang, J., Lu, J., Gao, F., Jiang, Y., Li, H., Li, X., Yu, K., Dong, R., Gu, S., Li, Y., Xie, X., ... Li, I. (novembre 2025). MMLU-ProX: A Multilingual Benchmark for Advanced Large Language Model Evaluation [Communication écrite]. Conference on Empirical Methods in Natural Language Processing (EMNLP 2025), Suzhou, China. https://doi.org/10.18653/v1/2025.emnlp-main.79

Statistiques

Dimensions

Actions réservées au personnel

Afficher document Afficher document