<  Retour au portail Polytechnique Montréal

Inférence du niveau d'expertise d'un auteur basée sur un corpus de textes avec une extension du Latent Dirichlet Allocation

Mikaël Perreault

Mémoire de maîtrise (2021)

Document en libre accès dans PolyPublie
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Conditions d'utilisation: Tous droits réservés
Télécharger (3MB)
Afficher le résumé
Cacher le résumé

Résumé

L'inférence de l'expertise est une tâche fortement prisée dans le domaine de la modélisation textuelle. Plusieurs applications en découlent, que ce soit dans les sphères de l'éducation, de la revue d'articles scientifiques, de l'informatique, de la traduction ou de la gestion d'entreprise. Par exemple, si on possédait une connaissance accrue de l'expertise des auteurs d'articles scientifiques, il serait possible d'attribuer des réviseurs plus appropriés à des articles lors des conférences. Or, les méthodes actuelles pour inférer l'expertise des auteurs ne se reposent que sur des co-occurrences entre une requête spécifiée d'avance et les données textuelles de ces auteurs. Ces approches sont très limitantes, puisqu'elles permettent seulement de déterminer la puissance du lien entre un expert potentiel et une requête connue plutôt que de dégager une compréhension intelligente du niveau d'expertise général sur plusieurs sujets. De plus, des algorithmes de modélisation textuelle existent pour dégager les sujets présents dans un corpus donné. Ces sujets sont toutefois unidimensionnels, en ce sens qu'ils ne sont pas caractérisés par un niveau de profondeur.

Abstract

Expertise inference is a highly valued task in the field of textual modeling. It has many applications in the fields of education, scientific article review, computer science, translation and business management. For example, if we had a better knowledge of the expertise of the authors of scientific articles, it would be possible to assign more appropriate reviewers to articles at conferences. However, current methods for inferring the expertise of authors rely only on co-occurrences between a pre-specified query and the textual data of these authors. These approaches are very limiting, since they only allow to determine the strength of the link between a potential expert and a known query rather than to provide an intelligent understanding of the general level of expertise on several topics. Moreover, textual modeling algorithms exist to identify the topics present in a given corpus. However, these topics are one-dimensional, in the sense that they are not characterized by a level of depth.

Département: Département de génie informatique et génie logiciel
Programme: Génie informatique
Directeurs ou directrices: Michel C. Desmarais
URL de PolyPublie: https://publications.polymtl.ca/6570/
Université/École: Polytechnique Montréal
Date du dépôt: 14 juil. 2021 13:31
Dernière modification: 27 sept. 2024 15:25
Citer en APA 7: Perreault, M. (2021). Inférence du niveau d'expertise d'un auteur basée sur un corpus de textes avec une extension du Latent Dirichlet Allocation [Mémoire de maîtrise, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/6570/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel

Afficher document Afficher document