<  Back to the Polytechnique Montréal portal

Inférence du niveau d’expertise d’un auteur basée sur un corpus de textes avec une extension du Latent Dirichlet Allocation

Mikaël Perreault

Masters thesis (2021)

[img] Terms of Use: All rights reserved.
Restricted to: Repository staff only until 14 July 2022.
Cite this document: Perreault, M. (2021). Inférence du niveau d’expertise d’un auteur basée sur un corpus de textes avec une extension du Latent Dirichlet Allocation (Masters thesis, Polytechnique Montréal). Retrieved from https://publications.polymtl.ca/6570/
Show abstract Hide abstract

Abstract

RÉSUMÉ : L’inférence de l’expertise est une tâche fortement prisée dans le domaine de la modélisation textuelle. Plusieurs applications en découlent, que ce soit dans les sphères de l’éducation, de la revue d’articles scientifiques, de l’informatique, de la traduction ou de la gestion d’entreprise. Par exemple, si on possédait une connaissance accrue de l’expertise des auteurs d’articles scientifiques, il serait possible d’attribuer des réviseurs plus appropriés à des articles lors des conférences. Or, les méthodes actuelles pour inférer l’expertise des auteurs ne se reposent que sur des co-occurrences entre une requête spécifiée d’avance et les données textuelles de ces auteurs. Ces approches sont très limitantes, puisqu’elles permettent seulement de déterminer la puissance du lien entre un expert potentiel et une requête connue plutôt que de dégager une compréhension intelligente du niveau d’expertise général sur plusieurs sujets. De plus, des algorithmes de modélisation textuelle existent pour dégager les sujets présents dans un corpus donné. Ces sujets sont toutefois unidimensionnels, en ce sens qu’ils ne sont pas caractérisés par un niveau de profondeur.----------ABSTRACT : Expertise inference is a highly valued task in the field of textual modeling. It has many applications in the fields of education, scientific article review, computer science, translation and business management. For example, if we had a better knowledge of the expertise of the authors of scientific articles, it would be possible to assign more appropriate reviewers to articles at conferences. However, current methods for inferring the expertise of authors rely only on co-occurrences between a pre-specified query and the textual data of these authors. These approaches are very limiting, since they only allow to determine the strength of the link between a potential expert and a known query rather than to provide an intelligent understanding of the general level of expertise on several topics. Moreover, textual modeling algorithms exist to identify the topics present in a given corpus. However, these topics are one-dimensional, in the sense that they are not characterized by a level of depth.

Open Access document in PolyPublie
Department: Département de génie informatique et génie logiciel
Academic/Research Directors: Michel Desmarais
Date Deposited: 14 Jul 2021 13:31
Last Modified: 14 Jul 2021 13:31
PolyPublie URL: https://publications.polymtl.ca/6570/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only