<  Back to the Polytechnique Montréal portal

Inférence du niveau d'expertise d'un auteur basée sur un corpus de textes avec une extension du Latent Dirichlet Allocation

Mikaël Perreault

Master's thesis (2021)

Open Access document in PolyPublie
[img]
Preview
Open Access to the full text of this document
Terms of Use: All rights reserved
Download (3MB)
Show abstract
Hide abstract

Abstract

Expertise inference is a highly valued task in the field of textual modeling. It has many applications in the fields of education, scientific article review, computer science, translation and business management. For example, if we had a better knowledge of the expertise of the authors of scientific articles, it would be possible to assign more appropriate reviewers to articles at conferences. However, current methods for inferring the expertise of authors rely only on co-occurrences between a pre-specified query and the textual data of these authors. These approaches are very limiting, since they only allow to determine the strength of the link between a potential expert and a known query rather than to provide an intelligent understanding of the general level of expertise on several topics. Moreover, textual modeling algorithms exist to identify the topics present in a given corpus. However, these topics are one-dimensional, in the sense that they are not characterized by a level of depth.

Résumé

L'inférence de l'expertise est une tâche fortement prisée dans le domaine de la modélisation textuelle. Plusieurs applications en découlent, que ce soit dans les sphères de l'éducation, de la revue d'articles scientifiques, de l'informatique, de la traduction ou de la gestion d'entreprise. Par exemple, si on possédait une connaissance accrue de l'expertise des auteurs d'articles scientifiques, il serait possible d'attribuer des réviseurs plus appropriés à des articles lors des conférences. Or, les méthodes actuelles pour inférer l'expertise des auteurs ne se reposent que sur des co-occurrences entre une requête spécifiée d'avance et les données textuelles de ces auteurs. Ces approches sont très limitantes, puisqu'elles permettent seulement de déterminer la puissance du lien entre un expert potentiel et une requête connue plutôt que de dégager une compréhension intelligente du niveau d'expertise général sur plusieurs sujets. De plus, des algorithmes de modélisation textuelle existent pour dégager les sujets présents dans un corpus donné. Ces sujets sont toutefois unidimensionnels, en ce sens qu'ils ne sont pas caractérisés par un niveau de profondeur.

Department: Department of Computer Engineering and Software Engineering
Program: Génie informatique
Academic/Research Directors: Michel C. Desmarais
PolyPublie URL: https://publications.polymtl.ca/6570/
Institution: Polytechnique Montréal
Date Deposited: 14 Jul 2021 13:31
Last Modified: 08 Apr 2024 09:25
Cite in APA 7: Perreault, M. (2021). Inférence du niveau d'expertise d'un auteur basée sur un corpus de textes avec une extension du Latent Dirichlet Allocation [Master's thesis, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/6570/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only

View Item View Item