<  Back to the Polytechnique Montréal portal

Re-BERT OQA : un système de question-réponse dans le domaine ouvert

Dylan Farvacque

Masters thesis (2020)

[img] Terms of Use: All rights reserved.
Restricted to: Repository staff only until 10 November 2021.
Cite this document: Farvacque, D. (2020). Re-BERT OQA : un système de question-réponse dans le domaine ouvert (Masters thesis, Polytechnique Montréal). Retrieved from https://publications.polymtl.ca/5396/
Show abstract Hide abstract

Abstract

RÉSUMÉ : Dans le présent mémoire, nous abordons la tâche de question-réponse dans le domaine ouvert, c’est-à-dire la tâche qui a pour but de répondre à une question en utilisant son corpus de connaissances (qu’il soit structuré ou non) comme seule ressource. Plus spécifiquement notre but est de proposer un système de question-réponse dans le domaine ouvert capable de répondre à des questions factuelles en utilisant Wikipédia comme corpus de connaissances. En général, ce genre de système se divise en deux modules. Le premier, responsable de la recherche d’information, permet de trouver des documents pertinents dans le corpus de connaissance. Le second, le module d’extraction de réponse, a pour objectif d’extraire des candidats de réponse provenant des documents précédemment sélectionnés puis de déterminer une réponse finale parmi les candidats. Dans les dernières années, les avancées dans le domaine de la compréhension de lecture automatique ont été une grande source d’inspiration pour le module d’extraction résultant en la création des systèmes de question-réponse dans le domaine ouvert les plus efficaces à ce jour.----------ABSTRACT : In this thesis, we tackle the Open Domain Question-Answering task, where the goal is to be able to answer a question using a knowledge source (either structured like DBpedia or unstructured such as Wikipedia). Specifically, our goal is to propose an open domain questionanswering system capable of answering factoid questions using Wikipedia as knowledge source. In general, these types of systems are divided in two sub-modules. The first one, responsible of the information retrieval step, enables the system to find relevant documents in its knowledge source. The second, the answer extraction module, extracts answer candidates from the previously selected documents and then determines the final answer within the candidates. In recent years, the progress achieved in the machine reading comprehension field has driven the development of improved answer extraction modules resulting in the creation of the best open domain question answering systems to date.

Open Access document in PolyPublie
Department: Département de génie informatique et génie logiciel
Academic/Research Directors: Amal Zouaq and Michel Gagnon
Date Deposited: 10 Nov 2020 11:10
Last Modified: 10 Nov 2020 11:10
PolyPublie URL: https://publications.polymtl.ca/5396/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only