Master's thesis (2020)
Open Access document in PolyPublie |
|
Open Access to the full text of this document Terms of Use: All rights reserved Download (2MB) |
Abstract
In this thesis, we tackle the Open Domain Question-Answering task, where the goal is to be able to answer a question using a knowledge source (either structured like DBpedia or unstructured such as Wikipedia). Specifically, our goal is to propose an open domain questionanswering system capable of answering factoid questions using Wikipedia as knowledge source. In general, these types of systems are divided in two sub-modules. The first one, responsible of the information retrieval step, enables the system to find relevant documents in its knowledge source. The second, the answer extraction module, extracts answer candidates from the previously selected documents and then determines the final answer within the candidates. In recent years, the progress achieved in the machine reading comprehension field has driven the development of improved answer extraction modules resulting in the creation of the best open domain question answering systems to date.
Résumé
Dans le présent mémoire, nous abordons la tâche de question-réponse dans le domaine ouvert, c'est-à-dire la tâche qui a pour but de répondre à une question en utilisant son corpus de connaissances (qu'il soit structuré ou non) comme seule ressource. Plus spécifiquement notre but est de proposer un système de question-réponse dans le domaine ouvert capable de répondre à des questions factuelles en utilisant Wikipédia comme corpus de connaissances. En général, ce genre de système se divise en deux modules. Le premier, responsable de la recherche d'information, permet de trouver des documents pertinents dans le corpus de connaissance. Le second, le module d'extraction de réponse, a pour objectif d'extraire des candidats de réponse provenant des documents précédemment sélectionnés puis de déterminer une réponse finale parmi les candidats. Dans les dernières années, les avancées dans le domaine de la compréhension de lecture automatique ont été une grande source d'inspiration pour le module d'extraction résultant en la création des systèmes de question-réponse dans le domaine ouvert les plus efficaces à ce jour.
Department: | Department of Computer Engineering and Software Engineering |
---|---|
Program: | Génie informatique |
Academic/Research Directors: | Amal Zouaq and Michel Gagnon |
PolyPublie URL: | https://publications.polymtl.ca/5396/ |
Institution: | Polytechnique Montréal |
Date Deposited: | 10 Nov 2020 11:10 |
Last Modified: | 29 Sep 2024 05:02 |
Cite in APA 7: | Farvacque, D. (2020). Re-BERT OQA : un système de question-réponse dans le domaine ouvert [Master's thesis, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/5396/ |
---|---|
Statistics
Total downloads
Downloads per month in the last year
Origin of downloads