<  Retour au portail Polytechnique Montréal

Re-BERT OQA : un système de question-réponse dans le domaine ouvert

Dylan Farvacque

Mémoire de maîtrise (2020)

Document en libre accès dans PolyPublie
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Conditions d'utilisation: Tous droits réservés
Télécharger (2MB)
Afficher le résumé
Cacher le résumé

Résumé

Dans le présent mémoire, nous abordons la tâche de question-réponse dans le domaine ouvert, c'est-à-dire la tâche qui a pour but de répondre à une question en utilisant son corpus de connaissances (qu'il soit structuré ou non) comme seule ressource. Plus spécifiquement notre but est de proposer un système de question-réponse dans le domaine ouvert capable de répondre à des questions factuelles en utilisant Wikipédia comme corpus de connaissances. En général, ce genre de système se divise en deux modules. Le premier, responsable de la recherche d'information, permet de trouver des documents pertinents dans le corpus de connaissance. Le second, le module d'extraction de réponse, a pour objectif d'extraire des candidats de réponse provenant des documents précédemment sélectionnés puis de déterminer une réponse finale parmi les candidats. Dans les dernières années, les avancées dans le domaine de la compréhension de lecture automatique ont été une grande source d'inspiration pour le module d'extraction résultant en la création des systèmes de question-réponse dans le domaine ouvert les plus efficaces à ce jour.

Abstract

In this thesis, we tackle the Open Domain Question-Answering task, where the goal is to be able to answer a question using a knowledge source (either structured like DBpedia or unstructured such as Wikipedia). Specifically, our goal is to propose an open domain questionanswering system capable of answering factoid questions using Wikipedia as knowledge source. In general, these types of systems are divided in two sub-modules. The first one, responsible of the information retrieval step, enables the system to find relevant documents in its knowledge source. The second, the answer extraction module, extracts answer candidates from the previously selected documents and then determines the final answer within the candidates. In recent years, the progress achieved in the machine reading comprehension field has driven the development of improved answer extraction modules resulting in the creation of the best open domain question answering systems to date.

Département: Département de génie informatique et génie logiciel
Programme: Génie informatique
Directeurs ou directrices: Amal Zouaq et Michel Gagnon
URL de PolyPublie: https://publications.polymtl.ca/5396/
Université/École: Polytechnique Montréal
Date du dépôt: 10 nov. 2020 11:10
Dernière modification: 08 avr. 2024 05:04
Citer en APA 7: Farvacque, D. (2020). Re-BERT OQA : un système de question-réponse dans le domaine ouvert [Mémoire de maîtrise, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/5396/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel

Afficher document Afficher document