<  Back to the Polytechnique Montréal portal

Multilingual SPARQL Query Generation Using Lexico-Syntactic Patterns

Nikolay Radoev

Masters thesis (2019)

[img] Restricted to: Repository staff only until 12 June 2020.
Cite this document: Radoev, N. (2019). Multilingual SPARQL Query Generation Using Lexico-Syntactic Patterns (Masters thesis, Polytechnique Montréal). Retrieved from https://publications.polymtl.ca/3852/
Show abstract Hide abstract

Abstract

Le Web Semantique et les technologies qui s’y rattachent ont permis la création d’un grand nombre de données disponibles publiquement sous forme de bases de connaissances. Toutefois, ces données nécessitent un langage de requêtes SPARQL qui n’est pas maitrisé par tous les usagers. Pour faciliter le lien entre les bases de connaissances comme DBpedia destinées à être utilisées par des machines et les utilisateurs humains, plusieurs systèmes de question-réponse ont été développés. Le but de tels systèmes est de retrouver dans les bases de connaissances des réponses à des questions posées avec un minimum d’effort demandé de la part des utilisateurs. Cependant, plusieurs de ces systèmes ne permettent pas des expressions en langage naturel et imposent des restrictions spécifiques sur le format des questions. De plus, les systèmes monolingues, très souvent en anglais, sont beaucoup plus populaires que les systèmes multilingues qui ont des performances moindres. Le but de ce travail est de développer un système de question-réponse multilingue capable de prendre des questions exprimées en langage naturel et d’extraire la réponse d’une base de connaissance. Ceci est effectué en transformant automatiquement la question posée en requêtes SPARQL. Cette génération de requêtes repose sur des patrons lexico-syntaxiques qui exploitent la spécificité syntaxique de chaque langue.----------ABSTRACT: The continuous work on the Semantic Web and its related technologies for the past few decades has lead to large amounts of publicly available data and a better way to access it. To bridge the gap between human users and large knowledge bases, such as DBpedia, designed for machines, various QA systems have been developed. These systems aim to answer users’ questions as accurately as possible with as little effort possible from the user. However, not all systems allow for full natural language questions and impose additional restrictions on the user’s input. In addition, monolingual systems are much more prevalent in the field with English being widely used while other languages lack behind. The objective of this work is to propose a multilingual QA system able to take full natural language questions and to retrieve information from a knowledge base. This is done by transforming the user’s question automatically into a SPARQL query that is sent to DBpedia. This work relies, among other aspects, on a set of lexico-syntactic patterns that leverage the power of language-specific syntax to generate more accurate queries.

Open Access document in PolyPublie
Department: Département de génie informatique et génie logiciel
Dissertation/thesis director: Amal Zouaq and Michel Gagnon
Date Deposited: 12 Jun 2019 14:39
Last Modified: 04 Jul 2019 16:04
PolyPublie URL: https://publications.polymtl.ca/3852/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only