<  Back to the Polytechnique Montréal portal

Multilingual SPARQL Query Generation Using Lexico-Syntactic Patterns

Nikolay Radoev

Master's thesis (2019)

Open Access document in PolyPublie
Open Access to the full text of this document
Terms of Use: All rights reserved
Download (888kB)
Show abstract
Hide abstract


The continuous work on the Semantic Web and its related technologies for the past few decades has lead to large amounts of publicly available data and a better way to access it. To bridge the gap between human users and large knowledge bases, such as DBpedia, designed for machines, various QA systems have been developed. These systems aim to answer users' questions as accurately as possible with as little effort possible from the user. However, not all systems allow for full natural language questions and impose additional restrictions on the user's input. In addition, monolingual systems are much more prevalent in the field with English being widely used while other languages lack behind. The objective of this work is to propose a multilingual QA system able to take full natural language questions and to retrieve information from a knowledge base. This is done by transforming the user's question automatically into a SPARQL query that is sent to DBpedia. This work relies, among other aspects, on a set of lexico-syntactic patterns that leverage the power of language-specific syntax to generate more accurate queries.


Le Web Semantique et les technologies qui s'y rattachent ont permis la création d'un grand nombre de données disponibles publiquement sous forme de bases de connaissances. Toutefois, ces données nécessitent un langage de requêtes SPARQL qui n'est pas maitrisé par tous les usagers. Pour faciliter le lien entre les bases de connaissances comme DBpedia destinées à être utilisées par des machines et les utilisateurs humains, plusieurs systèmes de question-réponse ont été développés. Le but de tels systèmes est de retrouver dans les bases de connaissances des réponses à des questions posées avec un minimum d'effort demandé de la part des utilisateurs. Cependant, plusieurs de ces systèmes ne permettent pas des expressions en langage naturel et imposent des restrictions spécifiques sur le format des questions. De plus, les systèmes monolingues, très souvent en anglais, sont beaucoup plus populaires que les systèmes multilingues qui ont des performances moindres. Le but de ce travail est de développer un système de question-réponse multilingue capable de prendre des questions exprimées en langage naturel et d'extraire la réponse d'une base de connaissance. Ceci est effectué en transformant automatiquement la question posée en requêtes SPARQL. Cette génération de requêtes repose sur des patrons lexico-syntaxiques qui exploitent la spécificité syntaxique de chaque langue.

Department: Department of Computer Engineering and Software Engineering
Program: Génie informatique
Academic/Research Directors: Amal Zouaq and Michel Gagnon
PolyPublie URL: https://publications.polymtl.ca/3852/
Institution: Polytechnique Montréal
Date Deposited: 12 Jun 2019 14:39
Last Modified: 22 Apr 2023 22:03
Cite in APA 7: Radoev, N. (2019). Multilingual SPARQL Query Generation Using Lexico-Syntactic Patterns [Master's thesis, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/3852/


Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only

View Item View Item