Master's thesis (2020)
Open Access document in PolyPublie |
|
Open Access to the full text of this document Terms of Use: All rights reserved Download (1MB) |
Abstract
Knowledge graphs are the backbone of the Semantic Web, and have been succesfully applied to a wide range of areas. Many of these graphs are built automatically or collaboratively,and aggregate data from various sources. In these conditions, automatically creating and updating a taxonomy that accurately reflects the content of a graph is an important issue. However, among scalable taxonomy extraction approaches, most of them can only extract a hierarchy on existing classes, and are unable to identify new classes from the data. In this thesis, we propose a novel taxonomy extraction method based on knowledge graph embeddings that is both scalable and expressive. A knowledge graph embedding model provides a dense, low-dimensional vector representation of the entities of a graph, such that similar entities in the graph are embedded close to each other in the embedding space.Our goal is to show how these graph embeddings can be combined with unsupervised hierarchical clustering to extract a taxonomy from a graph. We first show that unsupervised clustering is able to extract a taxonomy on existing classes. Then, we show that it can also be used to identify new classes and organize them hierarchically, thus creating an expressive taxonomy
Résumé
Les graphes de connaissances jouent aujourd'hui un rôle important pour représenter et stocker des données, bien au-delà du Web sémantique ; beaucoup d'entre eux sont obtenus de manière automatique ou collaborative, et agrègent des données issues de sources diverses. Dans ces conditions, la création et la mise à jour automatique d'une taxonomie qui reflète le contenu d'un graphe est un enjeu crucial.Or, la plupart des méthodes d'extraction taxonomique adaptées aux graphes de grande taille se contentent de hiérarchiser des classes pré-existantes, et sont incapables d'identifier de nouvelles classes à partir des données. Dans ce mémoire, nous proposons une méthode d'extraction de taxonomie expressive applicable à grande échelle, grâce à l'utilisation de plongements vectoriels. Les modèles de plongement vectoriel de graphe fournissent une représentation vectorielle dense des éléments d'un graphe, qui intègre sous forme géométrique les régularités des données : ainsi, deux éléments sémantiquement proches dans le graphe auront des plongements vectoriels géométriquement proches.Notre but est de démontrer le potentiel du regroupement hiérarchique non-supervisé appliqué aux plongements vectoriels sur la tâche d'extraction de taxonomie. Pour cela, nous procédons en deux étapes : nous montrons d'abord qu'un tel regroupement est capable d'extraire une taxonomie sur les classes existantes, puis qu'il permet de surcroît d'identifier de nouvelles classes et de les organiser hiérarchiquement, c'est-à-dire d'extraire une taxonomie expressive.
Department: | Department of Computer Engineering and Software Engineering |
---|---|
Program: | Génie informatique |
Academic/Research Directors: | Amal Zouaq |
PolyPublie URL: | https://publications.polymtl.ca/5361/ |
Institution: | Polytechnique Montréal |
Date Deposited: | 20 Oct 2020 13:29 |
Last Modified: | 26 Sep 2024 04:14 |
Cite in APA 7: | Martel, F. (2020). Extraction de taxonomie par regroupement hiérarchique de plongements vectoriels de graphes de connaissances [Master's thesis, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/5361/ |
---|---|
Statistics
Total downloads
Downloads per month in the last year
Origin of downloads