<  Retour au portail Polytechnique Montréal

Extraction de taxonomie par regroupement hiérarchique de plongements vectoriels de graphes de connaissances

Félix Martel

Mémoire de maîtrise (2020)

Document en libre accès dans PolyPublie
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Conditions d'utilisation: Tous droits réservés
Télécharger (1MB)
Afficher le résumé
Cacher le résumé

Résumé

Les graphes de connaissances jouent aujourd'hui un rôle important pour représenter et stocker des données, bien au-delà du Web sémantique ; beaucoup d'entre eux sont obtenus de manière automatique ou collaborative, et agrègent des données issues de sources diverses. Dans ces conditions, la création et la mise à jour automatique d'une taxonomie qui reflète le contenu d'un graphe est un enjeu crucial.Or, la plupart des méthodes d'extraction taxonomique adaptées aux graphes de grande taille se contentent de hiérarchiser des classes pré-existantes, et sont incapables d'identifier de nouvelles classes à partir des données. Dans ce mémoire, nous proposons une méthode d'extraction de taxonomie expressive applicable à grande échelle, grâce à l'utilisation de plongements vectoriels. Les modèles de plongement vectoriel de graphe fournissent une représentation vectorielle dense des éléments d'un graphe, qui intègre sous forme géométrique les régularités des données : ainsi, deux éléments sémantiquement proches dans le graphe auront des plongements vectoriels géométriquement proches.Notre but est de démontrer le potentiel du regroupement hiérarchique non-supervisé appliqué aux plongements vectoriels sur la tâche d'extraction de taxonomie. Pour cela, nous procédons en deux étapes : nous montrons d'abord qu'un tel regroupement est capable d'extraire une taxonomie sur les classes existantes, puis qu'il permet de surcroît d'identifier de nouvelles classes et de les organiser hiérarchiquement, c'est-à-dire d'extraire une taxonomie expressive.

Abstract

Knowledge graphs are the backbone of the Semantic Web, and have been succesfully applied to a wide range of areas. Many of these graphs are built automatically or collaboratively,and aggregate data from various sources. In these conditions, automatically creating and updating a taxonomy that accurately reflects the content of a graph is an important issue. However, among scalable taxonomy extraction approaches, most of them can only extract a hierarchy on existing classes, and are unable to identify new classes from the data. In this thesis, we propose a novel taxonomy extraction method based on knowledge graph embeddings that is both scalable and expressive. A knowledge graph embedding model provides a dense, low-dimensional vector representation of the entities of a graph, such that similar entities in the graph are embedded close to each other in the embedding space.Our goal is to show how these graph embeddings can be combined with unsupervised hierarchical clustering to extract a taxonomy from a graph. We first show that unsupervised clustering is able to extract a taxonomy on existing classes. Then, we show that it can also be used to identify new classes and organize them hierarchically, thus creating an expressive taxonomy

Département: Département de génie informatique et génie logiciel
Programme: Génie informatique
Directeurs ou directrices: Amal Zouaq
URL de PolyPublie: https://publications.polymtl.ca/5361/
Université/École: Polytechnique Montréal
Date du dépôt: 20 oct. 2020 13:29
Dernière modification: 19 avr. 2023 14:33
Citer en APA 7: Martel, F. (2020). Extraction de taxonomie par regroupement hiérarchique de plongements vectoriels de graphes de connaissances [Mémoire de maîtrise, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/5361/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel

Afficher document Afficher document