<  Retour au portail Polytechnique Montréal

Génération de base de connaissance à partir de données hétérogènes dans le monde culturel

Dominique Piché

Mémoire de maîtrise (2022)

Document en libre accès dans PolyPublie
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Conditions d'utilisation: Tous droits réservés
Télécharger (4MB)
Afficher le résumé
Cacher le résumé

Résumé

RÉSUMÉ : Le monde culturel québécois est riche et varié, et ceci se concrétise par l'importante quantité de métadonnées sur les mondes du livre et du cinéma que les acteurs gouvernementaux, aca- démiques et commerciaux ont accumulé. Cependant, ces données sont actuellement en bonne partie indisponibles au public, et sont encodées dans des bases de données dont les modèles, parfois complexes et généralement incompatibles d'une institution à l'autre, rendent l'exploi- tation difficile. De plus, sauf certaines exceptions, elles ne sont pas reliées aux métadonnées diffusées librement ailleurs sur le web, que ce soit par l'entremise de projets collaboratifs publics tels que Wikidata, ou par des acteurs tels que certaines bibliothèques nationales européennes. La création de bases de connaissances sous forme de graphes peut permettre la démocratisa- tion de ces métadonnées, en simplifiant leur exploitation et en les liant vers d'autres bases de connaissances existantes. Ce mémoire résume notre travail de création de bases de connais- sances pour les mondes du cinéma et de la littérature québécois, en particulier la modélisation de modèles ontologiques et la population des graphes à partir de sources relationnelles. Nous présentons d'abord une base de connaissances pour le domaine du cinéma québécois, qui utilise un jeu de métadonnées fourni par la Cinémathèque québécoise. À partir de scénarios d'utilisation fournis par des experts du milieu, nous développons un modèle ontologique pour ce domaine, et décrivons la conversion des données sources de leur format original vers la base de connaissances finale.

Abstract

Quebec's cultural world is rich and full of variety, as is illustrated through the imposing amount of cultural heritage metadata that exists. Governmental, academic and commer- cial players have accumulated a large amount of data relating to literary and film works. However, this data is currently largely unavailable to the greater public, and are held in datastores whose underlying datamodels, which are often complex and incompatible between institutions, complicate their use. On top of this, except for rare exceptions, this data is not interlinked with other linked open data sources available elsewhere on the web, whether they be public collaborative projects such as Wikidata or knowledge bases published by national librairies. The development of knowledge bases in graph form can aid in democratising this metadata, by simplifying its exploitation and allowing it to be linked with existing, open knowledge bases. This memoir summarizes our work, which is the creation of knowledge bases for Quebec's cinema and literature data. In particular, our work focuses on modelling and populating such knowledge bases from existing relational databases. We first model a knowledge base for Quebec's film world, which uses a dataset provided by the Cinémathèque québécoise. Our use cases, provided by domain experts, guide our development of an ontological model for this domain. We describe the translation of this source data from its original format towards the final knowledge base.

Département: Département de génie informatique et génie logiciel
Programme: Génie informatique
Directeurs ou directrices: Amal Zouaq et Michel Gagnon
URL de PolyPublie: https://publications.polymtl.ca/10327/
Université/École: Polytechnique Montréal
Date du dépôt: 07 oct. 2022 14:02
Dernière modification: 08 avr. 2024 03:03
Citer en APA 7: Piché, D. (2022). Génération de base de connaissance à partir de données hétérogènes dans le monde culturel [Mémoire de maîtrise, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/10327/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel

Afficher document Afficher document