<  Back to the Polytechnique Montréal portal

Génération de base de connaissance à partir de données hétérogènes dans le monde culturel

Dominique Piché

Master's thesis (2022)

[img] Restricted to: Repository staff only until 7 October 2023
Terms of Use: All rights reserved
Request a copy
Show abstract
Hide abstract

Abstract

Quebec's cultural world is rich and full of variety, as is illustrated through the imposing amount of cultural heritage metadata that exists. Governmental, academic and commer- cial players have accumulated a large amount of data relating to literary and film works. However, this data is currently largely unavailable to the greater public, and are held in datastores whose underlying datamodels, which are often complex and incompatible between institutions, complicate their use. On top of this, except for rare exceptions, this data is not interlinked with other linked open data sources available elsewhere on the web, whether they be public collaborative projects such as Wikidata or knowledge bases published by national librairies. The development of knowledge bases in graph form can aid in democratising this metadata, by simplifying its exploitation and allowing it to be linked with existing, open knowledge bases. This memoir summarizes our work, which is the creation of knowledge bases for Quebec's cinema and literature data. In particular, our work focuses on modelling and populating such knowledge bases from existing relational databases. We first model a knowledge base for Quebec's film world, which uses a dataset provided by the Cinémathèque québécoise. Our use cases, provided by domain experts, guide our development of an ontological model for this domain. We describe the translation of this source data from its original format towards the final knowledge base.

Résumé

RÉSUMÉ : Le monde culturel québécois est riche et varié, et ceci se concrétise par l'importante quantité de métadonnées sur les mondes du livre et du cinéma que les acteurs gouvernementaux, aca- démiques et commerciaux ont accumulé. Cependant, ces données sont actuellement en bonne partie indisponibles au public, et sont encodées dans des bases de données dont les modèles, parfois complexes et généralement incompatibles d'une institution à l'autre, rendent l'exploi- tation difficile. De plus, sauf certaines exceptions, elles ne sont pas reliées aux métadonnées diffusées librement ailleurs sur le web, que ce soit par l'entremise de projets collaboratifs publics tels que Wikidata, ou par des acteurs tels que certaines bibliothèques nationales européennes. La création de bases de connaissances sous forme de graphes peut permettre la démocratisa- tion de ces métadonnées, en simplifiant leur exploitation et en les liant vers d'autres bases de connaissances existantes. Ce mémoire résume notre travail de création de bases de connais- sances pour les mondes du cinéma et de la littérature québécois, en particulier la modélisation de modèles ontologiques et la population des graphes à partir de sources relationnelles. Nous présentons d'abord une base de connaissances pour le domaine du cinéma québécois, qui utilise un jeu de métadonnées fourni par la Cinémathèque québécoise. À partir de scénarios d'utilisation fournis par des experts du milieu, nous développons un modèle ontologique pour ce domaine, et décrivons la conversion des données sources de leur format original vers la base de connaissances finale.
Department: Department of Computer Engineering and Software Engineering
Program: Génie informatique
Academic/Research Directors: Amal Zouaq, Michel Gagnon
PolyPublie URL: https://publications.polymtl.ca/10327/
Institution: Polytechnique Montréal
Date Deposited: 07 Oct 2022 14:02
Last Modified: 15 Nov 2022 18:53
Cite in APA 7: Piché, D. (2022). Génération de base de connaissance à partir de données hétérogènes dans le monde culturel [Master's thesis, Polytechnique Montréal]. PolyPublie. https://publications.polymtl.ca/10327/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only

View Item View Item