<  Retour au portail Polytechnique Montréal

Application d'un système probabiliste bayésien pour prédire la moyenne cumulative des étudiants à l'École Polytechnique de Montréal

Antoine Murry

Mémoire de maîtrise (2016)

[img]
Affichage préliminaire
Télécharger (2MB)
Citer ce document: Murry, A. (2016). Application d'un système probabiliste bayésien pour prédire la moyenne cumulative des étudiants à l'École Polytechnique de Montréal (Mémoire de maîtrise, École Polytechnique de Montréal). Tiré de https://publications.polymtl.ca/2210/
Afficher le résumé Cacher le résumé

Résumé

RÉSUMÉ Dans un contexte où la puissance de calcul des ordinateurs est en constante augmentation, et où de plus en plus de données sont recueillies par les organisations, ces dernières s’intéressent de manière grandissante à l’exploration de leurs bases de données (Data Mining), dans le but d’améliorer leurs processus. Par processus, nous entendons tout ensemble d’activités transformant un élément d’entrée en un élément de sortie. Si la grande majorité des processus sont monitorés, et que des observations surviennent durant leur déroulement pour assurer leur contrôle, ces observations sont néanmoins rarement utilisées pour prédire l’état final. Ce travail s’intéresse ainsi à la prédiction de l’état de sortie des processus à partir des observations survenues durant leur déroulement. Nous nous intéressons en particulier à la formation des étudiants au baccalauréat de l’École Polytechnique de Montréal. Nous considérons cette formation comme un processus, dans le sens où il s’agit d’un enchaînement d’étapes, sur 12 sessions (4 ans), transformant les étudiants entrants en des ingénieurs prêts à entrer sur le marché de l’emploi. Les données disponibles sont, pour chaque étudiant, les notes moyennes obtenues à chacune des 12 sessions du baccalauréat, les crédits pris à chaque session, et le département de l’étudiant en question. L’idée est de tenter de prédire la moyenne cumulative des six dernières sessions obtenue par chaque étudiant, à partir de ses moyennes obtenues à chacune des six premières sessions, du nombre de crédits pris durant chaque session, et du département de l’étudiant. Ce travail s’intéresse ainsi à tester si les informations disponibles et mesurables sont suffisantes pour fournir une prédiction informative, en dépit d’informations non disponibles, telles que des variables reflétant la psychologie, la vie personnelle ou associative de l’étudiant. En particulier, nous nous intéressons à savoir s’il existe des formes (patterns) dans l’évolution des notes moyennes des étudiants au cours de leur baccalauréat.----------ABSTRACT As computing power is getting more and more important, and as more and more data is being gathered by organizations, the latter are gaining interest in mining their databases, in order to improve their processes. By process is meant a set of activities which transform an input into an output. If most processes are monitored, and if observations are gathered during process runs in order to keep them under control, those same observations are rarely ever used in order to predict the final state of processes. This research hence focuses on the prediction of the output of processes, based on the observations gathered during process runs. We will bear a special interest for the education of bachelor students at Ecole Polytechnique de Montréal. We will consider it is a process, to the extent that it is a succession of 12 quarters (4 years), which transforms incoming students into engineers ready to start their careers. The available data provides, for every single student, the grade point average (GPA) obtained at each quarter, the number of credits that were taken, as well as the Department the student belong to. The idea is to try to predict the cumulative GPA obtained during the six last quarters, given the grades and the number of credits taken during the first six quarters, as well as the Department the student belongs to. Hence, this research focuses on testing whether the available and measurable information is enough to provide an informative prediction, in spite of non-available information, such as variables reflecting the psychology, or the personal lives of all students. We will be particularly interested in discovering whether patterns are present in the trajectories of student GPAs, during the evolution of their bachelor. We have developed a system based on Bayesian networks, which are probabilistic graphical models, hence allowing a probabilistic estimation of the predicted cGPA. The system can therefore be used as a decision aid. We gathered data from the 2008 cohort, which consists of 700 students.

Document en libre accès dans PolyPublie
Département: Département de génie électrique
Directeur de mémoire/thèse: Jean-Jules Brault et Samuel Jean Bassetto
Date du dépôt: 06 mars 2017 11:07
Dernière modification: 24 oct. 2018 16:12
Adresse URL de PolyPublie: https://publications.polymtl.ca/2210/

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Actions réservées au personnel