<  Back to the Polytechnique Montréal portal

Un algorithme d'échantillonnage permettant d'améliorer la performance prédictive d'un modèle bayésien dans le cadre d'applications de tests adaptatifs

Alejandro Villarreal Morales

Masters thesis (2009)

[img]
Preview
Download (1MB)
Cite this document: Villarreal Morales, A. (2009). Un algorithme d'échantillonnage permettant d'améliorer la performance prédictive d'un modèle bayésien dans le cadre d'applications de tests adaptatifs (Masters thesis, École Polytechnique de Montréal). Retrieved from https://publications.polymtl.ca/118/
Show abstract Hide abstract

Abstract

RÉSUMÉ Les systèmes CAT (abréviation anglaise de: Computing Adaptive Testing) sont utilisés depuis plusieurs décennies pour déterminer le niveau de connaissances des utilisateurs par le biais d’un questionnaire où l’on essaie de minimiser le nombre de questions posées. Plusieurs applications comme les systèmes de guidage et les tutoriels les utilisent afin de créer des profils utilisateurs. Les systèmes CAT effectuent leur diagnostic sur la base d'un modèle de connaissances. Bien que certains modèles sont dérivés du travail d'un expert, comme les modèles à base de règles ou les modèles Bayésiens graphiques, où la structure et les probabilités conditionnelles sont définies par un expert du domaine, les modèles les plus prometteurs sont basés sur une approche statistique où les paramètres du modèle sont induits à partir de données. (Desmarais et Gagnon, 2006; Millan et Perez-de-la-cruz, 2002; Vomlel, 2004)----------ABSTRACT Bayesian graphical models are commonly used to build student models from data. A number of standard algorithms are available to train Bayesian models from student skills assessment data. These models can assess student knowledge and skills from a few observations. They are useful for Computer Adaptive Testing (CAT), for example, where the test items can be administered in order to maximize the information they will provide. In practice, such data often contain missing values and, under some circumstances, missing values far outnumber observed values. However, when collecting data from test results, one can often choose which values will be present or missing by a consequent test design. We study how to optimize the choice of test items for collecting the data that will be used for training a Bayesian CAT model, such as to maximize the predictive performance of the model. We explore the use of a simple heuristic for test item choice based on the level of uncertainty. The uncertainty of an item is derived from its initial probability of success and, thus, from its difficulty. The results show that this choice does affect model performance and that the heuristic can lead to better performance. Although the study’s results are more exploratory than conclusive, they suggest interesting research avenues

Open Access document in PolyPublie
Department: Département de génie informatique et génie logiciel
Dissertation/thesis director: Michel Desmarais and Michel Gagnon
Date Deposited: 25 Jun 2009 13:59
Last Modified: 24 Oct 2018 16:10
PolyPublie URL: https://publications.polymtl.ca/118/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only