<  Back to the Polytechnique Montréal portal

Un algorithme d'échantillonnage permettant d'améliorer la performance prédictive d'un modèle bayésien dans le cadre d'applications de tests adaptatifs

Alejandro Villarreal Morales

Master's thesis (2009)

Open Access document in PolyPublie
[img]
Preview
Open Access to the full text of this document
Terms of Use: All rights reserved
Download (1MB)
Show abstract
Hide abstract

Abstract

Bayesian graphical models are commonly used to build student models from data.
A number of standard algorithms are available to train Bayesian models from student
skills assessment data. These models can assess student knowledge and skills from a few
observations. They are useful for Computer Adaptive Testing (CAT), for example, where
the test items can be administered in order to maximize the information they will provide.
In practice, such data often contain missing values and, under some circumstances,
missing values far outnumber observed values. However, when collecting data from test
results, one can often choose which values will be present or missing by a consequent test
design. We study how to optimize the choice of test items for collecting the data that will
be used for training a Bayesian CAT model, such as to maximize the predictive
performance of the model. We explore the use of a simple heuristic for test item choice
based on the level of uncertainty. The uncertainty of an item is derived from its initial
probability of success and, thus, from its difficulty.
The results show that this choice does affect model performance and that the
heuristic can lead to better performance. Although the study's results are more
exploratory than conclusive, they suggest interesting research avenues

Résumé

Les systèmes CAT (abréviation anglaise de: Computing Adaptive Testing) sont
utilisés depuis plusieurs décennies pour déterminer le niveau de connaissances des
utilisateurs par le biais d'un questionnaire où l'on essaie de minimiser le nombre de
questions posées. Plusieurs applications comme les systèmes de guidage et les tutoriels
les utilisent afin de créer des profils utilisateurs.
Les systèmes CAT effectuent leur diagnostic sur la base d'un modèle de
connaissances. Bien que certains modèles sont dérivés du travail d'un expert, comme les
modèles à base de règles ou les modèles Bayésiens graphiques, où la structure et les
probabilités conditionnelles sont définies par un expert du domaine, les modèles les plus
prometteurs sont basés sur une approche statistique où les paramètres du modèle sont
induits à partir de données. (Desmarais et Gagnon, 2006; Millan et Perez-de-la-cruz,
2002; Vomlel, 2004)

Department: Department of Computer Engineering and Software Engineering
Program: Génie informatique
Academic/Research Directors: Michel C. Desmarais, Michel Gagnon
PolyPublie URL: https://publications.polymtl.ca/118/
Institution: École Polytechnique de Montréal
Date Deposited: 25 Jun 2009 13:59
Last Modified: 08 Jun 2023 15:21
Cite in APA 7: Villarreal Morales, A. (2009). Un algorithme d'échantillonnage permettant d'améliorer la performance prédictive d'un modèle bayésien dans le cadre d'applications de tests adaptatifs [Master's thesis, École Polytechnique de Montréal]. PolyPublie. https://publications.polymtl.ca/118/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only

View Item View Item