<  Back to the Polytechnique Montréal portal

Un algorithme d'échantillonnage permettant d'améliorer la performance prédictive d'un modèle bayésien dans le cadre d'applications de tests adaptatifs

Alejandro Villarreal Morales

Master's thesis (2009)

Open Access document in PolyPublie
[img]
Preview
Open Access to the full text of this document
Terms of Use: All rights reserved
Download (1MB)
Show abstract
Hide abstract

Abstract

Bayesian graphical models are commonly used to build student models from data. A number of standard algorithms are available to train Bayesian models from student skills assessment data. These models can assess student knowledge and skills from a few observations. They are useful for Computer Adaptive Testing (CAT), for example, where the test items can be administered in order to maximize the information they will provide. In practice, such data often contain missing values and, under some circumstances, missing values far outnumber observed values. However, when collecting data from test results, one can often choose which values will be present or missing by a consequent test design. We study how to optimize the choice of test items for collecting the data that will be used for training a Bayesian CAT model, such as to maximize the predictive performance of the model. We explore the use of a simple heuristic for test item choice based on the level of uncertainty. The uncertainty of an item is derived from its initial probability of success and, thus, from its difficulty. The results show that this choice does affect model performance and that the heuristic can lead to better performance. Although the study's results are more exploratory than conclusive, they suggest interesting research avenues

Résumé

Les systèmes CAT (abréviation anglaise de: Computing Adaptive Testing) sont utilisés depuis plusieurs décennies pour déterminer le niveau de connaissances des utilisateurs par le biais d'un questionnaire où l'on essaie de minimiser le nombre de questions posées. Plusieurs applications comme les systèmes de guidage et les tutoriels les utilisent afin de créer des profils utilisateurs. Les systèmes CAT effectuent leur diagnostic sur la base d'un modèle de connaissances. Bien que certains modèles sont dérivés du travail d'un expert, comme les modèles à base de règles ou les modèles Bayésiens graphiques, où la structure et les probabilités conditionnelles sont définies par un expert du domaine, les modèles les plus prometteurs sont basés sur une approche statistique où les paramètres du modèle sont induits à partir de données. (Desmarais et Gagnon, 2006; Millan et Perez-de-la-cruz, 2002; Vomlel, 2004)

Department: Department of Computer Engineering and Software Engineering
Program: Génie informatique
Academic/Research Directors: Michel C. Desmarais and Michel Gagnon
PolyPublie URL: https://publications.polymtl.ca/118/
Institution: École Polytechnique de Montréal
Date Deposited: 25 Jun 2009 13:59
Last Modified: 03 Oct 2024 13:54
Cite in APA 7: Villarreal Morales, A. (2009). Un algorithme d'échantillonnage permettant d'améliorer la performance prédictive d'un modèle bayésien dans le cadre d'applications de tests adaptatifs [Master's thesis, École Polytechnique de Montréal]. PolyPublie. https://publications.polymtl.ca/118/

Statistics

Total downloads

Downloads per month in the last year

Origin of downloads

Repository Staff Only

View Item View Item