<  Retour au portail Polytechnique Montréal

High-dimensional bayesian clustering with variable selection: The R package bclust

Vahid Partovi Nia et Anthony C. Davison

Article de revue (2012)

Document en libre accès dans PolyPublie et chez l'éditeur officiel
Afficher 4 fichiers
Cacher les fichiers
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Version officielle de l'éditeur
Conditions d'utilisation: Creative Commons: Attribution (CC BY)
Télécharger (412kB)
[img] Libre accès au plein texte de ce document
Archive - Matériel supplémentaire
Conditions d'utilisation: GPLv3
Télécharger (49kB)
[img] Libre accès au plein texte de ce document
Matériel supplémentaire
Conditions d'utilisation: GPLv3
Télécharger (4kB)
[img] Libre accès au plein texte de ce document
Archive - Matériel supplémentaire
Conditions d'utilisation: GPLv3
Télécharger (15kB)
Afficher le résumé
Cacher le résumé

Abstract

The R package bclust is useful for clustering high-dimensional continuous data. The package uses a parametric spike-and-slab Bayesian model to downweight the effect of noise variables and to quantify the importance of each variable in agglomerative clustering. We take advantage of the existence of closed-form marginal distributions to estimate the model hyper-parameters using empirical Bayes, thereby yielding a fully automatic method. We discuss computational problems arising in implementation of the procedure and illustrate the usefulness of the package through examples.

Mots clés

agglomerative clustering, Bayesian clustering, Bayesian variable selection, dendro- gram, hierarchical clustering, R, spike-and-slab model.

Sujet(s): 3000 Statistique et probabilité > 3000 Statistique et probabilité
Département: Département de mathématiques et de génie industriel
Organismes subventionnaires: Swiss SNF Fellowship, NSERC Discovery Grant, VAHSR&D Grant
Numéro de subvention: PBELP2-125531S, 341315/200, IIR 07-229
URL de PolyPublie: https://publications.polymtl.ca/5058/
Titre de la revue: Journal of Statistical Software (vol. 47, no 5)
Maison d'édition: Foundation for Open Access Statistics
DOI: 10.18637/jss.v047.i05
URL officielle: https://doi.org/10.18637/jss.v047.i05
Date du dépôt: 18 nov. 2022 13:52
Dernière modification: 09 avr. 2024 01:19
Citer en APA 7: Partovi Nia, V., & Davison, A. C. (2012). High-dimensional bayesian clustering with variable selection: The R package bclust. Journal of Statistical Software, 47(5), 22 pages. https://doi.org/10.18637/jss.v047.i05

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Dimensions

Actions réservées au personnel

Afficher document Afficher document