<  Retour au portail Polytechnique Montréal

Speech decoding using cortical and subcortical electrophysiological signals

Hemmings Wu, Chengwei Cai, Wenjie Ming, Wangyu Chen, Zhoule Zhu, Feng Chen, Hongjie Jiang, Zhe Zheng, Mohamad Sawan, Ting Wang et Junming Zhu

Article de revue (2024)

Document en libre accès dans PolyPublie et chez l'éditeur officiel
Afficher 5 fichiers
Cacher les fichiers
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Version officielle de l'éditeur
Conditions d'utilisation: Creative Commons: Attribution (CC BY)
Télécharger (2MB)
[img] Libre accès au plein texte de ce document
Feuille de calcul - Matériel supplémentaire
Conditions d'utilisation: Creative Commons: Attribution (CC BY)
Télécharger (75kB)
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Image - Matériel supplémentaire
Conditions d'utilisation: Creative Commons: Attribution (CC BY)
Télécharger (3MB)
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Matériel supplémentaire
Conditions d'utilisation: Creative Commons: Attribution (CC BY)
Télécharger (13kB)
[img]
Affichage préliminaire
Libre accès au plein texte de ce document
Matériel supplémentaire
Conditions d'utilisation: Creative Commons: Attribution (CC BY)
Télécharger (32kB)
Afficher le résumé
Cacher le résumé

Abstract

Introduction: Language impairments often result from severe neurological disorders, driving the development of neural prosthetics utilizing electrophysiological signals to restore comprehensible language. Previous decoding efforts primarily focused on signals from the cerebral cortex, neglecting subcortical brain structures’ potential contributions to speech decoding in brain-computer interfaces.

Methods: In this study, stereotactic electroencephalography (sEEG) was employed to investigate subcortical structures’ role in speech decoding. Two native Mandarin Chinese speakers, undergoing sEEG implantation for epilepsy treatment, participated. Participants read Chinese text, with 1–30, 30–70, and 70–150 Hz frequency band powers of sEEG signals extracted as key features. A deep learning model based on long short-term memory assessed the contribution of different brain structures to speech decoding, predicting consonant articulatory place, manner, and tone within single syllable.

Results: Cortical signals excelled in articulatory place prediction (86.5% accuracy), while cortical and subcortical signals performed similarly for articulatory manner (51.5% vs. 51.7% accuracy). Subcortical signals provided superior tone prediction (58.3% accuracy). The superior temporal gyrus was consistently relevant in speech decoding for consonants and tone. Combining cortical and subcortical inputs yielded the highest prediction accuracy, especially for tone.

Discussion: This study underscores the essential roles of both cortical and subcortical structures in different aspects of speech decoding.

Mots clés

Département: Département de génie électrique
Organismes subventionnaires: NSFC Research Grant, Key R&D Program of Zhejiang, Zhejiang Provincial Medical Health Science and Technology Plan, ZJU Research Grant
Numéro de subvention: 62336007, 62276228, 2022C03011, 2023C03001, 2023KY730, K20210252
URL de PolyPublie: https://publications.polymtl.ca/65411/
Titre de la revue: Frontiers in Neuroscience (vol. 18)
Maison d'édition: Frontiers Media
DOI: 10.3389/fnins.2024.1345308
URL officielle: https://doi.org/10.3389/fnins.2024.1345308
Date du dépôt: 07 mai 2025 16:13
Dernière modification: 21 févr. 2026 08:51
Citer en APA 7: Wu, H., Cai, C., Ming, W., Chen, W., Zhu, Z., Chen, F., Jiang, H., Zheng, Z., Sawan, M., Wang, T., & Zhu, J. (2024). Speech decoding using cortical and subcortical electrophysiological signals. Frontiers in Neuroscience, 18, 8 pages. https://doi.org/10.3389/fnins.2024.1345308

Statistiques

Total des téléchargements à partir de PolyPublie

Téléchargements par année

Provenance des téléchargements

Dimensions

Actions réservées au personnel

Afficher document Afficher document