Segmentation automatique des cris des nouveau-nés en vue du dépistage précoce des problèmes neurophysiologiques

L. Abou-Abbas

Plusieurs études ont établi l’existence d’un grand nombre d’informations présentes dans un signal du cri des nouveau-nés. En se basant sur cette hypothèse, de nombreuses recherches se sont consacrées à l’analyse de ce signal dans le but de classifier d’une part, le type du cri (cri de naissance, douleur, faim, inconfort, etc.) et d’autre part, l’état pathologique du nouveau-né. Cette thèse  décrit le développement et la validation d’un outil de segmentation automatisé pour la détection des phases vocalisées d’expiration et d’inspiration des cris des nouveau-nés collectés dans un environnement médical bruité. Cet outil fera partie de la phase du prétraitement des signaux audio des cris des nouveau-nés, et ce en amont du système automatique de classification des pathologies chez les nouveau-nés. Dans un  premier axe, nous avons contribué à la mise en place d’une base de données de cris des nouveau-nés sains et pathologiques destinée à être publique, accessible en permanence aux fins de recherches multiples relatives spécifiquement à la santé des nourrissons. La réalisation de la base de données a satisfait les attentes, entre autres : l’archivage sécurisé des données, la consultation facile et accélérée des informations à l’aide d’une interface adéquate et efficace et le téléchargement  rapide vers d’autres emplacements pour différentes utilisations. Un corpus de 2073 signaux de cris a été recueilli. 769 bébés ont participé à cette collecte dont 372 sont atteints de diverses maladies telles que maladies respiratoires, cardiaques et neurologiques. Dans un deuxième axe, nous avons proposé des méthodes d’apprentissage supervisées GMM et HMM pour la conception de l’outil de segmentation automatique des signaux de cris. Compte tenu de la grande variabilité rencontrée dans une base de données réelle des signaux de cris, cet outil est capable de détecter les parties importantes de cris parmi d’autres activités acoustiques présentes dans le corpus comme les sons provenant des machines médicales, la parole, les bruits à des niveaux variés et enfin le silence. Plusieurs outils de traitement et de reconnaissance des signaux ont été exploités dans ce travail afin de proposer un module de segmentation des signaux de cris complètement automatique robuste vis-à-vis du bruit et applicable dans un environnement clinique réel et qui ne nécessite pas un réglage manuel des seuils. Afin d’exploiter l’information contenue dans les signaux de cris de différentes manières, nous avons appliqué et comparé les méthodes de décomposition de signaux les plus utilisées: Transformée de Fourier rapide, transformée en ondelettes et enfin décomposition modale empirique. Nous avons procédé à l’extraction des divers descripteurs afin de caractériser et modéliser séparément et d’une manière efficace chacun des types d’expiration et d’inspiration avec vocalisation. Dans un troisième axe, et pour améliorer les résultats obtenus des approches supervisées en réduisant les erreurs de localisation des points de début et de fin des segments utiles, nous avons intégré une phase de post-traitement afin d’exploiter l’information temporelle du signal.  L’architecture complète réalisée est basée sur deux modules successifs. Le premier vise à utiliser les approches statistiques supervisées et obtenir une première classification et le second consiste à se servir des paramètres temps-fréquences pour corriger les erreurs de la première classification et améliorer ainsi les résultats globaux. Les différentes approches proposées ont été testées sur une base de données différente de celle utilisée lors de l’apprentissage. La technique de la validation croisée stratifiée à dix tours a été employée afin d’évaluer et de vérifier l’efficacité des systèmes proposés. Les résultats des tests réalisés montrent le comportement robuste des algorithmes proposés.

Mots clés :
Cris des nouveau-nés; expirations; inspirations; modèles de mélanges gaussiennes; modèles de markov cachés; coefficients cepstraux; taux de passage par zéro; fréquence fondamentale; décomposition en mode empirique; paquets d’ondelettes.