Segmentation automatique des cris des nouveau-nés en vue du dépistage précoce des problèmes neurophysiologiques
L. Abou-Abbas
Plusieurs
études ont établi l’existence d’un grand nombre d’informations
présentes dans un signal du cri des nouveau-nés. En se basant sur cette
hypothèse, de nombreuses recherches se sont consacrées à l’analyse de
ce signal dans le but de classifier d’une part, le type du cri (cri de
naissance, douleur, faim, inconfort, etc.) et d’autre part, l’état
pathologique du nouveau-né. Cette thèse décrit le développement
et la validation d’un outil de segmentation automatisé pour la
détection des phases vocalisées d’expiration et d’inspiration des cris
des nouveau-nés collectés dans un environnement médical bruité. Cet
outil fera partie de la phase du prétraitement des signaux audio des
cris des nouveau-nés, et ce en amont du système automatique de
classification des pathologies chez les nouveau-nés. Dans un
premier axe, nous avons contribué à la mise en place d’une base de
données de cris des nouveau-nés sains et pathologiques destinée à être
publique, accessible en permanence aux fins de recherches multiples
relatives spécifiquement à la santé des nourrissons. La réalisation de
la base de données a satisfait les attentes, entre autres : l’archivage
sécurisé des données, la consultation facile et accélérée des
informations à l’aide d’une interface adéquate et efficace et le
téléchargement rapide vers d’autres emplacements pour différentes
utilisations. Un corpus de 2073 signaux de cris a été recueilli. 769
bébés ont participé à cette collecte dont 372 sont atteints de diverses
maladies telles que maladies respiratoires, cardiaques et
neurologiques. Dans un deuxième axe, nous avons proposé des méthodes
d’apprentissage supervisées GMM et HMM pour la conception de l’outil de
segmentation automatique des signaux de cris. Compte tenu de la grande
variabilité rencontrée dans une base de données réelle des signaux de
cris, cet outil est capable de détecter les parties importantes de cris
parmi d’autres activités acoustiques présentes dans le corpus comme les
sons provenant des machines médicales, la parole, les bruits à des
niveaux variés et enfin le silence. Plusieurs outils de traitement et
de reconnaissance des signaux ont été exploités dans ce travail afin de
proposer un module de segmentation des signaux de cris complètement
automatique robuste vis-à-vis du bruit et applicable dans un
environnement clinique réel et qui ne nécessite pas un réglage manuel
des seuils. Afin d’exploiter l’information contenue dans les signaux de
cris de différentes manières, nous avons appliqué et comparé les
méthodes de décomposition de signaux les plus utilisées: Transformée de
Fourier rapide, transformée en ondelettes et enfin décomposition modale
empirique. Nous avons procédé à l’extraction des divers descripteurs
afin de caractériser et modéliser séparément et d’une manière efficace
chacun des types d’expiration et d’inspiration avec vocalisation. Dans
un troisième axe, et pour améliorer les résultats obtenus des approches
supervisées en réduisant les erreurs de localisation des points de
début et de fin des segments utiles, nous avons intégré une phase de
post-traitement afin d’exploiter l’information temporelle du
signal. L’architecture complète réalisée est basée sur deux
modules successifs. Le premier vise à utiliser les approches
statistiques supervisées et obtenir une première classification et le
second consiste à se servir des paramètres temps-fréquences pour
corriger les erreurs de la première classification et améliorer ainsi
les résultats globaux. Les différentes approches proposées ont été
testées sur une base de données différente de celle utilisée lors de
l’apprentissage. La technique de la validation croisée stratifiée à dix
tours a été employée afin d’évaluer et de vérifier l’efficacité des
systèmes proposés. Les résultats des tests réalisés montrent le
comportement robuste des algorithmes proposés.
Mots clés : Cris
des nouveau-nés; expirations; inspirations; modèles
de mélanges gaussiennes; modèles de markov cachés; coefficients
cepstraux; taux de passage par zéro; fréquence fondamentale;
décomposition en mode empirique; paquets d’ondelettes.