ED Mathématiques et Informatique
Extraction, transcription et analyse des opinions publiques multilingues issues des réseaux sociaux
par Samawel JABALLI (LaBRI - Laboratoire Bordelais de Recherche en Informatique)
Cette soutenance a lieu à 10h00 - Amphithéâtre 3 Université de Bordeaux, Bâtiment A9, 351 cours de la Libération, 33405 Talence Cedex
devant le jury composé de
- Henri NICOLAS - Professeur des universités - Université de Bordeaux - Directeur de these
- Lilia CHENITI-BELCADHI - Professeure des universités - ISITCOM (Institut Supérieur d'Informatique et des Technologies de Communication) - Université de Sousse - Rapporteur
- Zied KECHAOU - Professeur des universités - Université de Kairouan - Examinateur
- Mounir ZRIGUI - Professeur des universités - Université de Monastir - Directeur de these
- Jenny BENOIS-PINEAU - Professeure des universités - Université de Bordeaux - Examinateur
- Ahmed BOUNEKKAR - Maître de conférences - Université Claude Bernard Lyon 1 - Rapporteur
À l'ère du numérique, où la prolifération des contenus texto-auditifs redéfinit les modes de communication, l'analyse des dynamiques médiatiques multilingues devient un enjeu scientifique fondamental. Les interactions humaines, qu'elles soient écrites ou orales, se déploient désormais dans un enchevêtrement linguistique complexe, intégrant des expressions informelles, dialectales et des discours en alternance codique. Face à cette fragmentation linguistique, il devient impératif de concevoir des approches avancées capables de structurer, d'interpréter et d'exploiter ces flux massifs d'informations. Cette thèse se positionne au croisement de trois axes majeurs : l'extraction des tendances discursives, la transcription automatique multilingue et l'analyse des sentiments dans des scénarios linguistiques informels. En réponse à ces enjeux, nous proposons une nouvelle approche pour décoder les dynamiques thématiques en s'appuyant sur des modèles probabilistes (LDA, HDP) couplés à des modèles prédictifs séquentiels (ARIMA), afin d'extraire les tendances latentes et de modéliser les dynamiques temporelles sous-jacentes, tout en analysant l'évolution des préoccupations sociétales. Ensuite, nous introduisons un système hybride de transcription automatique multilingue et de détection de mots-clés en discours continu, s'appuyant sur une architecture intégrant des versions optimisées de Whisper (FasterWhisper et WhisperX), associées aux modèles de détection d'activité vocale (Silero VAD et Pyannote VAD), garantissant une meilleure résilience face aux variations linguistiques et contextuelles. Par ailleurs, nous associons des réseaux neuronaux résiduels (ResNet-18, ResNet-152) avec des embeddings acoustiques (MFCC) et contextuels (M-BERT) afin d'optimiser l'identification rapide des informations critiques en situation d'urgence. Enfin, l'objectif est de proposer une stratégie d'analyse des sentiments dans des contenus multilingues, où les échanges dialectaux et en alternance codique, caractérisés par des ambiguïtés sémantiques, complexifient l'interprétation et représentent un défi inédit. Pour y répondre, une architecture hybride combinant des réseaux neuronaux bi-directionnels profonds (Bi-LSTM) et une approche d'apprentissage par ensemble (AdaBoost-SVM), intégrant une pondération adaptative des coûts, permet d'améliorer la précision de la classification des opinions, tout en atténuant les biais liés aux déséquilibres des corpus explorés.