Classification de Textes par Réseaux de Neurones Graphiques : Augmentation Sémantique, Optimisation d'Hyperparamètres Et Apprentissage Graphique Évolutif avec GCN et GAT
Par : Madame AHL ETOUATE Chaima
Le samedi 4 juillet 2026 à 09:00
Le Doyen de la Faculté des Sciences et Techniques de Béni Mellal porte à la connaissance du public que Madame AHL ETOUATE Chaima, soutiendra une thèse de Doctorat intitulée : «Classification de Textes par Réseaux de Neurones Graphiques : Augmentation Sémantique, Optimisation d'Hyperparamètres Et Apprentissage Graphique Évolutif avec GCN et GAT».
La soutenance publique aura lieu le Samedi 4 Juillet 2026 à 10h00 à l’Amphi de Conférences, à la Faculté des Sciences et Techniques, Université Sultan Moulay Slimane, Béni Mellal, devant le jury composé de :
Monsieur BASLAM Mohamed : Professeur, Faculté des Sciences et Techniques, Université Sultan Moulay Slimane, Beni Mellal, Président/ Rapporteur ;
Monsieur OUJAOURA Mustapha : Maître de Conférences Habilité, Ecole Nationales des Sciences Appliquées, Université Cadi Ayyad, Safi, Rapporteur ;
Monsieur ERRITALI Mohammed : Professeur, Faculté des Sciences et Techniques, Université Sultan Moulay Slimane, Beni Mellal, Rapporteur ;
Monsieur ZOUGAGH Hicham : Maître de Conférences Habilité, Faculté des Sciences et Techniques, Sultan Moulay Slimane, Beni Mellal, Examinateur ;
Monsieur EL MOURABIT Yousef : Maître de Conférences Habilité, Faculté des Sciences et Techniques, Sultan Moulay Slimane, Béni Mellal, Examinateur ;
Monsieur AIT OMAR Driss : Maître de Conférences Habilité, Faculté des Sciences et Techniques, Université Sultan Moulay Slimane, Béni Mellal, Examinateur ;
Monsieur BINIZ Mohamed : Maître de Conférences Habilité, Faculté Polydisciplinaire, Université Sultan Moulay Slimane, Béni Mellal, Co-Directeur de thèse ;
Monsieur EL AYACHI Rachid : Professeur, Faculté des Sciences et Techniques, Université Sultan Moulay Slimane, Béni Mellal, Directeur de thèse .
Résumé:
Cette recherche vise à traiter la problématique de la classification de textes en appliquant un cheminement de recherche progressive évoluant des modèles d'apprentissage profond hybrides aux réseaux de neurones graphiques avancés avec augmentation sémantique.
Nous proposons dans une première contribution un modèle hybride CNN-LSTM optimisé pour la classification de sentiments et qui combine les avantages des réseaux convolutifs pour l’extraction de caractéristiques locales et des réseaux LSTM pour la capture des dépendances contextuelles. Un cadre d’optimisation des hyperparamètres par recherche aléatoire a été implémenté, permettant d’atteindre une précision de 88,82 % sur le jeu de données IMDB.
Notre seconde contribution propose un cadre évolutif d’augmentation de données pour la classification de nœuds dans les graphes. Nous avons reproduit le jeu de données Cora à partir des fichiers PostScript originaux et avons mis en œuvre un pipeline d’augmentation tridimensionnel alliant paraphrase PEGASUS, remplacement contrôlé de synonymes et génération synthétique équilibrée par classe. Le jeu de données a été élargi de 2708 à environ 17780 nœuds sans altérer la fidélité sémantique (scores WMD : 0,27–0,34). En appliquant une optimisation bayésienne des hyperparamètres avec Optuna ainsi qu’une validation croisée 5-fold, notre modèle GCN a atteint une précision de 95,42 %, tandis que le GAT a atteint 93,46 % sur le jeu de données augmenté. Ces résultats dépassent les performances que nous avons nous-mêmes observées sur le Cora original dans les mêmes conditions architecturales (GCN : 83,39 % ; GAT : 82,24 %).
Mots clés: Classification de textes, Réseaux de neurones graphiques, GCN, GAT, Augmentation de données, PEGASUS, Optimisation bayésienne, Déséquilibre de classes, CNN-LSTM, Apprentissage profond, NLP.