Utilisation du traitement automatique du langage appliqué aux articles de presse pour le recensement des inondations en Wallonie et comparaison aux données environnementales
Files
Merveille_28491700_2024.pdf
Open access - Adobe PDF
- 4.44 MB
Details
- Supervisors
- Faculty
- Degree label
- Abstract
- Les inondations sont les catastrophes naturelles les plus fréquentes dans le monde, et leur fréquence augmente, notamment en raison des changements climatiques. La Belgique, et plus particulièrement la Wallonie, a été touchée par des inondations majeures au cours des dernières décennies. Celles de juillet 2021 en sont un exemple frappant, ayant causé des dégâts considérables dans l’ensemble des provinces wallonnes. Actuellement, il n’existe pas de base de données exhaustive et à jour répertoriant l’ensemble des occurrences d’inondations en Wallonie. Les bases de données actuelles sont souvent difficiles à consulter librement, sujettes à divers biais, et omettent fréquemment un nombre significatif d’événements d’inondations. Cependant, l’accès croissant aux ressources en ligne au cours des deux dernières décennies permet d’exploiter d’énormes quantités de données disponibles librement. Ces ressources ont la possibilité de combler le manque de données, en fournissant de nouvelles sources telles que les médias en ligne ou les réseaux sociaux. Face à ce constat, ce mémoire explore l’utilisation des techniques de traitement automatique du langage (TAL) pour recenser de manière exhaustive les occurrences d’inondations en Wallonie, en s'appuyant sur les articles de presse en ligne. À travers l’application de méthodes de fouille de données, d’apprentissage machine et de reconnaissance d’entités nommées, une base de données géolocalisée a été développée. Cette base de données détaille les événements d’inondations survenus entre 2008 et 2021. Elle offre ainsi une nouvelle ressource pour l’analyse spatio-temporelle des inondations. La base de données a permis d’explorer les tendances des inondations, la variabilité interannuelle, les tendances saisonnières, la distribution spatiale et la couverture médiatique des événements. Les séries temporelles issues de la base de données sont également comparées avec des données environnementales afin de vérifier l’existence de corrélations. Les résultats ont alors montré des corrélations significatives avec les données de débits, de hauteurs d’eau et de précipitations.