Prédiction de la biodégradabilité des molécules organiques à l'aide d'algorithmes de classification
Files
Moulin_88291800_2023.pdf
UCLouvain restricted access - Adobe PDF
- 1.56 MB
Details
- Supervisors
- Faculty
- Degree label
- Abstract
- Ce mémoire vise à évaluer le potentiel de biodégradabilité des molécules organiques en se basant sur leur structure chimique à l’aide d’algorithmes de classification. L'objectif principal est de développer un outil de prédiction permettant de différencier les molécules biodégradables des non biodégradables. Actuellement, les tests de biodégradabilité sont coûteux et longs, ce qui entraîne des retards dans la mise sur le marché des produits. Dans cette étude, nous avons analysé les caractéristiques des molécules influençant leur potentiel de biodégradabilité en utilisant des algorithmes de classification. En se basant sur les précédentes études présentes dans la littérature, des analyses ont permis de mettre en évidence les avantages et les limites des modèles existants, ainsi que d'explorer des stratégies d'amélioration. De manière générale, ces études offrent de bons résultats du point de vue de la classification des molécules biodégradables ou non, mais sont très spécifiques à un type de molécules en particulier. Dans cette étude, nous avons voulu proposer un outil général pouvant être applicable à tout type de molécules organiques. Pour ce faire nous avons ajouté de nouvelles variables descriptives et réuni plusieurs bases de données de molécules afin de généraliser les prédictions à un large éventail de molécules organiques. Nous avons utilisé la bibliothèque python Mordred pour calculer plus de 1800 indicateurs reflétant la structure des molécules. En utilisant des algorithmes de classification classiques, notamment les forêts aléatoires, nous avons obtenu un modèle robuste avec un taux d'erreur moyen de 11% lors de la validation croisée. Il a été remarqué que les prédictions pour les molécules dont les caractéristiques se trouvent au sein ou proches du domaine des molécules ayant servi à l’entrainement étaient fiables. Cependant, pour des molécules très différentes de celles envisagées dans le modèle, les prédictions sont beaucoup moins fiables. Cette approche prometteuse ouvre la voie au développement d'un outil d'aide à la prise de décision pour réduire les pertes liées à la recherche et au développement de molécules biodégradables.