ATTENTION/WARNING - NE PAS DÉPOSER ICI/DO NOT SUBMIT HERE

Ceci est la version de TEST de DIAL.mem. Veuillez ne pas soumettre votre mémoire sur ce site mais bien à l'URL suivante: 'https://thesis.dial.uclouvain.be'.
This is the TEST version of DIAL.mem. Please use the following URL to submit your master thesis: 'https://thesis.dial.uclouvain.be'.
 

La génération de paraphrases de données d’entrainement pour une meilleure classification des intents d’un chatbot créé avec Rasa

(2019)

Files

Cheramy_84451700_2018-2019.pdf
  • Open access
  • Adobe PDF
  • 2.74 MB

Details

Supervisors
Faculty
Degree label
Abstract
À l'ère d'Internet et de l'omniprésence numérique, les chatbots émergent et prennent place dans l'espace virtuel. Ils sont implantés dans les messageries instantanées ainsi que sur des sites web. Ils proposent leurs services aux internautes, mais également aux entreprises. Ainsi, leurs rôles vont de la recherche d'informations à la mise en place d'un service clientèle interactif. Dotés de compétences linguistiques, leur efficacité (ou « intelligence ») est bien souvent appréciée selon leur capacité à reconnaitre efficacement les intentions de l'utilisateur. En effet, une mauvaise décision de la part du chatbot quant aux volontés de l'internaute mène inévitablement à des dialogues de sourds, conduisant l'utilisateur à déserter la conversation. Afin de classifier correctement ces intentions, ou « intents », le chatbot dispose d'une base de données NLU (Natural Language Understanding). Cette dernière est composée d'énoncés reliés à des intents, permettant ensuite au chatbot de généraliser ces données en un modèle qui permettra, par la suite, de classifier (ou « comprendre ») correctement le message de l'utilisateur. C'est dans ce contexte que nous posons l'hypothèse selon laquelle une génération automatique de paraphrases depuis ces données devrait être en mesure d'améliorer le NLU et donc, à terme, les performances du classificateur d'intents. Nous débutons notre réflexion par une compréhension profonde des domaines impliqués dans la problématique : les chatbots, la classification d'intents, l'amélioration des bases de données NLU et la génération automatique de paraphrases. Nous menons ensuite une expérimentation à travers deux approches différentes. La première utilise un grand corpus de paraphrases, PPDB, afin de rechercher et de construire des phrases similaires. La seconde exploite un dictionnaire de synonymes, ReSyf, afin de générer des paraphrases grâce à des remplacements lexicaux. Nous comparons ces deux approches et testons leur efficacité sur un chatbot que nous aurons préalablement créé grâce à Rasa.