From 5e9b2e8dbf04b8110fde80845f43e8502082426e Mon Sep 17 00:00:00 2001
From: Videgrain Adrien <adrien.videgrain@student.ecp.fr>
Date: Sat, 28 Nov 2020 18:35:53 +0100
Subject: [PATCH] Update README.md

---
 README.md | 35 +++++++++++++++++++++++++++++++++++
 1 file changed, 35 insertions(+)

diff --git a/README.md b/README.md
index 6fdd7a4..79b06c2 100644
--- a/README.md
+++ b/README.md
@@ -1,5 +1,40 @@
 # README.md
 
+## Question answering sur des textes de lois
+
+Ce repository contient le travail effectuÃ© sur un projet de question answering sur des textes de loi.
+
+## Description
+
+Le Q&A est actuellement trÃ¨s dÃ©veloppÃ© pour l'anglais, mais est trÃ¨s en retard pour les autres langages, notamment le francais. On se propose de travailler sur l'Ã©tat de l'art de cette technologie avec le modÃ¨le CamemBERT, issu de la famille des modÃ¨les BERT pour le NLP.
+
+## Auteurs
+
+Adrien Videgrain
+Illias Alaoui
+Guillaume Bouzy
+Achraf Gharbi
+Amine Kili
+Orpheric Ahmed Oura
+Oumaima Chamid
+Zhihao li
+Zhufan Yu
+
+## Organisation du travail
+
+Les donnÃ©es ont Ã©tÃ© rÃ©cupÃ©rÃ©es depuis le site de legifrance Ã  l'aide d'un script de parsing : https://www.legifrance.gouv.fr/codes/texte_lc/LEGITEXT000006070719
+
+Les donnÃ©es ont ensuite Ã©tÃ© annotÃ©es avec l'aide de l'outil d'Illuin technologies : https://etiquette.illuin.tech/
+
+Il a ensuite fallu transformer les donnÃ©es pour qu'elles soient compatibles avec le modÃ¨le CamemBERT.
+
+Les donnÃ©es annotÃ©es sont trouvables dans lois.txt .
+
+Ce set de donnÃ©es a ensuite Ã©tÃ© scindÃ© en set d'entrainement, de validation et de test. Ils ne sont pas rÃ©cupÃ©rables ici car restÃ©s sur machine.
+
+L'entrainement s'est fait sur le mÃ©socentre du Moulon, dont la documentation est ci aprÃ¨s.
+
+
 ## TL ; DR
 
 ```bash
-- 
GitLab