Challenge Open Data
Rapport de réalisation du projet Challenge Open Data
Introduction et motivations
Ce projet Challenge Open Data est réalisé par une équipe de trois personnes. Le but est de visionner l'évolution de l'épidémie de Covid-19 face à la campagne de vaccinations, et également de comprendre l'impact de l'épidémie sur la santé mentale des français ainsi que leur comportement face au virus.
1. Description du jeu des données
Les jeux de données choisis dans le cadre du projet Challenge Open Data sont récupérés à partir de https://www.data.gouv.fr/fr/datasets. Il s'agit de trois fichiers csv (stockés dans le répertoire Data). Le premier fichier csv indicateurs_covid.csv contient des chiffres clés sur l'évolution de l'épidémie en France par région. Ces chiffres englobent un ensemble d'indicateurs sur l'épidémie comme : le taux d'incidence, le nombre de cas positifs par jour, les réanimations... Le deuxième fichier est vaccinations.csv comporte des données relatifs à la compagne de vaccinations en France par région. Le troisième fichier est sante_mentale.csv. Celui-ci contient des indicateurs calculés selon des critères et décrivant l'impact de l'épidémie sur la santé mentale et le comportement des français selon les régions.
2. Traitement des données
Nous avons développés un logiciel pour le traitement des fichiers csv afin de récupérer les données utiles pour notre projet. Ce logiciel est composé de deux fichiers écrits en python. Chacun de ces scripts lit dans les fichiers csv correspondants, extrait les données nécessaires (par exemple, pour le fichier indicateurs_covid.csv, on a besoin que de la date, la région et le taux d'incidence de la pandémie). Ensuite, des structures de données généralement sous forme de dictionnaires sont créés pour contenir ces données et puis sont stockées directement dans des fichiers JSON (qui sont très faciles à manipuler par du code JavaScript). Nous avons choisi des durées plus restrictives pour les jeux de données. Pour le visionnage du nombre de cas positifs et de vaccinés, nous avons considéré la période du 01/06/2020 au 15/09/2021. Alors que le visionnage de l'impact sur la santé mentale et le comportement n'est possible que pour une période entre le 23 mars 2020 et le 10 octobre 2020. Cette différence entre les périodes de visionnage est due à un manque de source de données (peut être parce qu'un recensement pour le deuxième jeu de données pour une période proche n'est pas encore effectué)
2. Description de l'interface
L'interface de l'application est organisée comme suit :
  • En-tête : permet à l'utilisateur de basculer entre le visionneur des données et le rapport du projet
  • Carte des Régions de France : est une carte SVG représenant les régions de France différenciés selon le nombre de populations par des nuances de bleu (voir légende). Pour une date donnée et sur chaque région apparaissent deux cercles rouge et vert. Le cercle rouge représente les individus positifs aux covid. Le rayon du cercle est calculé comme suit : nombre_d_individus_positifs / maximum_d_individus_positifs * 50. Le nombre d'individus positifs est calculé à partir du taux d'incidence. Le cercle vert représente les individus vaccinés (dose complète) et son rayon est calculé de la même manière.
  • Graphe des indicateurs de santé et de comportement : il s'agit d'un graphe à six axes. Les trois axes du haut sont réservés à trois indicateurs décrivant la santé mentale des français, tandis que les trois du bas des indicateurs sur le comportement et le respect des gestes barrières. Le calcul de ces indicateurs est expliqué dans : le lien suivant
  • Timeline d'évolution : l'utilisateur a également la possibilité de basculer entre différentes dates sur un timeline. Il peut également visionner une animation de l'évolution des cas positifs du covid, des vaccinés et des indicateurs de santé et de comportement pour une région donnée en cliquant sur le bouton play et stopper l'animation à tout moment par un simple clic sur le bouton pause.
3. Description de l'architecture du projet

La figure ci-dessus décrit l'architecture du projet. Cette architecture est composée de trois parties. La base de données qui contient les fichiers csv (voir description de la section 1). La partie traitement de données est écrite en python et et utilise le module csv pour lire dans les fichiers de données et le module json pour produire les fichiers json qui sont ensuite livrés à la partie de la visualisation. La troisième partie est la partie de la visualisation qui est en grande partie contenue dans le fichier index.html. Ce fichier contient tous le corps de l'application ainsi que les fichiers javascript qui pilote la page.