Projet OpenData

Répartition de la réussite au baccalauréat pour l'année

Axe Z

Évolution temporelle de la réussite au bacalauréat

Axe Z

Rapport Projet Open Data

Introduction

Dans un article publié par l'ENS Lyon décrivant les travaux du sociologue français Pierre Bourdieu, on retrouve cette phrase d'introduction : « En France, l'origine sociale et le capital culturel des familles pèsent encore très fortement sur les trajectoires et la réussite scolaires. » Définir la réussite académique n'étant pas aisé, notre attention a été portée sur la question du baccalauréat.

La problématique de ce projet est donc : dans quelle mesure la réussite au baccalauréat est-elle corrélée avec l'origine sociale ? Le but de ce projet n'est cependant pas de pouvoir répondre à cette question mais de fournir un ensemble d'outils visuels et interactifs pour permettre de tirer des conclusions à partir du jeu de données.

Le but de ce projet est de fournir un outil interactif et visuel pour explorer cette relation entre la réussite au baccalauréat et divers paramètres comme l'année d'obtention, la filière choisie et l'origine sociale.

Données

Jeu de données

Les données sont présentées au format CSV et comprennent les indicateurs suivants :

  • Année
  • Origine sociale
  • Pourcentage de réussite par filière (générale, technologique, professionnelle, totale)
  • Nombre d'admis par filière

Ces jeux de données sont stockées au sein de l'application.

Architecture

L'architecture de l'application s'organise comme suit : un gestionnaire d'événements est conçu pour orchestrer les interactions entre les différentes fonctions clés. Ces fonctions sont regroupées en trois module :

  • init : Chargement et prétraitement des données.
  • transform : Application des filtres pour manipuler les données.
  • draw : Génération des visualisations graphiques.

Il est important de noter que le schéma présenté ci-dessous est une simplification. Dans la réalité, des interactions sont nécessaires entre la fonction de dessin draw et l'HTML pour assurer un fonctionnement cohérent et dynamique.

Image Description
Figure 1 : Schéma de l'architecture de l'application

Traitements

Prétraitement

Les données du jeu ne sont pas exploitables directement pour notre visualisation. Elles subissent donc une phase de pré-traitement au chargement de la page pour être ensuite transformées en visualisation.

D3 effectue une conversion des données en fonction des colonnes du fichier CSV, mais il ne réalise pas de conversion de type (ex: les années sont stockées dans des variables d'entier).

De plus, les champs du jeu de données sont initialement prévus pour être lu par un humain, ils sont renommés pour simplifier leur utilisation dans le code : Origine devient origin, Nombre d'admis au baccalauréat général devient general_count, ...

Les domaines des différents champs sont également pré-calculés à cette étape (liste des différentes origines, étendue des années, ...)

Traitement

Des filtres sont appliqués pour manipuler les données. Ils permettent d'isoler ou supprimer certaines informations en fonction des besoins. Cette étape garantit que seules les données pertinentes sont transmises à la phase de dessin, optimisant ainsi le traitement global.

Représentation graphique des données

Histogramme

Visualisation 1

Ce premier graphique permet de comparer la réussite du baccalauréat pour une année en particulier sous forme d'histogramme. Étant donné qu'il est difficile de comparer en raison du grand nombre de courbes, la visualisation nous permet de sélectionner les barres à afficher. De plus, un sélecteur autorise le groupement des données en fonction de la filière ou de l'origine sociale.

Courbe temporelle

Visualisation 2

Ce graphique présente l'évolution temporelle de la réussite au baccalauréat sous forme de courbe, offrant ainsi une représentation claire des tendances. Comme pour le graphique précédent, lors du survol et du clic du graphique avec la souris, il permet d'afficher des informations détaillées, facilitant ainsi l'analyse précise des données. Cela permet une vision différente des données, facilitant ainsi les analyses.

Responsabilité sociale et environnementale

L'impact sociétal et environnemental de ce projet est aisément observable : il permet d'afficher et analyser un problème sociétal, celui de la dépendance entre le niveau d'éducation et la catégorie sociale, l'hétérogénéité de la réussite et les raisons de ces différences. Les points forts de ce projet sont sa capacité à mettre en évidence des situations de défavorisation et d'observer le succès ou l'échec des politiques sociales passées.

Pistes d'amélioration

D3 offre une grande flexibilité pour modifier des éléments grâce à un système de transitions. Actuellement, lors d'un changement de valeurs, les graphes sont entièrement redessinés, ce qui ouvre une opportunité d'optimisation.

De plus, une amélioration serait de permettre au logiciel de mémoriser les sélections effectuées entre les visualisations. Par exemple, si un utilisateur sélectionne une liste d'origine sociale dans une première vue, puis navigue vers un autre menu avant de revenir, sa sélection pourrait être préservée pour garantir une continuité et une expérience plus fluide.

Enfin, nous pourions enrichir l'expérience utilisateur en ajoutant des interactions, comme la possibilité d'ordonner les données, de zoomer ou de personnaliser davantage les visualisations.