Activité physique totale hebdomaire (en minutes) :
Temps passé devant la télévision (en minutes/semaine) :
Fréquence sur la présence au fast-food (en nombre de jours/mois):
Considère qu'il/elle possède une bonne alimentation :
Aime les fruits:
Aime le poisson:
Aime la viande:
Bienvenue sur notre étude des causes de l'obésité en France. L'ensemble des résultats provient de l'étude INCA2,
étude de 2006-2007 portée sur un échantillon diversifié de Français en métropole. L'étude originale à un but plus large que les causes de l'obésité, et contient des centaines de critères remplis par les personnes sondées.
Cependant, pour ce projet nous souhaitions nous concentrer sur les causes possibles de l'obésité en France, en permettant la visualtion de critères par zone démographique et sous forme de graphes.
Le dataset utilisé est disponible ici à cette adresse .
La prévalence d'obésité reflète de la proportion par région de nombre de personnes obèses. Une personne est dite obèse si son IMC est supérieur à 30.
L'IMC se calcule en divisant le poids de la personne par sa taille au carré.
Il est important de noter que les causes de l'obésité sont diverses et que l'IMC est un indicateur très simple ne reflétant pas tout le temps la réalité.
Il s'est imposé grâce à sa simplicité de calcul, et car il permet un regard totalement objectif sur la corpulence de l'individu.
De nouvelles alternatives sont apparus récemment, on peut citer notamment le nouvel IMC, qui permet de ne pas creuser les écarts entre les personnes de petite taille et de grande taille.
Le critère Fast Food indique le pourcentage de personnes allant plus de 1 fois par mois au fast food.
Il est important de noter que parmi les personnes sondées, certaines n'ont pas donné de réponses, le pourcentage peut donc différer de la réalité.
On constate de plus que les écarts entre régions sont assez importants! On passe notamment de +30% de réponse positive en Île de France jusqu'à seulement 12% en Poitou-Charente.
Le critère Viandes indique le pourcentage de personnes répondant aimer la viande.
Ce critère ne donne donc pas de résultat sur la consommation de viande mais plus sur le goût pour la viande.
On constate un étonnant écart sur deux régions proches avec le Limousin qui indique à 30% aime la viande et l'aquitaine seulement à 13%.
Les réponses venant du Limousin sont toutefois moins révélatrices car seulement 44 personnes ont répondu au questionnaire dans cette région. C'est la région qui comprend le moins de personnes sondées.
Le critère Poisson indique le pourcentage de personnes répondant aimer le poisson
Ce critère ne donne donc pas de résultat sur la consommation de poisson mais plus sur le goût pour le poisson dans cette région.
On constate un étonnant écart sur deux régions proches avec le Limousin qui indique à 20% aime la viande et l'aquitaine seulement à 7.50%.
Les réponses venant du Limousin sont toutefois moins révélatrices car seulement 44 personnes ont répondu au questionnaire dans cette région. C'est la région qui comprend le moins de personnes sondées.
Le critère Fruits indique le pourcentage de personnes répondant aimer le poisson
Ce critère ne donne donc pas de résultat sur la consommation de fruits mais plus sur le goût pour les fruits dans cette région.
Le critère Télévision indique la moyenne de temps passé devant la télévision par jour.
C'est certes un critère important lié au manque d'activité sportive mais il aurait fallu l'additionner avec le temps passé devant un ordinateur pour avoir des résultats plus probants.
On constate une moyenne 15% supérieure en Nord-Pas-de-Calais et 21% supérieure en Limousin.
Le critère Activité Sportive indique la moyenne de temps passé à faire du sport par semaine.
Le type d'activité n'est pas renseigné mais seuelement l'activité. Il s'agit également d'une moyenne.
Cependant,on remarque une légère augmentation de l'activité sportive dans le sud de la France par rapport au nord. Peut-être est-ce dû à la météo plus agréable...
Nous avons commencé le projet par l'étude de datasets potentiels, en pensant à la qualité des données fournies, du sujet/domaine d'étude, et aux possibles représentations des données
obtenues.
Après plusieurs essais, nous avons ciblé le secteur de l'alimentation pour deux raisons : les études visuelles sont courantes (par région, par corrélation sous forme de graphe)
et le sujet est un enjeu actuel avec la lutte contre le surpoids.
Le Jeu de donnée sélectionné pour représentation est le jeu de donnée INCA_2, il date de 2006/2007 et est le résultat d'un sondage sur 3996 individus résidant en France Métropolitaine.
Cette enquête a été ordonnée par le gouvernement Français pour étudier l'évolution des habitudes alimentaires des Français.
Pour chacune des 4000 personnes sondées il a fallu répondre à des questions
précises pendant 7 jours sur le maximum de crières possible. Au final, le jeu de donnée est tellement complexe et riche qu'il nous a fallu le réduire a seulement une dizaine de critères pour pouvoir l'exploiter en temps raisonnable.
Notre objectif initial était de mettre en place un outil de visualisation permettant de détecter des causes possibles à l'obésité. Pour pouvoir effectivement l'implémenter il a fallu
sélectionner uniquement les critères déterminant dans le cas de l'obésité/surpoids.
Pour ce faire, nous avons commencé par développer une application Java. Cette application permettait, grâce au jeu de données fourni, de calculer un "score" par "catégorie
de poids" pour un critère. Par exemple, grâce à cette application, nous avons pu remarqué que les gens en condition de maigreur regardaient moins la télévision que les gens en condition normale
qui à leur tour regardaient moins la télévision que les gens en surpoids etc
Cette application renvoie un csv qui permet de comparer efficacement les scores obtenus par catégorie et ainsi de pouvoir éluder des critères qui ne semblent pas impacter de beaucoup l'IMC d'une personne.
Cette "première passe" nous a permis de nous concentrer sur certaines zones de la base de données et donc cela permet de proposer à l'utilisateur seulement certaines possibilités de modification.
Après avoir choisi de modifier ces critères, les données sont sélectionnées puis transformées pour pouvoir être affichées, soit sous forme d'un graphique, soit d'une carte de France.
La page web étant exécutée en local, il n'y a pas de lien avec un quelconque serveur ou une quelconque base de données hébergée.
Toutes les valeurs sont stockées dans un fichier .csv et c'est ce fichier qui va permettre d'effectuer tout calcul.
Le code html est contenu sur une seule page, index.html, et tous les scripts sont contenus dans les différents fichier au format .js présents dans le dossier js.
Plusieurs technologies web ont été utilisées pour ce projet de visualisation : Notamment D3.Js,
le framework javaScript utilisé pour la représentation cartographique de France et pour la lecture du jeu de donnée.
La lecture du jeu de donnée est facilité par D3, en effet il suffit uniquement de faire un appel javascript : d3.csv('jeu-de-donnee.csv', function(data){ });
La représentation avec la carte est également faite par D3, en effet il permet de lire un fichier geojson : regions.geojson, qui décrit un SVG de chaque région. L'appel de la
méthode d3.json('fichier-json', function(req, geojson){ ... } insere dans le code HTML une liste de figures SVG avec la balise "path" correspondant aux frontières des régions.
Ensuite, les graphes dans l'onglet 'Graphe' utilisent le framework : Chart.JS, à l'aide de ce framework, il est assez rapide de générer des courbes lissées ou des nuages de points. Les deux peuvent convenir
les critères sélectionnés. Nous avons choisi de garder la courbe de référence visible lors des changements de critères pour pouvoir comparer. Cependant, il suffit de cliquer sur la légende de la courbe de référence
pour la faire disparaitre.
La gestion des appels asynchrones de manière générale est pris en charge par le framework jQuery, norme dans les applications il permet notamment de charger le contenu quand la page est chargée.
Enfin, bootstrap nous a permit de mettre en place une interface web responsive, c'est à dire qui s'adapte à la taille du navigateur. Lorsque l'on réduit la taille du navigateur les élement de la page web se réduisent de manière élégante automatiquement.