top of page

Analyse des inégalités scolaires

Photo du rédacteur: Fynch MeynentFynch Meynent

Ce projet de groupe a été réalisé dans le cadre du cours "Python pour la data-science" enseigné à l'ENSAE Paris (Niveau M1).


Ce projet a pour but d'étudier les inégalités scolaires à partir des résultats du baccalauréat et du revenu. Pour ce faire, nous avons récupéré des données de l'Éducation Nationale sur les taux de réussite aux baccalauréats général, technologique et professionnel en 2021. Par ailleurs, nous utilisons la base de données "Structure et distribution des revenus, inégalité des niveaux de vie en 2019" de l'INSEE. Nous aurons également recours à l'annuaire de l'Éducation Nationale pour avoir les coordonnées géographiques des lycées.

Nous cherchons à répondre à la question suivante : la réussite au baccalauréat est-elle liée au revenu ?


Le projet est structuré en quatre grandes parties. La première partie concerne la récupération de toutes les bases de données, leur adaptation à notre projet et leur jointure. La deuxième partie est dédiée à la visualisation afin de pouvoir avoir une première idée de la dynamique des données. Elle regroupe plusieurs statistiques descriptives. Dans la troisième partie, nous représentons de manière géographique les données que l'on analyse grâce à des cartes interactives. Dans la dernière partie, nous testons nos hypothèses sur les inégalités scolaires grâce à la modélisation. Enfin, nous ajouterons à la fin une annexe rendant compte d'une tentative de modélisation qui n'a pas abouti, mais qui nous paraissait intéressante.

Les statistiques descriptives suggèrent que le revenu détermine davantage le choix du type de filière plutôt que le taux de réussite au bac.


Toutefois, une régression linéaire que l'on a effectuée semble souligner une légère corrélation positive entre le taux de réussite au bac et le revenu médian dans la commune. Voici le graphique pour le bac général.


Pour conclure, ce projet nous a permis de montrer qu’il existe une corrélation entre revenu médian des communes et taux de réussite au baccalauréat, mais surtout entre revenu médian et répartition des filières du baccalauréat. Ainsi, plus un lycéen habite dans une commune riche, plus il est probable qu’il se présente à un baccalauréat général et plus il est probable qu’il obtienne le baccalauréat.


Néanmoins, notre travail présente de nombreuses limites. Tout d'abord, nos indicateurs sont discutables. Par exemple, le revenu médian ne tient pas compte des valeurs extrêmes. De plus, il ne tient pas compte des inégalités au sein d'une ville. Ainsi, il ne nous a pas été possible de mettre en évidence les inégalités au sein d'une même ville, notamment celles qui ont plusieurs lycées. Par exemple, la ville de Grenoble est partitionnée entre des quartiers aisés et des quartiers plus populaires, mais cette distinction n'a pas pu être mise en évidence. Surtout, on a déterminé le revenu par rapport aux revenus d'où se trouvent les lycées et non pas les communes de leurs secteurs associés à la carte scolaire. En effet, nous n'avions pas accès à la carte scolaire des lycées ni au revenu par secteurs. Malgré tout, les secteurs de la carte scolaire sont peu pertinents pour appréhender la filière professionnelle.

Par ailleurs, il aurait été intéressant d'aborder le revenu comme un facteur pouvant influencer la réussite au baccalauréat au milieu d'autres (position sociale des parents, nombre d'élèves par classe...). Cela nous aurait permis de conclure sur l'importance du revenu pour expliquer la réussite et donc d'établir ou non un lien de causalité.


Il convient de noter que ce projet était avant tout un projet de data science. Un travail important a été effectué pour implémenter la carte interactive. Il serait donc intéressant de regarder le lien GitHub du projet pour plus d'informations.

6 vues0 commentaire

Posts récents

Voir tout

Comments


bottom of page