Show Less
Open access

Effort environnemental et équité

Les politiques publiques de l’eau et de la biodiversité en France

Series:

Edited By Valérie Deldrève, Jacqueline Candau and Camille Noûs

Cet ouvrage contribue, à travers la notion d’effort environnemental, au débat sur les relations entre équité et efficacité des politiques publiques. Quel est l’effort environnemental demandé et quelle est sa répartition sociale ? Quels principes y président et quels sentiments de justice ou d’injustice sont générés ? En quoi les politiques environnementales qui requièrent cet effort contribuent-elles à créer, renforcer ou diminuer les inégalités sociales et environnementales existantes ? Il explore l’hypothèse, inspirée des controverses présentes dans la littérature, d’un effort environnemental plus élevé des populations les plus vulnérables socialement, indépendamment de leur plus faible impact sur l’environnement. Elle est mise à l’épreuve de deux politiques environnementales sectorielles : celle des parcs nationaux pour la biodiversité et celles des mesures agro- environnementales européennes et captages Grenelle pour l’eau. Les cas d’étude choisis dans des territoires de l’hexagone ou ultra-marin sont analysés depuis les points de vue post-colonial, d’écologie politique et de justice environnementale. Ils ont permis de cheminer vers une conceptualisation de la notion d’effort environnemental.

Show Summary Details
Open access

Chapitre 3 Ségrégation environnementale et risques industriels. Les populations à bas revenu de la métropole Aix-Marseille-Provence sont-elles plus exposées aux sites Seveso ? (Baptiste Hautdidier, Yves Schaeffer, Mihai Tivadar)

←112 | 113→Chapitre 3

Ségrégation environnementale et risques industriels. Les populations à bas revenu de la métropole Aix-Marseille-Provence sont-elles plus exposées aux sites Seveso ?1

Baptiste Hautdidier, Yves Schaeffer, Mihai Tivadar

Introduction

Implanté en contiguïté du tissu bâti marseillais, le Parc national des Calanques a été pensé et présenté dès sa création comme un parc (péri)urbain. Plus encore que pour d’autres aires protégées, les activités humaines et des modes d’habiter locaux – actuels et passés – ont été explicitement pris en compte dans la réflexion sur la conservation. De ce point de vue, l’histoire de l’agglomération impose un héritage particulier : très largement associée à ses ports, Marseille a aussi été marquée par l’essor d’une intense activité industrielle dès la fin du XVIIIe siècle. Loin de l’image irénique que pourrait notamment suggérer la figure de la fabrique de savon, nombre de ces implantations ont très vite été contestées et reléguées dans les Calanques. Et au gré des requalifications urbaines et éventuelles gentrifications, ces sites et pollutions font l’objet d’un héritage ambigu, entre traitement technique, réhabilitation patrimoniale et formes d’effacement (Daumalin et Laffont-Schwob, 2016). À l’échelle de la métropole actuelle, la question de la répartition des sites industriels (lourds) et de leurs risques se pose avec une acuité renouvelée, dans la mesure où s’y concentrent des sites majeurs du secteur pétrochimique ←113 | 114→de la France métropolitaine, notamment sur les communes de Berre-l’Étang, Fos, Martigues, et Port-Saint-Louis.

Les inégalités socio-spatiales sont un autre fait saillant du cas marseillais, la métropole Aix-Marseille-Provence étant souvent présentée comme ayant les plus fortes disparités de France. Parmi les douze aires métropolitaines identifiées par l’Insee (Brutel, 2011), elle se classe troisième pour la ségrégation par le revenu, et même première s’agissant de la ségrégation au sein de sa ville-centre (Floch, 2017). Elle compte ainsi 59 quartiers prioritaires de la politique de la ville sur son territoire, dont 35 sur les seuls arrondissements marseillais. Dès lors, la présence concomitante de risques pour les populations riveraines des sites industriels et de fractures socio-spatiales dans l’espace résidentiel font d’Aix-Marseille-Provence un terrain pertinent pour éprouver la question du cumul des inégalités : les résidents de la métropole les plus désavantagées socialement sont-ils aussi – du fait de leurs localisations résidentielles – les plus exposées aux risques industriels ?

Cette question empirique s’inscrit dans une forme de continuité par rapport aux préoccupations théoriques et méthodologiques ouvertes par le champ de la Justice Environnementale. Construite autour de la mise en évidence des inégalités raciales et sociales en matière d’exposition aux produits toxiques et déchets dangereux, l’environmental justice a, dès sa naissance à la fin des années 1970 aux États-Unis, articulé les registres de la recherche universitaire et des mobilisations militantes. Si les inégalités face aux nuisances et risques environnementaux en sont demeurées un sujet prédominant, la justice environnementale n’a cessé depuis d’élargir sa portée thématique et géographique (Schlosberg, 2013) : attention accordée aux caractéristiques environnementales favorables au bien-être, évolution de la documentation des inégalités vers l’analyse des raisons sous-jacentes de ces inégalités, passage de l’équité distributive à une conception pluraliste de la justice incluant les questions de reconnaissance, de participation, de capacités, de justice communautaire et de justice au-delà des humains. Parallèlement, cette littérature et ces mouvements se sont répandus dans divers pays et ont pris en compte des questions globales, telles que la justice climatique (Schlosberg et Collins, 2014).

La présente étude vise à contribuer aux réflexions méthodologiques et empiriques du plus ancien volet de cette littérature. Portant sur l’inégale exposition aux risques environnementaux et reposant sur une conception distributive de la justice, ce socle a pour référence normative le principe selon lequel chaque personne a droit à un environnement sain et sûr ←114 | 115→(Boyce et al., 2016) : il est ainsi intrinsèquement injuste que des populations désavantagées socialement (minorités raciales ou populations à bas revenus) aient à supporter des conditions environnementales plus défavorables à leur santé que le reste de la population. L’objectivation de cette forme d’inégalité environnementale n’est toutefois pas chose aisée. Les difficultés sont liées aux données et aux méthodes disponibles pour conduire l’analyse. Elles tiennent aussi à la complexité des processus étudiés – en termes d’échelles, de temporalités, d’interactions et de compensations avec d’autres processus (Oakes, 2004, Fischer, 2006) – qui rendent toutes interprétations causales délicates. Malgré l’ancienneté de cette problématique, celle-ci fait toujours l’objet de débats et de propositions méthodologiques (Mitchell et Walker, 2007 ; Boyce et al., 2016 ; Schaeffer et Tivadar, 2019).

Ainsi, l’objectif du chapitre est double : (i) comparer deux approches originales pour mesurer ces inégalités environnementales d’exposition aux risques, et (ii) fournir des éléments de réponses – à défaut d’une réponse définitive – à la question posée plus haut pour la métropole d’Aix-Marseille-Provence. La première approche empirique considérée est celle suggérée récemment par Schaeffer et Tivadar (2019). Elle s’inspire de la littérature sur la mesure de la ségrégation socio-spatiale et repose sur le calcul d’un indice de centralisation environnementale. La seconde approche mobilise des outils de la statistique du point, les fonctions empiriques de Ripley (1976). Initialement développées pour l’analyse spatiale en écologie et en épidémiologie, elles n’ont été que marginalement appliquées à l’analyse des inégalités environnementales (Fisher et al. 2006). La section qui suit présente notre cas d’étude, les données disponibles, ainsi que nos questions et approches empiriques. Les troisième et quatrième sections présentent en détail nos méthodes et nos résultats. La dernière section discute les résultats obtenus, avant de conclure.

Cas d’étude, données, questions et approches empiriques

Nous considérons dans cette étude la population et les sites industriels dangereux situés dans la métropole d’Aix-Marseille-Provence (Fig. 1). Notre question d départ est la suivante : les populations les plus ←115 | 116→désavantagées socialement sont-elles aussi – du fait de leurs localisations résidentielles – les plus exposées aux risques industriels ?

Les données de population les plus précises disponibles pour répondre à une telle question sont les données carroyées fournies par l’Institut national de la statistique et des études économiques (Insee), établies à partir des déclarations fiscales des ménages pour l’année 20102. Pour chaque carreau habité de 200 m x 200 m, un nombre total de résidents est renseigné, ainsi qu’entre autres indicateurs une estimation du nombre d’individus à bas revenu. Les individus à bas revenus sont ceux appartenant à un ménage dont le revenu par unité de consommation (avant impôts et prestations) est inférieur à 60 % de la médiane de la distribution au niveau de la France métropolitaine (soit 11 249 euros d’après cette source). Sur l’ensemble de la métropole marseillaise, les effectifs sont de l’ordre de 430 000 et 1,44 million d’individus, respectivement pour les bas revenus et pour le reste de la population.

Par ailleurs, des données sur les sites industriels présentant des dangers pour la population sont fournies par le Ministère français de l’Écologie, en application de la directive européenne Seveso-III (Directive 2012/18/UE) sur la réduction des risques de catastrophes technologiques. Ces données dites « Seveso » donnent l’emplacement des établissements industriels où des substances dangereuses sont utilisées ou stockées en grandes quantités, les classant selon le niveau de risque en seuils « haut » et « bas ». Sur la métropole Marseille-Aix-Provence, 25 et 43 établissements sont respectivement identifiés en seuil haut et seuil bas en novembre 2017. Rapportée à la population, le décompte du total de ces installations correspond à 184 % et 150 % des moyennes respectives de la France et de l’Union européenne3.

Ces données présentent des avantages et des limites par rapport à celles couramment utilisées dans les études quantitatives portant sur les inégalités environnementales. Leur principal atout est leur résolution spatiale, qui permet de travailler à une échelle infra-communale, suffisamment fine pour saisir les disparités entre quartiers en termes de profils sociodémographiques, ainsi qu’une dimension matérielle importante dans la ←116 | 117→prise en compte des niveaux potentiels d’exposition aux risques (Laurian, 2008). Le recours à des données carroyées fines permet également de contourner nombre d’écueils d’agrégation spatiale liés aux échelles et aux géométries des objets géographiques utilisés comme support à l’analyse (le modifiable area unit problem ou MAUP, cf. Wong, 2004). Leur principale limite est l’absence de qualification précise des risques encourus par les populations situées à proximité des sites industriels. Nous savons pour chaque site industriel classé Seveso qu’une dangerosité est présente, mais sans information sur la fréquence, l’intensité et l’extension spatiale probables de l’aléa (excepté à travers l’indication qualitative d’un seuil de danger haut ou bas). En particulier, nous ne mobilisons ici ni les cartographies des études de danger, ni les plans de prévention des risques technologiques et les plans d’urgence que les établissements Seveso seuil haut sont tenus de réaliser.

Partant des données à notre disposition, notre questionnement initial peut être précisé de la sorte : du fait de leurs localisations résidentielles, les individus à bas revenu de la métropole d’Aix-Marseille-Provence sont-ils plus exposés aux sites Seveso – et aux sites Seveso les plus dangereux – que le reste de la population ?

Il reste à définir précisément ce que l’on entend par « plus exposés ». C’est là qu’interviennent nos propositions de méthodes :

Selon l’approche de la centralisation environnementale, les individus à bas revenu sont plus exposés aux sites Seveso s’ils sont plus concentrés que le reste de la population dans les zones résidentielles les plus proches de ces sites, cette concentration relative étant mesurée à l’aide d’un indice d’inégalité spatialisé ;

Selon l’approche des fonctions empiriques de Ripley, les individus à bas revenu sont plus exposés aux sites Seveso si leur répartition dans l’espace résidentiel – en comparaison d’une répartition aléatoire des individus et des sites – reflète statistiquement une plus grande agrégation spatiale (ou une moindre répulsion spatiale) par rapport aux sites Seveso que celle du reste de la population.

Ainsi, notre questionnement est aussi méthodologique : l’approche de la centralisation environnementale et celle des fonctions empiriques de Ripley donnent-elles des résultats qualitativement comparables concernant les inégalités d’exposition aux risques Seveso à Aix-Marseille-Provence ?

Fig. 1 Emprise de la métropole Aix-Marseille-Provence, représentant les sites Seveso (disques et cercles) et une typologie bivariée croisant sur une grille hexagonale la densité de la population avec le taux de pauvreté

Source : INSEE, retraitement des données carroyées 2010 à 200m, geo.data.gouv.fr, BRGM, 2017

←117 | 118→

L’approche par la centralisation environnementale

Méthode

La première approche méthodologique proposée s’inspire fortement de la littérature sur la mesure de la ségrégation sociale résidentielle. Cette littérature étudie la séparation géographique entre groupes sociaux dans un contexte urbain, un phénomène jugé négativement par la plupart des auteurs académiques ou des acteurs politiques (e.g. Fitoussi et al., 2005). Ce phénomène est connu de longue date pour être multidimensionnel (Massey et Denton, 1988). Parmi ces dimensions figure la centralisation, étudiée initialement en relation avec le phénomène supposé du white ←118 | 119→flight (Farley et al., 1978) : l’idée que l’afflux de populations noires défavorisées des campagnes du Sud ségrégationniste vers les centres villes américains aurait engendré une réaction de fuite des blancs vers les périphéries urbaines (Boustan, 2010, 2016). Pour vérifier cette théorie, il fallait pouvoir mesurer la centralisation relative des noirs et des blancs par rapport à un centre urbain, puis observer son évolution temporelle. Les centres villes s’étant paupérisés sous l’effet de cette dynamique, la centralisation était aussi la mesure d’un désavantage relatif des noirs par rapport aux blancs : habiter les centres villes les exposait à des taux plus élevés de criminalités et de chômage, ou encore à des écoles et des infrastructures de moins bonne qualité.

Ce questionnement sur les désavantages relatifs de localisation rejoint notre questionnement de justice environnementale : les individus à bas revenus sont-ils désavantagés relativement au reste de la population – non pas du fait de leurs localisations par rapport au centre de la métropole – mais via leurs localisations par rapport aux sites Seveso ? Les méthodes développées pour l’analyse de la centralisation dans la littérature sur la ségrégation résidentielle peuvent donc être remobilisées pour l’analyse des inégalités environnementales.

Le point de départ méthodologique est l’indice de centralisation relative (Relative Centralization Index), noté RCE, de Duncan et Duncan (1955). Le RCE est une forme de l’indice de Gini adaptée à la comparaison des localisations résidentielles de deux groupes sociaux autour du centre d’une ville.

Plus précisément, le calcul de cet indice est basé sur une courbe dite de Lorenz dont l’axe vertical est la proportion cumulative de la population y et l’axe horizontal la proportion cumulative de la population x dans les unités spatiales, qui sont ordonnées en fonction de leur distance croissante au centre (à la différence de la courbe de Lorenz associée à l’indice de ségrégation sociale de Gini, où les unités sont ordonnées en fonction de la proportion croissante du groupe social minoritaire). La valeur du RCE correspond à la surface entre cette courbe et la diagonale matérialisant une égalité parfaite des distributions des deux populations relativement au centre.

←119 | 120→xi et yi sont les proportions cumulatives des populations x et y ordonnées par la distance au centre ; si la population x est située plus près du centre que y, et inversement si . Le RCE admet des valeurs dans l’intervalle [-1,1] mais il est en réalité borné par l’indice de Gini, puisque son maximum et minimum sont obtenus quand l’ordre des unités spatiales par rapport à la distance au centre est identique à l’ordre basé par la proportion de la population (Folch et Rey, 2016).

Folch et Rey (2016) ont défini récemment une version locale du RCE, en sélectionnant les k voisins les plus proches du centre de référence (ou alternativement les unités spatiales qui se situent dans une bande de distance donnée autour de ce centre). Dans le cas présent, nous souhaitons étudier les localisations relatives de deux populations autour de plusieurs « centres », correspondant aux différents sites industriels dangereux. La façon la plus simple de généraliser l’indice RCE à plusieurs centres est de considérer, pour chaque unité spatiale, sa distance par rapport au centre le plus proche. Il est possible aussi de combiner cette approche polycentrique à l’approche locale de Folch et Rey (2016) : l’indice RCE est appliqué aux unités spatiales situées à une distance inférieure à d de leur plus proche nuisance environnementale. Cet indice de centralisation environnementale polycentrique avec contrainte spatiale, noté ECd, a été proposé par Schaeffer et Tivadar (2019) :

xi et yi sont ordonnés en fonction de la distance à la nuisance environnementale la plus proche, et k est le rang de la dernière unité spatiale qui respecte la contrainte spatiale : . Si la population x est située plus près de la nuisance environnementale que y, et inversement si .

Si l’on tient compte de toutes les uni tés spatiales, on obtient la forme non contrainte de l’indice, où est la distance maximale à la nuisance dans la zone d’étude. Les auteurs proposent également une stratégie de randomisation permettant de tester la significativité des valeurs d’indice observées au regard de celles qui résulteraient d’un processus aléatoire. La méthode repose sur des simulations Monte Carlo de localisation des ménages, basées sur un processus aléatoire contraint par des pondérations proportionnelles au nombre total ←120 | 121→de ménages observés dans les unités spatiales (comme proxy pour l’offre de logement, qui contraint les possibilités de localisations). Pour chaque simulation, une distribution aléatoire de la population est générée et l’indice de centralisation relative est calculé. Ce processus est répété un nombre suffisant de fois pour générer une distribution simulée de l’indice. La position de l’indice empirique dans la distribution des valeurs simulées fournit une pseudo p-value pour l’observation. Cette approche est mise en œuvre à l’aide du package SegEnvIneq disponible pour le logiciel statistique R4.

Résultats

Pour l’ensemble des sites Seveso

Les résultats portant sur l’ensemble des sites Seveso (seuils bas et haut confondus) et l’ensemble de la population de la métropole sont très clairs : les individus à bas-revenus sont plus proches des sites Seveso que le reste de la population.

La valeur de l’indice (avec x pour les individus pauvres et y pour le reste de la population) est en effet positive et significative (Tab. 1 et Fig. 2A). La courbe de Lorenz associée à cette valeur (Fig. 3A) montre que la proportion cumulée d’individus pauvres est toujours supérieure à celle des individus non-pauvres, quel que soit l’éloignement aux sites dangereux. Par exemple, il y a plus de 60 % des pauvres, mais moins de 50 % des non-pauvres qui résident à moins de 5 km d’un site Seveso.

L’introduction d’une contrainte spatiale nuance le résultat pour les tous premiers kilomètres autour des sites industriels. La Fig. 3 présente les valeurs d’indices en restreignant l’analyse à une distance d de 200 mètres autour des sites dangereux, puis en élargissant le rayon d’analyse par pas de 200 mètres jusqu’à atteindre l’éloignement maximal (Fig. 4A). Dans les trois ou quatre premiers kilomètres, les indices sont le plus souvent positifs, mais ils peuvent néanmoins admettre des valeurs négatives, ce qui signale une certaine mixité sociale dans ce voisinage immédiat. Au-delà, le résultat d’une plus grande proximité des individus pauvres aux sites dangereux s’établit très nettement.←121 | 122→

Pour les sites Seveso à seuil de risque élevé

Les résultats obtenus pour l’ensemble des sites Seveso valident l’hypothèse d’un cumul d’inégalités économiques et environnementales. Toutefois, cette hypothèse n’est plus vérifiée dès lors qu’on introduit une notion d’intensité du risque. En considérant cette fois l’ensemble de la population de la métropole, mais uniquement les sites Seveso à seuil de risque élevé, la conclusion est en effet inversée : les individus à bas-revenus sont plus éloignés des sites très dangereux que le reste de la population.

La valeur de l’indice (avec x pour les individus pauvres et y pour le reste de la population) est négative (Tab. 1). Sa valeur absolue est bien plus faible (0,03 contre 0,2 pour l’ensemble des sites Seveso), mais néanmoins significative (Tab. 1 et Fig. 2B).

Plus en détail, mais toujours en considérant l’ensemble de la population de la métropole, la courbe de Lorenz (Fig. 3B) montre que la configuration spatiale est assez complexe : les individus non-pauvres sont plus concentrés près des sites que les pauvres pour la plage de distance partant de 0 et jusqu’à environ 12 km des sites (la courbe est située au-dessus de la diagonale d’égalité parfaite). Au-delà, la situation contraire prévaut (la courbe croise et passe en dessous de la diagonale). Globalement, on a donc une surreprésentation des individus non-pauvres à proximité des sites (par exemple, près de 50 % des non-pauvres, mais à peine plus de 40 % des pauvres résident à moins de 10 km du site Seveso à seuil haut le plus proche), mais aussi dans la couronne la plus éloignée des risques (on a ainsi environ 20 % des non-pauvres et à peine plus de 10 % des pauvres qui résident à une distance supérieure à 15 km du site dangereux le plus proche).

L’introduction d’une contrainte spatiale nuance encore ces résultats globaux (Fig. 4B). Les valeurs d’indices oscillent dans l’immédiate proximité des sites, qui présente donc une relative mixité sociale. Après ces oscillations, à partir de 3 km environ, on observe une plage où les indices prennent des valeurs positives : en s’éloignant progressivement des sites, on atteint donc une couronne où les individus non-pauvres sont surreprésentés ; lorsqu’on ne considère plus l’ensemble de la population de la métropole, mais qu’on focalise l’attention sur la population située dans un rayon plus limité autour des sites, on retrouve une situation d’inégalité environnementale, les plus désavantagés en revenu étant aussi les plus proches des sites très dangereux.←122 | 123→

À partir d’environ 8 km, les valeurs d’indice baissent jusqu’à devenir négatives et atteindre un minimum peu après 10 km. Cette baisse signale une forte surreprésentation des individus pauvres dans cette plage de distances, qui explique l’inversion du résultat : une fois cette population inclue dans l’analyse, les individus pauvres sont globalement plus éloignés des risques. On retrouve pour finir la surreprésentation des individus non-pauvres dans la couronne la plus éloignée des sites, qui a pour effet de faire remonter les valeurs d’indice, mais ne suffit pas à ré-inverser le résultat.

Tab. 1 Indice de centralisation environnementale et test de significativité

Distance maximale (dmax)

ECd empirique

ECd simulée (moyenne)

Rang a

Pseudo

p-value

Sites Seveso

25,7 km

0.2017

0

500

0.002

Sites Seveso seuil haut

45,5 km

- 0.0333

0

1

0.002

Notes : a Le rang correspond à la position de la valeur observée dans la distribution des valeurs simulées

Fig. 2 Test de significativité (permutations de Monte Carlo) de la centralisation environnementale

Fig. 3 Courbe de Lorenz de la centralisation environnementale (rouge) et courbe de distance aux sites (bleue)

Fig. 4 Indices de centralisation environnementale contraints spatialement (calculés avec un pas de 200 m)

←124 | 125→

L’approche par les fonctions empiriques de Ripley

Méthode

La seconde approche relève de la statistique du point, qui vise à caractériser la structure spatiale d’un ou plusieurs processus ponctuels, et ce à différentes échelles. Le principe de la fonction empirique K proposée par Ripley (1976) est, pour un point quelconque, de mesurer un voisinage (soit l’espérance du nombre de points voisins) à l’intérieur d’un disque de rayon r croissant, jusqu’à atteindre les limites de la zone d’étude. La construction de la fonction consiste alors à diviser par la densité du processus (λ) et sommer, pour une même valeur de r, sur l’ensemble du semis de points considéré. Parce que la relation entre la structure du semis et le choix d’un découpage empirique peut amener à des biais difficilement interprétables dans la prise en compte des points en bordure de la zone d’étude, la littérature a très vite développé des méthodes de réfaction des effets de bords (Floch et al. 2018). Une extension de ces approches a été proposée dès 1982 pour qualifier des structures spatiales intertypes, c’est à dire la relation entre les semis d’au moins deux types de points distincts au sein d’une même aire d’étude (Goreaud & Pélissier, 2003). Une autre extension a permis de considérer l’éventuelle inhomogénéité des semis, en introduisant la possibilité d’une modélisation de la fonction d’intensité. L’intensité, propriété de 1er ordre d’un processus ponctuel, peut en effet être non constante alors même que la structure spatiale (propriété de 2nd ordre) en reste aléatoire5.

L’application ici proposée tire parti de ces développements, en qualifiant donc, sur l’emprise de la métropole Aix-Marseille-Provence, les relations entre les localisations des sites Seveso et de la population, elle-même partitionnée sur un critère socioéconomique (le revenu). Dans sa version « inhomogène », la formule empirique exprimant la relation entre la localisation des sites Seveso et des individus membres de foyers à bas revenu est alors de la forme suivante :←125 | 126→

W désigne la superficie de la zone d’étude, X les deux semis de points observés, λ la modélisation de leurs densités, e une réfaction des éventuels effets de bords6, x la localisation d’un point (lieu de résidence ou site industriel) en coordonnées bidimensionnelles. Dans la version « homogène » de la fonction, les valeurs de λ sont identiques et constantes.

Les courbes de ces fonctions empiriques peuvent être évaluées au regard d’une hypothèse nulle correspondant à des structures spatiales particulières. L’hypothèse d’un semis aléatoire (CSR = complete spatial randomness) est ainsi de la forme pour la fonction de Ripley, correspondant à un semis dit de Poisson. Dans le cas d’un processus ponctuel multitype, la spécification la plus simple d’un modèle correspondant à l’hypothèse nulle suppose alors un processus de Poisson et un étiquetage aléatoire des points (CSRI = complete spatial randomness & independance). Afin d’aider à l’interprétation visuelle d’un écart à l’hypothèse nulle, Besag (1977) a pu proposer une fonction L, qui est une version linéarisée-centrée de la fonction K :

La courbe correspondant à l’hypothèse de CSR(I) se confond alors avec l’axe des abscisses ( ), ce qui rend l’interprétation plus directe : si la courbe de la fonction empirique est dans le négatif pour une distance r, la structure spatiale est sur cette gamme d’échelle plus régulière que ce que l’on attendrait d’un semis aléatoire, ce qui signale une répulsion relative. Si elle est dans le positif, elle est plus agrégée, ce que l’on peut interpréter comme de l’attraction. La fonction étant cumulative, la courbe ne doit toutefois pas être lue de manière directe pour identifier la bonne échelle d’interaction des processus ponctuels (Baddeley et al., 2015). Afin de pouvoir tester la significativité statistique de ces écarts, le recours à des méthodes de Monte Carlo a été conseillé. Par la ←126 | 127→compilation de simulations de semis compatibles avec l’hypothèse nulle, elles permettent de construire des enveloppes dont il peut être fait une lecture locale, avec rejet éventuel de l’hypothèse nulle pour une valeur donnée de r (pour 39 simulations, le seuil est à 5 %). Du fait des artefacts liés à la délimitation du semis observé, mais surtout de la prise en compte des variations d’intensité dans les versions « inhomogènes » des fonctions, les enveloppes des simulations peuvent s’éloigner sensiblement de l’axe des abscisses.

Pour minimiser les biais inhérents au caractère arbitraire de la définition et au découpage de la zone d’étude sur un jeu de données, dont une proportion importante des observations est localisée à proximité des limites de la fenêtre d’observation, il peut être pertinent d’effectuer des redécoupages ad hoc de la zone d’étude, afin de couvrir plus exhaustivement les interactions spatiales entre populations et risques aux abords extérieurs de la métropole. Ainsi, il a été choisi de reconstruire la zone d’étude par des zones tampon de 20 km autour des sites Seveso situés sur le territoire de la métropole Aix-Marseille-Provence. La nouvelle emprise est particulièrement modifiée sur l’ouest, avec un net élargissement autour de Fos et Port-Saint-Louis. Par ailleurs, cette méthode basée sur des semis de points est très coûteuse en ressource informatique. S’agissant de jeux de données de population très conséquents (respectivement ~430 000 et 1,44 M individus), on réalise un sondage aléatoire des individus (1/20) pour faciliter la mise en œuvre de cette approche.

Résultats

Pour l’ensemble des sites Seveso

Les courbes des fonctions L intertype – calculées dans un premier temps sans tenir de l’inhomogénéité des semis (Fig. 5) – peuvent être interprétées comme suit. Jusqu’à 1 km, nos résultats divergent pour les deux types de population : on note une attraction relative entre sites Seveso et résidents pauvres, tandis qu’on ne peut rejeter l’hypothèse nulle d’une répartition aléatoire pour les non-pauvres. Ce seuil peut s’expliquer par la morphologie urbaine associée aux sites Seveso (taille de l’implantation, urbanisme prévoyant des zones industrielles dédiées) mais aussi à des dispositions réglementaires limitant la construction et le renouvellement des habitats sous la zone d’influence définie par l’étude de risques ←127 | 128→du site (interdiction, autorisation…). Le résultat est par contre convergent pour les deux populations à partir d’1 km : la structure spatiale intertype (par rapport aux sites Seveso) des résidents pauvres et non-pauvres est alors commune. On observe une attraction relative, qui reste nettement plus marquée pour les individus pauvres. Ce n’est qu’après 8 km que les courbes se croisent.

Fig. 5 Fonction Lhomogène intertype centrée, sur distance aux sites Seveso (en km). En violet, les individus membres de ménages à bas revenu. En orange les autres. En transparence, les enveloppes des simulations de CSR pour les deux processus (n = 39)

Comme évoqué précédemment, la méthode est basée sur des hypothèses très simplificatrices, dont celle de l’homogénéité des processus ponctuels. Or les structures spatiales sous-tendant les localisations des établissements humains n’ont pas une intensité constante : une spécialisation peut s’opérer à des échelles intermédiaires entre quartiers d’habitats et industries, de même qu’un tri spatial entre habitants par le filtre de l’accessibilité au logement et à l’emploi. Il est pertinent de chercher à prendre en compte cette inhomogénéité des semis pour éviter d’éventuelles surinterprétations, au prix d’une complexification de l’interprétation : la logique d’utilisation de la fonction vaudra plus pour la comparaison entre bas et hauts revenus que pour leur relation à une hypothèse nulle (de processus poissoniens). L’approche consiste alors à construire des fonctions de densité – par une estimation par noyau – pour les trois types de point, dont les valeurs locales seront réutilisées pour le calcul d’une fonction Linhomogène.

Fig. 6 Lissage automatisé de la densité λ pour les trois processus ponctuels considérés : habitants pauvres, non-pauvres et sites Seveso. Écart-type du noyau de lissage (σ): 10 km

←128 | 129→Comme l’illustre la Fig. 6, il y a ainsi à l’échelle de la métropole – littorale et à forte activité portuaire – une disjonction entre les fortes densités de la population (autour de Marseille) et des sites Seveso (autour de Fos-Martigues)7. La Fig. 7 permet de visualiser les fonctions Linhomogène tenant compte de ces lissages, introduisant des dents de scie pour les deux fonctions empiriques intertypes.

Fig. 7 Fonction Linhomogène intertype centrée, sur distance aux sites Seveso (en m). En violet, les individus membres de ménages à bas revenu. En orange, les autres. En transparence, les enveloppes des simulations de CSR pour les deux processus (n = 39).

Les enveloppes des simulations étant plus larges et grossissant assez vite avec r, le rayon de la fenêtre d’observation dans laquelle est calculée ←129 | 130→la fonction, le risque de surinterprétation est limité. En dépit des artefacts du graphe, les patterns et seuils sont assez sensiblement différents : 0–3 km, 3–5 km, 5–6 km. On observe ainsi un comportement de répulsion des deux populations jusqu’à 3 km, puis des seuls individus pauvres jusqu’à 6 km (la courbe est en dessous de l’intervalle d’acceptation de la CSR – en violet clair). Après 6 km, les structures intertypes des deux populations passent à une attraction relative. La prise en compte des variations d’intensité des semis a donc des conséquences notables sur la conclusion : l’interprétation n’est plus celle d’une agrégation relative dans des petites plages de distance, le différentiel entre pauvres et non-pauvres est moins net, voire inversé.

Pour les sites Seveso seuil haut

Cette analyse est cette fois-ci centrée sur les seuls sites Seveso à seuil haut. Les résultats (Fig. 8) sont nettement différents, pointant vers des structures spatiales plus régularisées jusqu’à ~2 km, suivies par une nette agrégation ensuite. La différence la plus notable tient à la comparaison des deux types de population, avec une courbe des ‘non-pauvres’ cette fois-ci systématiquement au-dessus de celles des pauvres : ce sont dorénavant les individus non-pauvres qui sont les moins sujets à la répulsion sur la plage de distance allant de 0 à 3 km, et les plus agrégés autour des sites Seveso à partir de 2 km. La plage de distance entre 2 et 3 km est donc marquée à la fois par une agrégation relative des individus non-pauvres et une répulsion des pauvres.

On notera que ce différentiel est également présent dans la version inhomogène de la fonction – même si la proximité des courbes tend à tempérer la distinction (avec une répulsion quasi systématique jusqu’à 10 km).

Fig. 8 Fonctions Lhomogène et Linhomogène intertypes, sur une emprise modifiée (centrée sur les zones tampons autour des sites Seveso de la métropole) et une restriction aux seuls sites Seveso « seuil haut »

←130 | 131→

Quelle influence de la définition de la zone d’étude ?

Pour s’assurer de la robustesse de ces résultats, il peut être pertinent de répliquer les fonctions empiriques en modifiant deux paramètres : (i) une absence de réfaction des effets de bord ; (ii) une définition de la zone d’étude non centrée sur les sites Seveso. Les résultats (Fig. 9), présentés ici sur la seule fonction « homogène », sont de ce point de vue assez contrastés.

Fig. 9 Comparaison pour les fonctions Lhomogène intertypes centrées : (i) sur une emprise modifiée (centrée sur les zones tampons autour des sites Seveso de la métropole), (ii) sans réfaction des effets de bord, (iii) sur une emprise restreinte correspondant au périmètre de la métropole

←131 | 132→L’allure des courbes obtenues sans l’application de la méthode de correction des effets de bord (en l’occurrence isotropique de Ripley) est relativement similaire à celles de la configuration initiale, avec une inflexion moins marquée autour de 5 km. On remarque une dérive assez rapide des enveloppes de simulation dans les valeurs négatives. Avant 2 km, les courbes sont par contre quasi-indifférenciables, quel que soit le niveau de revenu des résidents, ce qui suggère un faible poids de la méthode de ←132 | 133→réfaction des effets de bord dans l’établissement du diagnostic d’inégalité.

La deuxième modification découle d’une objection potentiellement plus sérieuse. Le choix d’une zone d’étude obtenue par construction de zones tampon autour des sites Seveso de la métropole se justifie comme défaut car il est à même de capturer l’ensemble de la structure spatiale intertype considérée. Il importe toutefois de pouvoir en comparer les résultats avec une définition basée sur la seule emprise officielle de la métropole, autrement dit en faisant abstraction des individus présents dans les fenêtres d’observation circulaires des fonctions de Ripley, mais qui résident en dehors des limites administratives de la métropole. C’est en effet la population retenue pour l’approche par la centralisation environnementale. Là encore, les courbes ont un air de ressemblance : l’inflexion à 5 km est toujours présente, mais avec une valeur inférieure en ordonnée. Les résultats sont par contre significativement différents sur la gamme de distance inférieur à 2 km : la structure intertype des non-pauvres peut être qualifiée de répulsion relative, tandis que celle des pauvres est aléatoire jusqu’à 1,5 km. Si les résultats résultant du redécoupage de la zone d’étude confortent donc clairement l’hypothèse d’une inégalité environnementale, il importe de souligner le caractère à la fois non négligeable et contingent de cette opération.

Conclusion

En définitive, et en grossissant quelque peu le trait, le diagnostic d’inégalité environnementale obtenu sur l’ensemble de la métropole d’Aix-Marseille-Provence est le suivant : du fait de leurs localisations résidentielles, les individus à bas revenus sont plus exposés aux sites Seveso que le reste de la population, mais moins exposés aux sites Seveso les plus dangereux.

Contre-intuitif, ce pattern spatial est toutefois explicable : les sites Seveso « seuil haut » sont dans leur majorité situés dans des zones industrielles ou portuaires dédiées, éloignées des centralités urbaines. À l’inverse, une partie des sites Seveso « seuil bas » de l’agglomération est intégrée avec une considération réglementaire beaucoup plus légère (et une publicité minimale) dans un tissu urbain plus dense. Or les taux de pauvreté sont généralement plus importants au sein des villes, du fait de la concentration urbaine de l’habitat collectif et social et du transport public. En l’occurrence, la présence de deux sites Seveso « seuil bas » dans ←133 | 134→les 14e et 15e arrondissements8 de Marseille pèse fortement sur l’analyse9 : ces arrondissements accueillent une grande partie des quartiers prioritaires de la ville, dont les populations à bas revenus peuvent être considérées comme directement exposées à des risques industriels – tout en étant à plus de 10 km du site Seveso « seuil haut » le plus proche.

Les méthodes employées ont permis d’appréhender ces inégalités pour différentes plages de distances aux sites Seveso, et sous différents angles d’analyse. Pour l’ensemble des sites, les individus à bas revenus ont tendance à apparaitre plus exposés aux risques industriels que le reste de la population. Toutefois, l’approche par la centralisation montre une certaine mixité dans les tout premiers kilomètres autour des sites. Quant à la version inhomogène de la statistique du point, elle tend à annuler voire inverser ce résultat sur certaines plages de distance. Pour les sites Seveso « seuil haut », l’approche de Ripley montre cette fois très clairement (dans ses versions homogènes comme inhomogènes) une moindre exposition des individus à bas revenu sur l’ensemble des distances considérées. En revanche, l’approche par la centralisation met en évidence une plage de distances intermédiaires pour laquelle les individus à bas revenu apparaissent plus exposés.

Cette différence de résultat pour l’analyse fine de l’exposition aux Seveso « seuil haut » pourrait être liée à une différence méthodologique importante sur laquelle nous n’avons pas insisté pour l’instant. L’analyse de la centralisation environnementale consiste à classer chaque localisation résidentielle en fonction de sa distance au site Seveso « le plus proche ». Elle mesure ensuite la concentration relative des individus à bas revenus et du reste de la population dans les localisations les plus proches, qu’elle compare aux plus éloignés de ces sites. En revanche, les fonctions de Ripley mesurent les interactions entre tous les sites Seveso et tous les individus des deux groupes simultanément. Les deux approches ont leurs mérites. L’avantage de la seconde est qu’elle intègre une notion de cumul des risques, avec l’inconvénient de donner la même importance à un risque lointain qu’à un risque proche, ce qui doit être pris en compte dans la lecture des graphes des fonctions empiriques. À l’inverse, l’approche de la centralisation donne un poids maximal au site le plus proche, lequel en l’absence d’autres informations pertinentes (fréquence, ←134 | 135→intensité et extension spatiale des aléas…) apparaît en première approximation comme le plus dangereux.

Finalement, les principaux messages délivrés par nos deux approches mobilisées ont été largement convergents. Dans le détail, ces méthodes révèlent des nuances et des complexités dans des registres distincts. L’analyse de centralisation environnementale fournit d’abord un résultat global (une valeur d’indice) pour une population donnée (ici les habitants de la métropole), ce qui rend le diagnostic robuste à une éventuelle extension de l’aire d’étude lorsque celle-ci est déjà grande. Ce sont alors la lecture de la courbe de Lorenz associée à l’indice d’une part, et l’introduction d’une contrainte spatiale d’autre part, qui permettent d’affiner l’analyse et de saisir les structures spatiales locales qui conduisent au résultat global. À l’inverse, l’approche par la statistique du point s’interprète d’emblée graphiquement sur l’ensemble des distances intertype de la zone étudiée. Elle a le grand avantage de permettre d’identifier des configurations de répulsion ou d’attraction sur différentes plages de distances en tenant compte simultanément des tous les sites et de tous les individus (Floch et al. 2018). Mais parce que la logique de l’analyse – via le tracé de la fonction – suggère de partir des sources de nuisances, les résultats sont plus dépendants du caractère plus ou moins arbitraire de la définition en amont d’une zone et d’une population d’étude. La méthode est par ailleurs computationnellement lourde, et d’une interprétation plus difficile, avec l’introduction d’une modélisation des variations d’intensité des processus ponctuels. Il apparaît donc que les simulations des fonctions de Ripley et l’indice de centralisation environnementale, loin d’être redondants, doivent être considérés comme des ressources complémentaires pour l’analyse des inégalités environnementales. Les résultats présentés ici pour le terrain marseillais pourraient être critiqués sur de multiples plans (choix des variables, modélisation spatiale des risques, relations de causalité…). Il importe de pouvoir les affiner en s’appuyant sur une boite à outils diversifiée, afin de garantir la robustesse des diagnostics statistiques, en complément d’enquêtes sociohistoriques poussées.


1Nous remercions grandement Stéphanie Peres, pour sa relecture serrée et constructive d’une version préliminaire de ce chapitre.

2Un millésime 2015 est également disponible depuis 2019. La méthode est dorénavant basée sur une extraction du dispositif sur les revenus localisés sociaux et fiscaux (FiLoSoFi), selon des principes différents de traitement des contraintes du secret statistique.

31 298 sites en France sur un total de 12175 pour l’UE-28 (base eSPIRS, JRC, 2019)

4https://CRAN.R-project.org/package=SegEnvIneq

5Par exemple : on peut imaginer que la localisation des arbres d’un peuplement forestier monospécifique puisse être surdéterminée par un facteur environnemental quelconque (fertilité, profondeur des sols…), ce qui se manifeste par un gradient général de densité sur une zone d’étude. Pour autant, la structure spatiale pourra éventuellement rester inchangée sur l’ensemble du peuplement, étant notamment sous l’influence de traits écologiques de l’essence (capacités de dispersion…).

6Il s’agit en l’occurrence de la méthode isotropique proposée par Ripley : la contribution d’une paire de point xixi est déterminée par la géométrie d’un cercle centré sur xi et passant par xj. On calcule la fraction p du périmètre du cercle qui est incluse dans la fenêtre d’observation. La valeur de la réfaction pour la paire de points est 1/p (Baddeley et al., 2015 : 217).

7Si l’on considère les différences de revenus entre habitants, l’introduction d’une modulation de l’intensité capture une tendance à la localisation préférentiellement urbaine de la pauvreté – mais pas une spécialisation aussi marquée à des échelles intermédiaires.

8Le second étant en cours de désaffectation au moment des analyses.

9Dans une moindre mesure, la prise en compte – ou non – des sites et habitants de la Plaine de la Crau dans l’aire d’étude pourrait avoir une influence sur les résultats.

Bibliographie

  • Baddeley A.; Rubak E.; Turner R. (2015) Spatial point patterns: methodology and applications with R. Chapman and Hall/CRC.
  • Besag J. (1977) Contribution to the discussion of Dr Ripley’s paper. Journal of the Royal Statistical Society. Series B, vol. 39, n° 2, p. 193–195.←135 | 136→
  • Boustan L.P. (2010). Was postwar suburbanization « white flight »? Evidence from the black migration. The Quarterly Journal of Economics, vol. 125, n° 1, p. 417–443.
  • Boustan L.P. (2016) Competition in the Promised Land: Black Migrants in Northern Cities and Labor Markets. Princeton University Press, Princeton.
  • Boyce J. K.; Zwickl K.; Ash M. (2016). Measuring environmental inequality. Ecological Economics, vol. 124, p. 114–123.
  • Brutel C. (2011). Un maillage du territoire français. 12 aires métropolitaines, 29 grandes aires urbaines. INSEE première, n° 1333.
  • Daumalin X.; Laffont-Schwob I. (2016) Les calanques industrielles de Marseille et leurs pollutions – une histoire au présent. Ref2c Éditions, Aix-en-Provence.
  • Duncan O. D.; Duncan B. (1955). Residential Distribution and Occupational Stratification. American Journal of Sociology, vol. 60, n° 5, p. 493–503.
  • Farley R.; Schuman H.; Bianchi S.; Colasanto D.; Hatchett S. (1978). « Chocolate city, vanilla suburbs: » Will the trend toward racially separate communities continue ? Social Science Research, vol. 7, n° 4, p. 319–344.
  • Fisher J. B.; Kelly M.; Romm J. (2006). Scales of environmental justice: Combining GIS and spatial analysis for air toxics in West Oakland, California. Health & Place, vol. 12, n° 4, p. 701–714.
  • Fitoussi J. P.; Laurent E.; Maurice J. (2004). Ségrégation urbaine et intégration sociale, La Documentation française, Paris.
  • Floch J.-M. (2017) Niveaux de vie et ségrégation dans douze métropoles françaises, Économie et statistique, n° 497–498, p. 73–97.
  • Floch, J.M.; Marcon É.; Puech F. (2018) Les configurations de points. In Loonis éd. Manuel d’analyse spatiale. Théorie et mise en œuvre pratique avec R, Insee – Eurostat, Montrouge, p. 73–114
  • Folch D. C.; Rey S. J. (2016). The centralization index: A measure of local spatial segregation. Papers in Regional Science, vol. 95, n° 3, p. 555–576.
  • Goreaud F.; Pélissier R. (2003) Avoiding misinterpretation of biotic interactions with the intertype K12‐function: population independence vs. ←136 | 137→random labelling hypotheses. Journal of Vegetation Science, vol. 14, n° 5, p. 681–692.
  • Laurian L. (2008) Environmental Injustice in France. Journal of Environmental Planning and Management, vol. 51, n° 1, p. 55–79.
  • Massey D. S.; Denton N. A. (1988). The Dimensions of Residential Segregation. Social Forces, vol. 67, n° 2, p. 281–315.
  • Mitchell G.; Walker G. (2007). Methodological issues in the assessment of environmental equity and environmental justice. In Deakin, Mitchell et al. éd., Sustainable Urban Development, volume 2: The Environmental Assessment Methods, Routledge, Londres, p. 447–472.
  • Oakes J. M. (2004) The (mis)estimation of neighborhood effects: causal inference for a practicable social epidemiology. Social Science & Medicine vol. 58, n° 10, p. 1929–1952.
  • Ripley B.D. (1976) The second-order analysis of stationary point processes. Journal of Applied Probabilities, vol. 13, n° 2, p. 255–266.
  • Schaeffer Y.; Tivadar M. (2019) Measuring Environmental Inequalities: Insights from the Segregation Literature. Ecological Economics, vol. 164, 106329.
  • Schlosberg D. (2013). Theorising environmental justice: the expanding sphere of a discourse. Environmental Politics, vol. 22, n° 1, p. 37–55.
  • Schlosberg D.; Collins L. B. (2014). From environmental to climate justice: climate change and the discourse of environmental justice. Climate Change, vol. 5, n°3, p. 359–374.
  • Wong D.W.S. (2004) The Modifiable Areal Unit Problem (MAUP). In Janelle, Warf, et al. éd. WorldMinds: Geographical Perspectives on 100 Problems. Springer, Dordrecht.