Peut-on croiser n’importe quelles données ? Le National Geographic a produit une cartographie1 – magnifique au demeurant – qui pose des questions de visualisation évidentes : sur une carte du monde sont superposées des données liées à la densité de population et au revenu moyen par habitant. La vue d’ensemble est très efficace : classés selon les quatre catégories de la Banque mondiale (low, lower middle, upper middle et high), les pays forment une mosaïque qui illustre les disparités en matière de richesse.
Le diable se cache dans les détails
C’est bien une question de niveau de détail qui pose problème dans cette carte : deux sources de données sont superposées, quand bien même elles ne décrivent pas une même spatialité.
1. Les données financières : Les Etats sont colorés en fonction de leur moyenne nationale de revenu annuel par habitant. Cette moyenne homogénéise les Etats. Ce n’est pas forcément un mal en soi en terme de visualisation puisque, pour s’offrir une vue globale lisible, il faut parfois savoir simplifier le niveau de précision. D’ailleurs, les moyennes nationales sont des valeurs officialisées et normalisées, souvent prises comme références2.
2. Les données démographiques : L’échelle est nettement plus fine que dans le cas des données financières puisque la densité de population est affichée selon les localités (manifestement), dans un style graphique “lumières de la Terre vue de l’espace”. C’est une visualisation qui rend très bien compte du fait que la population n’est pas répartie de manière homogène dans les territoires (à l’image de l’Australie, de l’Algérie ou de la Russie, par exemple).
Conséquence, une carte qui pense montrer le détail mais qui ne le montre pas
Est-ce que toute la population de Chine fait partie de la catégorie “Lower middle” ? Non, certainement pas. Si l’on comprend bien que les données financières concernent tout l’Etat, pas de problème, mais l’impression visuelle est faussée parce que l’unité de cette carte n’est plus l’Etat mais la localité. Il est donc juste de dire que le revenu annuel moyen chinois se classe dans cette catégorie, mais il est par contre faux de l’assigner comme tel à toutes les localités chinoises, susceptibles d’être les théâtres de nombreuses variations locales !
Bien joli de représenter la France d’un bleu lumineux alors qu’il est évident que le revenu moyen y est très variable en fonction des régions ! Si c’est le revenu moyen du pays qui nous intéresse, alors pourquoi ne pas colorer la France d’un bleu homogène ? Donnant une apparence de complexité, la surimpression des données démographiques aux données financières des Etats trompe l’oeil du lecteur non averti. Par inadvertance évidemment, mais cette étude de cas doit nous servir à mener une discussion sur nos pratiques de visualisation.
Comment perdre le sens des données…
La carte est assortie de trois pages de tableaux comparatifs qui seraient d’un intérêt certain s’ils ne se basaient pas sur un autre référentiel. Une note indique en effet que les populations sont triées à l’intérieur des pays selon les quatre catégories de richesse avant d’être compilées. Cela signifie donc que toute la population chinoise n’est pas présente dans le cercle rouge (qui correspond pourtant à la couleur de la Chine sur la carte) mais que les habitants plus fortunés sont désormais comptés dans les cercles supérieurs. C’est une excellente chose qui évite qu’on ne fasse la statistique de l’espérance de vie des populations dont l’Etat est globalement jugé comme “Lower middle” (par exemple) sans tenir compte de l’hétérogénéité de ces populations. Mais cela signifie aussi que ces tableaux se basent sur des données qui ne sont pas exprimées dans la carte3 !
Bref, quand bien même ces tableaux expriment des données correctement pondérées, la réutilisation du code couleur de la carte rend très peu probable que le lecteur comprenne qu’on ne parle plus de la même chose : comme il ne s’agit pas des moyennes d’Etats compilées4, les couleurs ont ici une nouvelle signification (on ne parle plus des Etats mais de la globalité).
Lien vers la carte du National Geographic
- Elle date manifestement de 2011, avec des données de 2009. Désolé du manque de fraîcheur de ce billet, mais je ne l’ai découverte qu’aujourd’hui. ↩
- On peut remettre en question la quadripartition de la Banque mondiale, mais ce n’est pas l’objet de ce billet. ↩
- D’ailleurs, si ces données précises à l’intérieur des Etats existent, pourquoi ne pas les intégrer sur la carte ? Est-ce parce qu’elles sont disparates ? Ou parce qu’elles sont issues de statistiques non localisées ? ↩
- Encore heureux, parce que cela nous donnerait une sorte de “moyenne de moyennes” qui interdirait toute analyse. ↩
Le résultat sur certains pays donne effectivement une vision très étrange du monde (Canada, Chine, Argentine, Australie). Joli travail de “correction”, merci.
Dans le genre crétin, tu as aussi cela: http://geopolis.francetvinfo.fr/quand-foreign-policy-met-la-france-en-rouge-28375
La notion de “risque” se fonde sur du n’importe quoi. Surtout, la seule chose que semble prendre en compte la carte de Foreign Policy, c’est, en gros, la présence d’un pays dans les médias (et si elle était présentée comme cela, elle aurait un certain potentiel). Donc, c’est d’abord une carte des fantasmes de la vision états-unienne du monde. Fantasmes qui peuvent avoir un lien avec la réalité des relations internationales, mais pas toujours: la France pays à risque mais pas la Syrie…
Mauvaise cartographie, mauvaise interprétation, mauvais journalisme.
Ah ah ah, c’est complètement ridicule ! Merci du lien !
Ce qui est intéressant, c’est que l’on peut télécharger les données sur lesquelles se fondent FP: http://gdelt.utdallas.edu/
Je suis d’accord avec toi, Martin, que c’est une cartographie assez étrange du National Geographic.
Certainly, spatial aggregation is a valid procedure and with many datasets actually a necessity, since the data simply isn’t available at finer spatial granularities. Of course, this introduces the known problems with MAUP (Modifiable Areal Unit Problem) etc. I like that the map has the advantage of actually showing the footprint of the depicted economies in terms of where people live. Look, e.g. at the vast empty spaces in Russia, Canada, the US!
However, the map has the potential to confuse or mislead a non-professional user. I found the design and arrangement of the legend especially misleading. While Martin has cropped the map, it is visible here: http://www.martingrandjean.ch/wp-content/uploads/2014/01/NationalGeographicWorldMap.png. Both the income level and the population density increase is oriented left-to-right. An unsuspecting user that glances at the map (and, hopefully, legend) quickly, might conclude that the brighter colours reflect higher affluence rather than population density.
I would be very interested in the data source, National Geographic has used for population. It seems quite clear that it’s not the usual standard, GPW (http://sedac.ciesin.columbia.edu/data/collection/gpw-v3), since that has considerably less detail/spatial variation in many countries. Any leads regarding this?
“Granularité”, voilà le terme que je cherchais en rédigeant le billet ! Heureusement qu’il y a des professionnels pour pallier aux manquements des blogueurs amateurs ! 🙂
Merci pour ces remarques tout à fait éclairantes et techniques !
Très juste toutes ces remarques ; à la lecture, cette carte induirait qu’il faut en effet qu’une nation soit aisée pour que ses citoyens vivent uniformément longtemps, aient uniformément accès à internet, etc. Or, comme le rappelle l’économiste Tim Jackson, ce n’est pas le PIB ni la croissance qui jouent le plus dans la prospérité des populations, c’est la stabilité politique et la faible hétérogénéité des revenus au sein d’un pays.
Tout ce que cette carte ne montre pas en somme. #interesting indeed http://superieur.deboeck.com/titres/29071_2/prosperite-sans-croissance.html
Bien vu Martin ! On pourrait même relever que le pourcentage de urbains au revenu moyen-faible semble en discrépance avec le graphe qui l’illustre…