lundi 15 février 2016

Distribution d'iode stable, des questions et des données

En ce début d'année 2016, les riverains des centrales nucléaires françaises doivent renouveler les pastilles d'iodure de potassium dans leur pharmacie domestique. Ce petit exercice de data-journalisme illustre comment, au croisement des données géospatiales, on peut faire naître de nouvelles questions.

Lors d'un accident nucléaire grave, un réacteur endommagé peut relâcher dans l'atmosphère des éléments radioactifs, dont l'iode 131, un produit de la fission de l'uranium. L'iode stable, celui qu'on mange dans les produits de la mer, est l'isotope 127. La demi-vie de l'iode 131 est de huit jours. Il est donc très radioactif mais décroît vite et disparaît au bout de trois mois. S'il est absorbé ou inhalé peu de temps après l'accident, il est dangereux. En se se concentrant dans la thyroïde, il provoque des mutations et des cancers. La prise de cachets d'iodure de potassium stable, en saturant la glande, empêche de l'iode supplémentaire de s'y fixer et procure une certaine protection pour cet élément.

10 km, pourquoi 10 km ?


Les ménages concernés habitent à moins de 10 km. Cette limite est, semble-t-il, liée à une contrainte logistique (http://www.courrier-picard.fr/region/nucleaire-pres-de-penly-il-est-temps-d-aller-chercher-ia176b0n718481). Si on comprend bien les raisons avancées dans l'article par le chef de la division normande de l’Autorité de sécurité nucléaire, dans ce rayon, on n'aurait pas le temps d'approvisionner dans l'urgence ou d'évacuer, parce qu'on ne dispose que de six heures.

La volonté d'informer le public des pouvoirs publics en charge de la sûreté nucléaire doit être remarquée. « L'accident nucléaire n'est pas probable mais il est possible, en France », c'est le discours aujourd'hui et on mesure les progrès réalisés en trente ans.

Ceci dit, on peut poser d'autres questions. Combien de gens sont concernés et où ? La limite de dix kilomètres est-elle sûre ? En cas de vent puissant, serait-elle valide ? Si on avait étendu la zone à 20 km ou plus, combien de boîtes aurait-il fallu distribuer, à quel coût ? Etc. Des cartes et des données vont nous aider à cerner un peu mieux ces questions.

Si on veut compter la population à une certaine distance des centrales, il faut de toute évidence une carte de chaque.

Openstreetmap est une base de données


Dans un précédent article, on avait montré comment géolocaliser la population européenne, avec des données de Eurostat (http://www.mentrek.org/2015/10/on-enfin-geolocalise-le-peuple.html). Pour ajouter à cette carte les centrales nucléaires française, on va demander à Openstreetmap, ou plus exactement à http://overpass-turbo.eu. Le site aide à formuler des requêtes pour extraire des objets de la base OSM. Dans le cas qui nous intéresse, on recherche les centrales électro-nucléaires : generator:source :nuclear ou generator:method : fission. Le wiki de OSM apporte des précisions utiles pour comprendre l'emploi des attributs: (http://wiki.openstreetmap.org/wiki/FR:Tag:generator:source=nuclear?uselang=fr).




On récupère un fichier au format geojson, que l'on ajoute au projet QGIS, comme on le ferait avec un shapefile. Le projet doit transformer à la volée les données cartographiques car la projection du fond de carte est EPSG 3035 et le fichier récupéré est en WGS 84 (voir les préférences du projet).

L'étape suivante consiste à créer un tampon de 10 km autour des sites de centrales en service. L'idée est de faire la somme des points de la couche de population qui sont dans l'intersection avec la zone tampon pour obtenir la réponse. Là encore, PostgreSQL sera très intéressant.

L'outil Vecteur > Géotraitement > Tampons est appliqué à la couche des centrales. On obtient une nouvelle couche contenant des disques, centrés sur chaque réacteur. À cette étape, l'opération de comptage décrite plus haut produirait des doublons, puisque les centrales comptent plusieurs réacteurs. La solution la plus simple est de sélectionner un disque par site et d'effacer les autres manuellement. Il y a dix-neuf sites électro-nucléaires, c'est pas la mort.

On en profite pour vérifier à l'aide d'une source indépendante les emplacements, les noms, les doublons et erreurs qui ne manquent pas de survenir (dans notre cas, Chinon avait un triple tampon confondu avec Saint-Laurent-des-Eaux et Cattenom). La couche résultante est importée dans Postgres, à l'aide du gestionnaire de base de données de QGIS.



On interroge alors la base, avec la requête SQL suivante, tapée dans le gestionnaire de DB ou un terminal pgsql. Elle donne, par site nucléaire, la population qui habite à moins de 10 km.

SQL, mon amour

Et c'est parti pour quelques requêtes avec jointures, imbrications, groupements, fonctions spatiales et statistiques.

SELECT a.name,sum(b.population)
FROM eustat.euview AS b
JOIN eustat.centrales_nuc_fr_tampon10km AS a
ON st_intersects(b.geom,a.geom)
GROUP BY a.name
ORDER BY sum(b.population) DESC;


 

Pour écrire le résultat dans la couche des tampons, ce qui permettra de l'afficher dans les étiquettes de QGIS, on fait les requêtes suivantes (création d'un champ population, puis mise à jour à partir de la requête) :


ALTER TABLE eustat.centrales_nuc_fr_tampon10km ADD COLUMN population INTEGER;

UPDATE eustat.centrales_nuc_fr_tampon10km
SET population =
(SELECT d.population FROM (
SELECT a.name,sum(b.population) AS population
FROM eustat.euview AS b
JOIN eustat.centrales_nuc_fr_tampon10km AS a
ON st_intersects(b.geom,a.geom)
GROUP BY a.name
) AS d
WHERE d.name = eustat.centrales_nuc_fr_tampon10km.name);


Si on reproduit ces opérations avec un tampon de 20 km, et que l'on compare avec la zone des 10 km, on commence à comprendre le problème posé :



Le nombre de personnes concernées peut être multiplié par six, lorsqu'on étend la zone à 20 km. On le comprend aisément, les centrales sont en dehors des agglomérations mais pas très éloignées d'elles.


On se demande si la zone de 10 km est une limite établie par la raison et la prudence ou alors un choix résigné, contraint par les moyens. Pour tenter d'y répondre, on cherchera à quelle vitesse se déplacent les nuages de poussières, en fonction de la vitesse du vent, du relief ou du couvert forestier, par exemple. Dans cette recherche, on utilisera des données ouvertes (CLC pour le couvert végétal, les MNT de Eurostat, les données climatiques de infoclimat.fr…), on interrogera aussi des climatologues, l'IRSN, la CRIIRAD…

Il me semble que les données sont plus une aide pour l'enquête et le questionnement qu'une source de certitude, une fin en soi. Elle demandent des vérifications, sa dose de sens critique et une analyse à plusieurs entrées.

La carte obtenue a un fond OpenStreetMap, comme indiqué ici: http://www.3liz.com/blog/rldhont/index.php?post/2012/07/17/Les-Tuiles-OpenStreetMap-dans-QGIS. La projection 900913 (pour google) est corrigée avec son appellation officielle, EPSG :3857.

Elle n'est pas très lisible sur le web. J'essaierai d'en faire une interactive, avec D3.js, quand j'aurai un peu de temps de me remettre au Javascript.