Intégration de la mosaïque paysagère
-Télécharger le Tome 5 complet-
-Téléchargement du Tome 8 complet bientôt disponible-
Rédaction : Emmeline Lobry, Fanny Mallard, Laurent Couderchet
1 Indicateurs spatiaux de vulnérabilité et de résilience des sites
1.1 Introduction
Démarche de recherche
L’axe de recherche « modélisation » a pour objectif de déterminer les impacts potentiels du changement climatique grâce à des méthodes de modélisation prédictive. Les travaux présentés dans ce rapport sont ceux d’un stage effectué de février à août 2018 et du début de la thèse 2018-2021 en géographie financée dans le cadre du programme et intitulée « Modéliser les effets spatio-temporels du changement climatique sur la biodiversité en Nouvelle-Aquitaine : enjeux et pistes méthodologiques ».
Pour alimenter la modélisation globale du programme sur l’étude des répartitions des espèces sentinelles du climat, il faut dans un premier temps étudier le contexte paysager des sites d’étude et en tirer des indices paysagers, c’est-à-dire des indicateurs quantitatifs, calculés selon les méthodes d’écologie du paysage. Ceux-ci ont vocation à renseigner sur les caractéristiques des habitats présents et, plus généralement, sur les qualités des sites d’étude au regard de leur pertinence vis-à-vis de l’enjeu de réduction des facteurs autres que le changement climatique.
En effet, l’hypothèse de recherche émise est la suivante : la connaissance du contexte paysager des sites de suivi du programme pourrait permettre d’affiner ou de mitiger les conclusions tirées des données liées aux espèces quant au rôle joué par le changement climatique, en fonction des caractéristiques de leur habitat.
Les changements des types d’occupation des sols influencent considérablement la diversité biologique . Ces relations seront de mieux en mieux comprises avec le développement de suivis de la biodiversité en divers contextes spatiaux et temporels . Lier les pratiques des géographes et des écologues apparait particulièrement pertinent dans le cadre de ce programme scientifique. L’écologie du paysage se positionne dans cette logique interdisciplinaire en accordant de l’importance aux questions spatiales en écologie et à la nature en géographie . D’ailleurs, cette discipline « possède comme originalité et qualité sa prise en compte du rôle de la spatialité dans le fonctionnement écologique d’un paysage, ce qui en fait intrinsèquement une approche d’analyse spatiale dans sa plus étroite définition » . La mise en jeu du concept de paysage, objet d’étude classique en géographie, mais aussi à l’origine de la discipline de l’écologie du paysage, apparait pertinente pour répondre à la problématique posée.
Les objectifs sont les suivants : calculer des indices paysagers et mener une réflexion sur les indices paysagers ainsi que leur intégration au modèle global.
Organisation du chapitre
Ce rapport présente des pistes méthodologiques visant à mettre en œuvre des indices paysagers dans le cadre de la modélisation du programme Les sentinelles du climat. Ainsi, il consistera en une présentation détaillée du développement progressif d’une méthode permettant d’obtenir des indices paysagers à l’échelon des sites de suivi.
Dans un premier temps, l’utilisation des indices paysagers sera présentée au travers d’une synthèse bibliographique (Partie Indicateurs de biodiversité et paysagers). Les principes méthodologiques de l’utilisation de ces indicateurs paysagers pour alimenter la modélisation globale du programme sont ensuite explicités (Partie Principes méthodologiques). Ces indicateurs étant calculés sur la base de cartes d’occupation du sol ou d’habitats, un inventaire des données existantes a été mené (Partie Etat des lieux de l’information occupation du sol en Nouvelle-Aquitaine). Le constat d’un manque d’information appropriée à l’étude des espèces sentinelles a conduit à la décision de fabriquer ces cartes. Ainsi, le développement d’un protocole de cartographie à haute résolution sera exposé et commenté (Partie Processus de mise en place d’un protocole de traitement d’images).
La méthode développée a été testée sur quelques sites, sélectionnés à dire d’expert pour leur capacité à représenter leur type d’habitat pour les espèces faunistiques et floristiques suivies dans le cadre du programme. Les sites étudiés sont les suivants :
– Aérodrome de Bordeaux-Saucats (milieu humide – lande humide)
– Callen (milieu humide – lagune)
– Plateau d’Argentine (milieu sec – pelouse calcicole)
– Lège-Cap Ferret, site n°5 (milieu dunaire – dune grise)
– Aspe Est (milieu montagnard – torrent)
– Arrious (milieu montagnard – pelouse montagnarde)
L’étude sera focalisée sur une emprise de 4 km² (carrés de 2 km de côté centrés sur le centroïde du site de suivi). Cette distance correspond peu ou prou aux déplacements potentiels des espèces suivies en une saison. Les espèces suivies ont des capacités de déplacement faibles, la distance de 2 km correspond à leur déplacement maximal .
Les sites du milieu montagnard ne seront pas évoqués dans ce rapport car ils feront l’objet d’un protocole spécifique, à développer, les caractéristiques de ce milieu rendant le protocole mis en œuvre pour le reste de la région inadapté.
Ce protocole a été décliné d’abord à un jeu de données constitué d’images satellite Landsat, de 30 mètres de résolution (Partie Cartographie de l’occupation du sol à une résolution de 30 m) ; puis d’images Sentinel-2, de 10 mètres de résolution (Partie Cartographie de l’occupation du sol à une résolution de 10 m). Ces différentes résolutions sont testées afin de déterminer les apports et limites de chaque jeu de données et d’en déduire la résolution la plus pertinente pour la problématique. Il faut noter que le protocole aboutissant à une cartographie de 30 mètres de résolution a été mis en œuvre pour les quatre sites, tandis que la cartographie de 10 mètres de résolution n’a été testée que pour le site de l’aérodrome de Bordeaux-Saucats. Dans le premier cas, il s’agissait de tester la possibilité de réaliser cette cartographie pour plusieurs types de milieux ; dans le second, de comparer les apports de chaque résolution pour un même site. Pour finir, la construction des indices paysagers avec le logiciel FRAGSTATS et le traitement de ces données statistiques ont été explorés (Partie Indices paysagers).
Après avoir présenté les cartes obtenues (4 cartes de 30 mètres de résolution pour les sites de l’Aérodrome Bordeaux-Saucats, Lagune de Callen, Dune de Lège-Cap Ferret, Plateau d’Argentine et 2 cartes de 10 mètres de résolution pour le site de l’Aérodrome Bordeaux-Saucats), les premiers résultats des indices paysagers permettant de caractériser les différences de ces cartes seront décrits (Partie Résultats exploratoires). Enfin, un retour critique sur la démarche de recherche et les perspectives de ce travail est présenté (Partie Discussion).
1.2 Développement de la méthodologie
Indicateurs de biodiversité et paysagers
Dans sa définition générale, un indicateur est un « dispositif fournissant des repères et servant à mesurer » ; il est « l’indice de quelque chose » (Centre National des Ressources Textuelles et Lexicales). En simplifiant des interactions complexes, les indicateurs offrent la possibilité de comprendre les répercussions que peuvent avoir les changements du paysage sur la biodiversité (Walz, 2015).
Pour décrire la biodiversité, divers indicateurs ont été créés. Une classification de ces indicateurs est régulièrement mobilisée : le triptyque composition-structure-fonctionnement développé par . Il propose un cadre d’analyse précis et les outils mobilisables pour obtenir les indicateurs. Ce cadre est décliné à différentes échelles, allant de l’échelon génétique à l’échelon du paysage régional. L’auteur insiste d’ailleurs sur la pertinence d’un travail mené à plusieurs échelles spatiales, c’est-à-dire d’une « approche hiérarchique », notamment pour observer la réponse de la végétation au changement climatique.
Les indicateurs de biodiversité selon une approche hiérarchique (Modifié de NOSS (1990))
Pour cet auteur, les indicateurs paysagers constituent donc des indicateurs de biodiversité, entendus à l’échelon du paysage régional. Ces indicateurs peuvent être obtenus par des images satellite et aériennes, des SIG, des analyses de séries chronologiques, des statistiques spatiales, etc. En effet, la structure globale des écosystèmes donne la possibilité d’appréhender le changement climatique : adopter l’échelle du paysage a permis d’établir que la forme, la taille, la position et l’arrangement spatial des habitats qui composent la mosaïque paysagère caractérisent les écosystèmes et que leur réponse aux perturbations dépend de ces caractéristiques .
Bien souvent, les travaux cherchent une corrélation entre les indices paysagers, calculés par le logiciel Fragstats ou le module Patch Analyst d’ArcGIS, et les indices d’état de la biodiversité tels que les indices de richesse ou d’abondance qui synthétisent des dénombrements ou données de présence d’indicateurs biologiques (Uuemaa et al., 2013).
Ces indices paysagers, nommés « métriques paysagères » – ce terme sera employé uniquement en référence aux indices paysagers calculés par les logiciels Fragstats ou Patch Analyst d’ArcGIS précités, afin de les dissocier des indices paysagers dans leur ensemble – , sont calculés selon un modèle dit « Patch-Corridor-Matrix Model » (PCMM ou PMM), qui identifie et délimite des zones continues et homogènes (trois types d’objets : les patchs, corridors et matrices) au préalable. Développé dans les années 1980, ce mode de pensée permet donc de décrire les « structures du paysage » et ses deux constituantes : sa configuration et sa composition. La première renvoie aux caractéristiques spatiales de la mosaïque des patchs et à leur arrangement spatial au sein du paysage, la seconde à une description plus thématique (nombre, fréquence proportionnelle et variété des types d’occupation du sol des patchs) .
Il faut noter que l’expression « structures du paysage », qui renvoie à la définition de McGarigal et Marks sera ici différenciée de celle de « structure spatiale » au sens géographique. Si la comparaison diachronique des métriques exprimant la composition et la configuration du paysage peuvent décrire des processus, l’approche de Noss – faire apparaitre expressément des indicateurs de fonctionnement – semble particulièrement pertinente et proche de l’utilisation de cette notion en géographie. Cependant, le fonctionnement entendu au sens géographique est une composante de la structure spatiale, et non une caractéristique du même ordre que la structure. Ces différents termes sont très semblables mais ne partagent pas les mêmes définitions, ce qui peut être source de confusion.
Adéquation des définitions des indices paysagers
De nombreux travaux ont mobilisé les métriques paysagères, comme en attestent les recherches d’Uuemaa et al. (2013), qui pointent une augmentation des publications traitant des métriques et indices paysagers sur la période 2000-2010. Dans la majorité des cas, ces articles présentent un travail essentiellement statistique, pour lequel la spatialisation intervient uniquement au moment du calcul des métriques paysagères. L’écologie du paysage apparait en effet « assez conditionnée par ce que font (et ce que ne font pas) les logiciels d’indices du paysage » .
Parmi les travaux qui mobilisent les métriques paysagères pour décrire les caractéristiques des habitats et les mettre en lien avec les données faunistiques et floristiques, de nombreux articles présentent des études menées sur des paysages neutres modélisés (neutral landscape models en anglais), c’est-à-dire des espaces aux caractéristiques simulées aléatoirement. Elles consistent à expliciter le comportement statistique des métriques paysagères en fonction des paramètres de l’étude, notamment l’emprise et la résolution spatiales, ainsi que la résolution thématique. Ce type d’études vise à permettre une prise en compte de ces caractéristiques statistiques afin d’utiliser avec pertinence les métriques paysagères .
L’apport de la géographie consiste en la considération de l’espace non réduit à un simple support et à une intégration nécessaire de la spatialisation à l’analyse paysagère, au-delà de cette étape de calcul des indices. L’état de l’art a fait ressortir le travail de certains auteurs allant en ce sens, et présentés succinctement ici.
Certains auteurs mobilisent les métriques paysagères comme des données en intrant pour cartographier l’occupation du sol ou les habitats, notamment en télédétection : les valeurs de ces métriques paysagères sont calculées pour des groupes de pixels classés mais non interprétés et constituent des images supplémentaires (les valeurs des métriques sont ainsi spatialisées), renseignant par exemple sur la texture, dans le but d’affiner la caractérisation des milieux .
Dans une région des Pays-Bas, des espaces à enjeux ont pu être mis en évidence par la spatialisation de données statistiques écologiques. Ces « hotspots de biodiversité », où se retrouvent les richesses spécifiques les plus élevées pour les groupes d’espèces étudiés, se localisent globalement dans les mêmes espaces lorsque sont étudiés 14, 5, 2 ou 1 groupe(s) d’espèces animales et végétales. Ainsi, selon eux, pour capturer la répartition spatiale des richesses d’espèces, l’utilisation d’un nombre limité de groupes d’espèces (5) pourrait être suffisant . Si cet article confirme l’importance de la spatialisation et parait aller dans le sens du programme sentinelles du climat quant au choix de suivre un nombre limité d’espèces pour rendre compte de certains effets potentiels du changement climatique sur la biodiversité, il ne traite pas de la question du paysage et des indices paysagers.
Les politiques de conservation nécessitent des connaissances sur la répartition spatiale de la qualité des habitats (« hotspots » et « coldspots ») afin d’adapter leurs mesures. Des images satellitales à très haute résolution ont permis à des chercheurs la mise en place d’indicateurs décrivant l’habitat ripisylve (forêt riveraine) : composition spécifique des forêts, structures horizontale et verticale de la forêt, régime hydrographique. Les valeurs de ces quatre indicateurs (images en niveaux de gris), synthétisées en un indice de qualité de l’habitat, ont permis d’établir une cartographie. Une régionalisation, basée sur la théorie du géon, identifie des limites selon un critère d’homogénéité dépendant à la fois des valeurs des pixels et de la forme (compacité, lissage). L’image issue de ces traitements permet de visualiser des espaces homogènes, hiérarchisés en fonction de la qualité de l’habitat. Par la suite, une analyse typologique permet d’identifier quatre types de qualité d’habitat. Ainsi, les espaces sont à la fois délimités, hiérarchisés et qualifiés (comportement statistique des quatre indicateurs et métriques paysagères calculées pour chaque type). Cette méthodologie permet de s’affranchir d’une limite de l’écologie du paysage, à savoir la délimitation des patchs menée a priori .
Cette méthode semble mobiliser des principes similaires aux traitements d’image en morphologie mathématique. Cet outil permet de prendre en compte explicitement les caractéristiques de l’espace : la distance et le voisinage. Les pixels sont dotés d’une troisième dimension, pouvant correspondre à une élévation (modèle 3D) mais aussi à une valeur exprimant une caractéristique ou un volume (densité de population, pourcentage d’espace couvert par un milieu « naturel », etc.). Les analyses permettent de détecter les discontinuités spatiales, en recherchant statistiquement les contrastes les plus forts entre pixels ou par la ligne de partage des eaux (qui considère la troisième dimension comme un relief topographique pour segmenter l’image selon les limites de bassins versants) .
Cette méthode de traitement d’image a été utilisée notamment pour identifier des corridors écologiques . Un logiciel permettant d’automatiser les traitements a été créé par une équipe de chercheurs rattachés à la Commission Européenne : outil « morphological spatial pattern analysis (MSPA) » du logiciel GuidosToolbox . Celui-ci, par des opérations élémentaires de morphologie mathématique (dilatation, érosion, addition, soustraction, intersection, union, etc.) effectuées sur des images binaires des classes d’occupation du sol, propose une image en sortie dont les pixels sont classés en 9 catégories : core, patch, perforated, edge, corridor, shortcut, branch of corridor, branch of shortcut, branch of edge .
Classification d’images binaires par la morphologie mathématique (SOILLE & VOGT, 2009)
Les possibilités d’utilisation de la morphologie mathématique ont également été explorées pour la mise en place d’indicateurs spatiaux de suivi des espaces « naturels » . Partant du postulat que les variations de forme de l’habitat correspondent et expriment des dynamiques écologiques (maintien, disparition, fragmentation, coalescence, orientation, progression, régression, etc.), les outils de morphologie mathématique permettent la mise en place d’un faisceau d’indicateurs quantitatifs (vacuité d’une tache, granulométrie de l’habitat, morcellement de l’habitat, répartition de l’habitat dans le site, etc.).
Ces positionnements scientifiques se différencient des nombreuses études mobilisant les métriques paysagères en plaçant la spatialisation au centre de leur méthodologie. Cependant, il faut noter que ces opérations de morphologie mathématique sont effectuées à partir d’images binaires. Or, bien qu’elles aient été encouragées pour percevoir les changements d’occupation du sol, les méthodes discrètes « partitionnent le paysage en unités homogènes et contrastées, simplifiant dans le même mouvement l’interprétation des valeurs numériques » . L’identification menée a priori de types d’espaces (patch, corridor, matrice) et la délimitation, artificielle, peuvent aboutir à une perte d’information, notamment sur l’hétérogénéité interne aux patchs, et donc d’information écologique. La discrétisation nécessaire à la mise en œuvre du PMM pose des problèmes d’ordre principalement théorique, notamment le Modifiable Areal Unit Problem (MAUP). Celui-ci renvoie à la question que pose le changement d’échelle quant à la représentation du périmètre et son influence sur le ratio aire-périmètre notamment, comme sur la figure suivante : lorsque la résolution est réduite (B), le périmètre est largement simplifié par rapport à une résolution plus fine (A).
Illustration du Modifiable Areal Unit Problem (MAUP)
Une conception alternative du paysage, introduite plus récemment, semble dès lors intéressante : le Gradient Model (GM) . Contrairement au PMM, le GM mobilise des données continues, dont la seule unité spatiale discrète est le pixel ou la cellule du raster, permettant ainsi une représentation plus réaliste du paysage .
Deux conceptions du paysage (LAUSCH et al., 2015)
La télédétection est un moyen d’obtenir ces données continues, non seulement pour les signaux des longueurs d’ondes visibles mais aussi pour celles, invisibles à l’œil humain, telles que le proche infrarouge, qui intéresse particulièrement notre problématique puisqu’il permet de décrire l’activité végétative. S’il implique un niveau de technicité plus élevé pour l’obtention de données continues, le GM présente l’intérêt de permettre l’utilisation d’une troisième dimension et les logiciels de morphologie mathématique offrent la possibilité de travailler en niveaux de gris, à l’instar du travail mené par Riedler et Lang déjà cité.
Pour l’étude de la distribution des espèces, le PMM parait adapté et est le plus souvent utilisé. Pour l’étude de la phénologie, du stress sur la végétation et la faune, le GM apparait à privilégier. Pour étudier les stress environnementaux (fragmentation, bruit, pollution de l’air, dérangement du sol, modification des propriétés biophysiques et des caractéristiques de la flore et de la faune, etc.), les PMM et GM peuvent être tous deux utilisés .
« L’utilisation de données discrètes et continues peut permettre une lecture dynamique des processus environnementaux » : il s’agit donc de travailler selon ces deux conceptions du paysage, des indices qu’ils permettent d’obtenir, et sur leur complémentarité.
Les indices paysagers sont couramment utilisés en écologie du paysage pour leur capacité à décrire les caractéristiques des habitats et, dans une certaine mesure, la répartition des espèces faunistiques et floristiques. Ainsi, les recherches bibliographiques menées ont confirmé l’intérêt et la nécessité de mobiliser ces indices. Leur mise en œuvre et la préparation préalable des données d’occupation du sol seront donc présentées.
Principes méthodologiques
Partant de l’hypothèse générale que la réponse des espèces végétales et animales suivies dans le programme Les sentinelles du climat au changement climatique dépend aussi du contexte géographique et paysager des sites de suivis, il apparait nécessaire de prendre en compte ces éléments dans la modélisation de la répartition de ces espèces au sein du territoire étudié. Pour rendre compte du contexte géographique et des caractéristiques des habitats, le choix de mobiliser des indices paysagers a été fait. Ceux-ci doivent permettre :
– d’observer des similitudes ou différences entre sites de suivi au sein d’une typologie, voire de hiérarchiser ces sites en fonction de leurs qualités et des biais possibles,
– de constituer des variables d’entrée pour la modélisation de la répartition.
Les indices les plus pertinents seront choisis à la suite d’une analyse de corrélation avec les données de présence de la faune et permettront d’établir une typologie, voire une hiérarchie, des sites de suivi. Les indices paysagers et les informations sur le type de site seront intégrés aux données d’entrée du modèle de répartition des espèces suivies. Ces différentes étapes aboutissent chacune à des données utilisées en intrant dans l’étape suivant.
Méthodologie globale d’utilisation des indicateurs paysagers
Un certain nombre d’indices doivent être calculés à l’échelle du site et du contexte. Une étude de corrélation avec les données de présence d’espèces faunistiques et un dialogue avec les naturalistes permettront de sélectionner les indices paysagers les plus pertinents. Une analyse typologique associera à chaque site un groupe aux caractéristiques similaires et sera susceptible de mettre en place une hiérarchie quant à la qualité du site. L’ensemble de ces données constituera une base pour la modélisation de la répartition de la biodiversité sous l’effet du changement climatique en Nouvelle-Aquitaine.
Définir le paysage suppose d’en dessiner le contenu thématique, la résolution thématique, la résolution spatiale et l’extension spatiale. Pour les besoins de l’étude, le contenu sera l’occupation du sol, la résolution thématique correspondra peu ou prou au niveau 4 de Corine Land Cover, tel que défini pour l’OCSGE, l’extension spatiale d’environ 4 km² (carré contenant un cercle d’un rayon d’un km autour de chaque centroïde de site). La résolution spatiale pose question et ce choix est en partie contraint par les données disponibles.
Etat des lieux de l’information occupation du sol en Nouvelle-Aquitaine
Les différentes bases de données existantes pouvant servir pour calculer les indices paysagers ont été explorées : occupation du sol, données d’observations de la faune et de la flore, zones humides, habitats, etc. Elles doivent répondre à deux besoins majeurs de cette étude :
– la réplicabilité et l’applicabilité de la méthode : les données paysagères doivent être établies de façon homogène sur l’ensemble des sites de suivi ;
– une résolution adaptée à la recherche d’une corrélation avec les données concernant les espèces faunistiques suivies dans le cadre du programme, soit des espèces à faible capacité de déplacement.
- Bases de données d’occupation du sol
Le tableau suivant présente les différentes bases de données d’occupation du sol existant en Nouvelle-Aquitaine. Elles n’apparaissent pas pertinentes : leur résolution, soit thématique soit spatiale, semble insuffisante au regard des besoins de l’étude déjà cité.
Occupation des sols du site de l’aérodrome selon les trois bases de données interrogées
- Données sur l’agriculture
Les bases de données d’occupation du sol donnent une information sur les espaces agricoles. Elles peuvent être complétées par des données agricoles plus précises.
D’une part, la base du Recensement Parcellaire Graphique (RPG) fournit des informations recensées à l’échelle des ilots, avec une nomenclature très détaillée selon les types de culture ; puisqu’il s’agit d’une base de données issue des déclarations des agriculteurs pour leur demande d’aides financières de la Politique Agricole Commune. Toutefois, il est important de noter que ces données requièrent d’être utilisées avec prudence, dans la mesure où les déclarations peuvent être biaisées, à la fois involontairement, par l’imprécision des tracés de parcelles, et volontairement, par une fausse déclaration possible. De plus, certaines cultures ne donnant pas lieu à des aides financières, elles n’apparaissent pas dans la base de données, ce qui est régulièrement le cas pour les espaces de vignes, très répandus dans la région.
D’autre part, le fichier des propriétés non bâties (FPNB) ou fichier parcellaire, qui fait partie de la BD MAJIC (Mise A Jour des Informations Cadastrales) éditée par la Direction Générale des Finances Publiques (DGFIP). A vocation fiscale, ce fichier décrit notamment, pour les parcelles et leurs subdivisions fiscales, son groupe de culture dominant (terres, prés, vergers vignes, bois, landes, carrières, eaux, jardins, terrains à bâtir, terrains d’agrément, chemin de fer, sol). Ainsi, cette base pourrait compléter les données d’occupation du sol de manière précise en terme spatial et fournir une information quant à l’usage (plus qu’à l’occupation) des sols. Il pourrait être intéressant également d’intégrer un facteur temporel de variabilité foncière : cette base contient en effet la date d’acquisition et la nature du droit de propriété, indiquant ainsi un « degré » de maitrise foncière.
- Données de présence de la faune et de la flore
En Nouvelle-Aquitaine, l’Observatoire de la Biodiversité Végétale (OBV) et l’Observatoire Aquitain de la Faune Sauvage (OAFS) regroupent un certain nombre de données sur la présence d’espèces animales et végétales, mais aussi certaines cartographies d’habitats, ce qui permet d’affiner les données d’occupation du sol des bases de données citées précédemment.
Cependant, ces données sont lacunaires, puisque le territoire n’est pas couvert dans sa totalité, et hétérogènes : les relevés donnant lieu à la cartographie des habitats ne sont pas tous effectués la même année et/ou sont réalisés par des professionnels différents, ce qui peut constituer un biais en fonction des méthodes employées. Ces données, si elles ont le mérite d’exister, apparaissent difficilement exploitables en l’état.
- Bilan général
Ces diverses lacunes ont amené à la décision de construire une cartographie d’occupation du sol à fine résolution et par télédétection. L’étude a donc mobilisé des résolutions spatiales fines, de 10 à 30 mètres (utilisation d’images Sentinel et Landsat 8) et une résolution thématique de type CLC niveau 4, pour réaliser une cartographie d’occupation du sol d’une emprise spatiale carrée de 2 km de côté, dont le centre correspond au centroïde de la zone de relevés du site de suivi.
Processus de mise en place d’un protocole de traitement d’images
Le travail préalable au calcul des indices paysagers consiste en la cartographie de l’occupation du sol. La méthode de télédétection a été choisie car elle permet d’automatiser une grande partie des traitements. Cette méthode permet en effet d’obtenir des résultats discrets, par classification des pixels, mais offre aussi la possibilité de travailler sur des données continues, ce qui peut être envisagé par la suite.
Dans un premier temps, les images Landsat 8, qui ont une résolution spatiale de 30 mètres, ont constitué la base de l’analyse. Outre leur facilité et gratuité d’acquisition, cette résolution est apparue intéressante pour l’étude menée : un pixel de 30 mètres de côté. Elle permet de décrire relativement précisément les sites de suivi. En effet, les protocoles de suivi mis en place se répartissent :
– sur 100 mètres le long d’un transect pour les suivis papillons ;
– sur un quadrat de 100 mètres de côté pour les suivis lézards ;
– sur un quadrat de 25 mètres de côté pour les suivis des cortèges végétaux (Mallard, 2017b).
La résolution thématique souhaitée correspond à la précision de la nomenclature CLC niveau 4. Les espaces artificialisés sont regroupés en une seule classe dans la mesure où leurs conséquences sont considérées défavorables aux espèces suivies, qu’il s’agisse d’espaces d’habitation ou de zones commerciales. Une nomenclature souhaitable a été identifiée a priori en fonction des classes qui apparaissaient pertinentes dans la nomenclature de la carte d’occupation du sol régionale. Ces types d’occupation du sol paraissaient a priori identifiables par télédétection.
Nomenclature souhaitable pour décrire l’occupation du sol des sites de suivi
Pour obtenir cette cartographie de l’occupation du sol, différents tests ont été effectués afin d’affiner la méthode et de la rendre la plus opérationnelle possible, reproductible à l’ensemble des sites de suivi et dans le délai imparti assez court : la cartographie de l’occupation du sol pourrait être un sujet de thèse en soi, mais elle ne constitue ici qu’une étape au sein de la démarche globale et les résultats doivent donc être applicables immédiatement.
Les premiers tests ont tous été effectués pour le site de l’aérodrome de Bordeaux-Saucats (milieu humide – landes humides). Parmi les sites choisis pour le premier échantillonnage, ce site identifié comme représentatif du milieu humide, lande humide. Une visite de terrain a été effectuée pour connaitre le contexte et comparer les résultats obtenus avec la réalité.
Localisation du site de l’aérodrome de Bordeaux-Saucats
L’objectif étant d’identifier les landes humides du site de suivi et de potentiels espaces similaires, une image Landsat 8 du 18 juillet 2016 a été choisie au départ. Cette date correspond à une période de l’année à laquelle la végétation recherchée est la plus visible dans le paysage, c’est-à-dire aussi la période optimale des suivis des espèces floristiques.
La composition colorée standard (une composition colorée standard consiste à coder le vert en bleu, le rouge en vert et le proche infrarouge en rouge) a révélé une saturation dans le proche infra-rouge, visible à la couleur rouge clair (voir figure suivante), ce qui correspond à l’activité végétative très importante à cette période de l’année. Cela peut aboutir à des erreurs d’interprétation des différents types de végétation : une confusion entre une sur- et une sous-évaluation n’est pas exclue.
Composition colorée standard de l’image Landsat 8 du 18/07/2016
Les variations présentes sur le site de suivi même posaient un problème dans la mesure où elles ne correspondaient pas à la connaissance du terrain : les naturalistes considèrent cette lande fauchée homogène et ont été troublés par l’hétérogénéité qui ressortait de cette première image (voir figure A suivante). L’adéquation entre les résultats de télédétection et les attentes des naturalistes de terrain nécessite un dialogue et un travail mutuel pour que le résultat apparaisse pertinent pour les deux disciplines.
Les difficultés liées à l’identification des différents types de végétation a conduit à revoir le choix de la date de prise de vue de l’image Landsat. La prise en compte de la phénologie nécessite deux prises de vue espacées dans le temps et représentatives d’un stade végétatif particulier. Les périodes de mars et de septembre ont été ciblées. Ainsi, l’utilisation d’images aériennes à ces deux périodes de l’année permet de prendre en compte la phénologie pour interpréter la classe, notamment la différence d’activité végétative, pour différencier feuillus et conifères. Les feuillus ont une activité végétative plus importante que les conifères, notamment au printemps/été, alors que les conifères ont une activité végétative plus stable dans le temps. De plus, les feuillus ayant leur feuillage plus clair, la réflectance dans le visible est plus importante que celle des conifères, de couleur plus sombre.
Des données abiotiques ont été ajoutées également : trois images exprimant l’altitude, la pente et l’exposition complètent les 14 images Landsat. Dans un premier temps, le Modèle Numérique de Terrain utilisé avait une résolution de 75 m (données libres, mises en ligne par l’IGN), rééchantillonnées à 30 m pour être calées sur les images Landsat. Le site d’étude ayant un relief assez plat, cette basse résolution n’a pas posé de problème particulier, mais une résolution plus fine est nécessaire pour certains autres sites au relief plus contrasté. Par la suite, le MNT utilisé a une résolution de 5 m, dégradée par un rééchantillonnage à 30 m.
La méthode de télédétection a été similaire à la précédente, excepté que les images sources étaient plus nombreuses. L’utilisation d’images Landsat à deux dates est apparue pertinente, notamment lors de l’étape d’interprétation des classes au regard de leur comportement spectral moyen selon la saison. En revanche, les questions de reconnaissance de l’humidité du milieu et du caractère agricole de telle ou telle prairie restaient en suspens (figure B suivante).
Images résultant des premiers tests de cartographie à 30 mètres de résolution
Partant du postulat selon lequel certains types d’occupation du sol ne nécessitaient pas une analyse trop approfondie, tandis que d’autres étaient au centre des préoccupations (la prairie humide, pour ce site d’étude, les milieux « naturels » plus généralement) ; une base d’occupation du sol préexistante pourrait être utilisée, notamment pour les espaces artificialisés par exemple, et la télédétection utilisée pour certains autres types : prairies, forêts (recherche de la densité), milieux « naturels » au sens large :
Illustration du principe d’approfondissement ciblé sur certains types d’occupation du sol
L’étape de télédétection utiliserait la donnée connue comme une image masque lors de la classification par K-moyennes :
Protocole de traitement intégrant une base de données préexistante
Un rapide contrôle des images a montré que les classes à retravailler a priori pour le site de suivi étudié, c’est-à-dire les classes « Pelouses », « Landes ligneuses », « Prairie », voire « Cultures d’hiver » et « Cultures d’été », ne couvraient pas entièrement la zone d’étude, pour laquelle les connaissances naturalistes indiquent qu’il s’agit d’une prairie humide.
Ainsi, la méthode a évolué et chaque type d’occupation du sol a été replacé en une image binaire pouvant servir de masque pour des classifications par K-moyennes. L’objectif était donc de rechercher l’hétérogénéité au sein d’une classe pré-identifiée comme homogène ; cette classe étant issue d’une base de données d’occupation du sol et non d’une première étape de classification comme dans les deux tests précédents.
Les méthodes de classification automatique du CESBIO offrent un résultat intéressant à l’échelon régional ou national, mais quelques pixels mal classés rendent leur utilisation à un échelon très local plus compliquée. Ainsi, certains pixels de « Plages et dunes » étaient présents sur le périmètre de l’aérodrome. Outre cet exemple, l’image a révélé des pixels classés avec des valeurs absentes de la nomenclature, et quelques pixels « inclassables » attribués à une classe 0 « no data ». Le faible nombre de pixels isolés dans chaque classe les rend non-significatifs. Pourtant, lors de l’étape de sous-classification par K-moyennes, ces pixels isolés et très hétérogènes ont rendu très compliquée leur attribution. Si certaines classes, telle que « forêt de conifères », très présente sur l’image, ont permis d’obtenir de bons résultats lors de la sous-classification, le trop grand nombre de pixels difficilement classables (en rouge sur la figure suivante) a remis en question la pertinence de cette méthode quant à un gain de temps supposé par rapport à la méthode présentée précédemment et l’essai n’a donc pas été mené à son terme.
Pixels inclassables après sous-classification par K-moyennes de l’image CESBIO
Le principe de classer des pixels à l’intérieur d’une classe homogène identifiée dans une base de données d’occupation du sol existante a été repris avec la base de données OCSGE de PIGMA, issue de photo-interprétation. Cette méthode a été retenue et correspond au protocole présenté en détail dans la partie suivante.
Le protocole de traitement de données, constitué d’une part des traitements d’images effectués pour obtenir une carte de l’occupation du sol, dont la résolution spatiale correspond à la problématique du programme de recherche, et d’autre part du calcul des indices paysagers, va maintenant être présenté.
1.3 Cartographie de l'occupation du sol à une résolution de 30 mètres
Cette méthode se décompose en deux temps : d’abord, la classification des pixels par la méthode des K-moyennes et l’interprétation des classes obtenues ; puis l’ajout d’informations exogènes pour intégrer les routes, l’agriculture et l’humidité du milieu notamment.
Identifier les types d’occupation du sol : télédétection et classification par K-moyennes
La première étape consiste en la classification des images par la méthode des K-moyennes. Ce traitement est effectué avec le logiciel TerrSet (© Clark University) version 18.21.
La classification est effectuée à partir d’un groupe de 17 images, constitué des 7 bandes de deux images Landsat (en mars et en septembre) et de trois bandes supplémentaires rendant compte des caractéristiques physiques du milieu : l’altitude, l’exposition et la pente. Ces dernières images sont issues du MNT de résolution 5 mètres de l’IGN, rééchantillonné à une résolution de 30 mètres et reprojeté dans le même système de projection que les images Landsat (Annexe 3).
Pour la phase d’interprétation, la moyenne des signatures spectrales de chaque classe est calculée (outil « MakeSig ») et extraite vers un tableur où elles sont répertoriées par site et par image-masque, et où s’affichent les courbes spectrales. L’objectif consistait à interpréter ces courbes spectrales pour nommer les classes identifiées par le logiciel en collaboration (Emmeline Lobry, géographe, et Fanny Mallard, écologue). Pour cela, ces informations ont été synthétisées dans un nouveau tableau (présenté en Annexe 4) afin de simplifier la lecture des courbes spectrales en identifiant, au préalable du travail d’interprétation :
- l’allure générale de la courbe : Eau, Végétal, Minéral, Mixte Végétal, Mixte Minéral, Mixte plat (les courbes « mixtes » correspondant à celles présentant un plateau de réflectance entre B5 et B6),
- une échelle du niveau de réflectance dans le proche infra-rouge (B5),
- une échelle du niveau de réflectance dans l’infra-rouge moyen (B6),
- le ton moyen des pixels dans le signal visible, c’est-à-dire une approximation de leur luminosité (couleur claire ou sombre)
et ce, aux deux dates de mars et septembre, et pour chaque classe.
Pour aider à l’interprétation des classes, la reconnaissance visuelle sur photographies aériennes (BD ORTHO 2015) a été utilisée en complément de l’interprétation des courbes spectrales.
Lorsque les classes n’apparaissaient visuellement pas suffisamment homogènes et définissables, elles ont fait l’objet d’une nouvelle classification par K-moyennes (3 classes demandées à l’intérieur de la classe hétérogène).
Ces étapes et les sources des données utilisées sont synthétisées dans la figure suivante :
Etapes du protocole de traitement des données
Les résultats de cette première étape apparaissent insuffisants à certains égards. La résolution spatiale de 30 mètres permet rarement d’identifier les routes et les cours d’eau, larges de quelques mètres au plus, et qui sont pourtant susceptibles d’avoir de véritables effets, positifs ou négatifs, sur la présence et le déplacement des espèces végétales et animales suivies. Ainsi, il est apparu important de les surajouter pour que ces effets puissent être pris en compte dans l’analyse paysagère. Si ce choix peut biaiser l’analyse dans la mesure où l’information sous-jacente, issue du travail de télédétection, est perdue ; mais l’absence d’information sur les routes et l’hydrographie aurait elle aussi constitué un biais non négligeable.
Compléter les résultats de la télédétection par des données exogènes
La méthode permettant d’intégrer des informations supplémentaires est ici explicitée : pratiques agricoles, humidité du milieu, routes et hydrographie. Ces informations sont contenues dans des bases de données thématiques, souvent vectorielles : elles sont qualifiées d’exogènes, vis-à-vis des images satellitales utilisées pour la phase de télédétection.
- Confirmer les espaces et pratiques agricoles avec le Registre Parcellaire Graphique
La méthode de classification utilisée ne permet pas de dissocier avec certitude les prairies pâturées des prairies de fauche, à usage agricole, mais aussi d’espaces de cultures diverses. Les qualités et les pressions associées à ces milieux sont en effet bien différentes et il apparait nécessaire de les différencier.
Dans ce but, la base de données du Registre Parcellaire Graphique a été mobilisée. La nomenclature très détaillée des types de cultures dominantes était a priori peu intéressante. Seuls les types « prairies temporaires », « prairies permanentes », « estives et landes » et « fourrages » ont été conservés, alors que tous les autres types ont été agrégés en une classe « cultures ».
L’objectif de l’utilisation de ces données est de préciser et/ou compléter les premiers résultats. Ainsi, les données du RPG sont utilisées uniquement au sein des pixels « prairies/cultures ». Chaque couche est extraite individuellement pour obtenir des images binaires : « prairies temporaires », « prairies permanentes », etc. Ces images sont recodées de sorte que la valeur « 1 », valant présence de prairies temporaires par exemple, devienne « 20 ». La valeur « 20 » est choisie puisque l’image issue des premiers traitements aboutit à une carte ayant moins de 20 items de légende.
Cette opération permet d’ajouter l’image RPG à l’image issue de la classification (nommée CKM – Classified KMeans). L’image résultat conserve ainsi les espaces « prairies/cultures », de valeur « 4 », mais certains de ces pixels prennent une valeur « 24 », permettant donc de préciser certains espaces au sein de la classe générique identifiée auparavant :
Illustration du principe d’intégration de l’information « agricole »
Ce principe est répété autant de fois que nécessaire pour prendre en compte les différents types d’agriculture présents et les ajouter à la légende finale de notre image.
- Renseigner l’humidité du milieu avec les « zones humides élémentaires »
Les zones humides sont difficilement repérables sur nos images. L’utilisation d’une image satellite à une date précise, choisie en fonction des conditions météorologiques, c’est-à-dire une période de précipitations, qui seraient susceptibles de faire apparaitre une saturation des sols en eau, a été envisagée. Cependant, trouver une concordance entre la météorologie, l’existence de l’image et a fortiori sa qualité apparaissait peu probable, et ce travail trop chronophage, pour des résultats pour le moins incertains.
L’objectif étant de mettre en place un protocole de traitements applicable à l’ensemble, ou du mois à la grande majorité, des sites, il était nécessaire de trouver des données déjà récoltées sur l’humidité des milieux.
Peu d’informations géographiques sont disponibles sur ce sujet, à haute résolution, en accès libre et régulièrement mises à jour. La couche SIG des Zones Humides Elémentaires du Bassin Adour-Garonne, qui compile divers inventaires de terrain, a été mobilisée. Ces données datent de 2007 (publiées en 2013) et ont vocation à être utilisées à une résolution spatiale de 1/50 000. Si cette résolution est bien inférieure à la résolution de travail de cette étude, aucune donnée n’existe à très haute résolution pour l’ensemble de la Nouvelle-Aquitaine et en libre accès à notre connaissance. Par ailleurs, une rapide exploration de la base de données a révélé sa très grande hétérogénéité.
En effet, l’attribut « Typ_Locale » varie fortement, en fonction des lieux et des organismes chargés des inventaires. Ainsi, au sein d’un même site, plusieurs types de zones humides apparaissaient avec des intitulés très hétérogènes, du plus précis au plus flou : « Prairies à Agropyre et Rumex », « Prairies humides atlantiques et subatlantiques », « Buisson de Saules de marais » (pour le site du Plateau d’Argentine, Dordogne) ; « Roselière ou lande humide », « Eau peu profonde » (site de la Lagune de Callen, Landes) ; etc.
Conserver ces informations en l’état aurait abouti à une légende fortement complexifiée. De plus, cela aurait introduit de fortes différences entre les légendes des sites:
Comparaison des légendes obtenues pour chaque site si les informations de la couche SIG « ZHE » étaient conservées en l’état
Pour harmoniser les cartographies et leurs légendes, seule l’information « humide » a été conservée, en agrégeant tous les types présents. Il faut noter que certains objets de la carte sont supprimés pour l’étude lorsqu’ils correspondent à des éléments anthropisés : les objets de type « Culture », « Cultures », « Terres agricoles et paysages artificialisés » et « Zones artificialisées, jardins, décharge, carrière » sont ainsi écartés de la base de travail. Cette information « humide » a pour but de préciser les données issues du traitement de télédétection, comme le présente le tableau suivant :
Principe de l’ajout de l’information « humide »
Pour intégrer cette information, qui ne permet que d’approximer la caractéristique humide du milieu, la même méthode que pour les informations sur l’agriculture est utilisée :
Illustration du principe d’intégration de l’information « humide »
A l’issue de ces étapes, la cartographie présente les différents types d’occupation du sol en intégrant des informations sur les pratiques agricoles présentes et l’humidité du milieu. Il apparait désormais nécessaire, pour la suite des analyses, d’ajouter la présence du réseau hydrographique et des routes.
- Prendre en compte l’hydrographie et les routes avec la BD TOPO
Le travail de télédétection avec des images de 30 mètres de résolution spatiale ne permet pas, ou très rarement, d’identifier les espaces routiers et l’hydrographie, qui sont en général des éléments linéaires de quelques mètres de large au plus. Pour pallier l’absence de ces informations, les rubriques Hydrographie et Réseaux routiers de la BD TOPO 2017 ont été mobilisées.
La couche SIG des réseaux routiers est constituée de polylignes, dont les attributs mentionnent entre autres la nature, le toponyme, la largeur, le nombre de voies. Le fichier a été reprojeté et transformé en format raster, dont les valeurs correspondent à la nature de la route, hiérarchisées selon leur impact possible sur la faune et la flore (1 ayant le moins d’impact et 6 l’impact le plus important) :
Hiérarchie des types de réseaux routiers présents dans la BD TOPO (d’après MALLARD (2014))
La couche de l’hydrographie est également constituée de polylignes. Les attributs précisent s’il s’agit d’un cours d’eau ou d’un plan d’eau temporaire ou permanent. Pour éviter de sur-représenter le réseau hydrographique, seuls les objets permanents ont été conservés, à l’exception de la lagune de Callen, dont le plan d’eau qui constitue le site de suivi était tracé en plan d’eau temporaire.
La transformation d’un fichier vectoriel constitué de polylignes en un fichier raster implique d’attribuer à un pixel une information « présence d’un réseau », là où la surface réelle du réseau n’occupe pas toute celle du pixel. Cela aboutit à des conflits récurrents d’une présence simultanée, au sein d’un même pixel, du réseau hydrographique et du réseau routier. Il est donc apparu nécessaire de choisir quel réseau « prendrait le pas » sur l’autre.
Les éléments « naturels » du paysage sont volontairement mis en avant. Ainsi, la priorité est donnée à la continuité d’un cours d’eau par rapport à une présence de sentiers, pistes cyclables et chemins ou routes empierrées (routes de type 1 à 3) ; tandis que les autoroutes et routes à une ou deux chaussées (types 4 à 6) ont un impact négatif qui se surimpose à la présence d’un cours d’eau.
Les images sont surimposées en trois étapes : les routes de type 1 à 3 ; puis le réseau hydrographique ; enfin, les routes de type 4 à 6 :
Illustration des étapes d’intégration des routes et de l’hydrographie
A l’issue du protocole décrit, une cartographie d’occupation du sol à une résolution spatiale de 30 mètres et d’une résolution thématique de type Corine Land Cover niveau 4 (à l’exception des territoires artificialisés qui sont globalement agrégés) a été construite, pour une zone d’étude carrée de 2 km de côté, dont le centre correspond au centroïde du site de suivis. Ces cartographies sont désormais utilisables pour obtenir des indices paysagers susceptibles de caractériser et comparer les sites de suivis.
1.4 Cartographie de l'occupation du sol à une échelle de 10 mètres
Lors de la présentation de ces travaux en journée d’études, l’utilisation possible d’une autre source de données a été discutée. Les images Sentinel, d’une résolution spatiale allant de 10 à 20 mètres de résolution pour les bandes spectrales pertinentes, sont apparues intéressantes :
Caractéristiques des images Sentinel (source : https://sentinel2.cnes.fr/fr/instruments-2)
La cartographie à 10 mètres de résolution a été testée pour le site de l’aérodrome de Bordeaux-Saucats, afin de pouvoir y comparer les cartes de différentes résolutions spatiales.
Préparation des images
La classification des images nécessite une préparation préalable. D’abord, pour obtenir des images multispectrales à une résolution unique de 10 mètres, deux méthodes ont été testées : un simple rééchantillonnage et une amélioration de la netteté panchromatique. Ensuite, pour réduire la taille du corpus d’images utilisées afin de réduire les temps de traitement, une analyse en composantes principales (ACP) a été effectuée. Dans la mesure où les images sont très corrélées entre elles, les images résultant de l’ACP permettent de résumer, en quelques images, l’ensemble des images multispectrales aux deux dates d’étude.
- Amélioration de la netteté panchromatique
Les images des bandes spectrales 11 et 12, caractérisant la réflectance dans l’infrarouge moyen, de résolution moindre, ont nécessité un travail supplémentaire afin d’obtenir pour ces bandes une résolution de 10 mètres, afin de les rendre utilisables dans une classification en les intégrant aux autres bandes spectrales.
Deux méthodes ont été employées : un rééchantillonnage classique, attribuant aux 4 cellules (de l’image de résolution 10 mètres) composant une cellule (de l’image de résolution 20 mètres) la valeur de cette dernière ; et la fusion avec une image panchromatique. Cette méthode repose sur la corrélation des valeurs de réflectance dans les différentes bandes. L’image panchromatique, de résolution supérieure, synthétise les valeurs dans l’ensemble des bandes spectrales. Ainsi, l’opération d’amélioration de la netteté panchromatique (pansharpening en anglais) consiste à prendre en compte cette image panchromatique, de résolution supérieure, pour créer une image exprimant les variations de réflectance pour une image de bande spectrale de résolution inférieure. Dans ce cas d’étude, l’opération permet de créer deux nouvelles images de résolution 10 mètres pour les bandes 11 et 12, en se basant sur les images originelles à 20 mètres de résolution et l’image panchromatique de 10 mètres de résolution.
Nouvelles images créées de résolution 10 mètres pour les bandes 11 et 12
Comme pour les images Landsat, la classification s’effectue en prenant en compte d’une part les bandes bleu, vert, rouge, proche-infrarouge, infrarouge moyen à deux dates (6 images x 2), et d’autre part les caractéristiques d’altitude, pente et exposition (4 images). Le grand nombre d’images allongeant les temps de traitements et considérant la forte corrélation des images entre elles, les 12 images spectrales ont fait l’objet d’une Analyse par Composantes Principales, en mode temporel. Les images des composants principaux résultant de cette ACP et expliquant au minimum 95% de la variation (4 à 5 composants, voir le tableau suivant) sont utilisées comme images-sources. Ainsi, le nombre d’images formant le groupe servant à la classification est réduit de 16 à 8 (voire 9) images, rendant les traitements plus rapides.
Résultat de l’ACP pour le groupe d’images « resample » : ici, 5 images de composantes principales sont nécessaires pour exprimer plus de 95% de la variation
Classification des types d’occupation du sol
La classification est donc effectuée à partir d’un groupe de 8 (voire 9) images :
– les images résultant de l’Analyse par Composantes Principales (4 voire 5 images),
– une image de l’altitude,
– une image de la pente (en degrés),
– deux images exprimant l’exposition : l’une exprime un degré d’orientation Nord-Sud sur une échelle allant de 0 à 180 ; l’autre exprime un degré d’orientation Est-Ouest sur une échelle de 0 à 180. Dans ces images, une valeur -1 a été attribuée aux pixels situés sur un terrain considéré plat (pente inférieure à 1 degré).
Le schéma suivant présente l’utilisation de ces différentes images au cours du protocole de traitement et les différentes étapes mises en œuvre. L’étape d’amélioration de la netteté panchromatique y est illustrée (étape 1) ; cependant il faut noter que parallèlement a été menée la méthode du simple rééchantillonnage, qui se substitue donc à cette étape présente sur le schéma. Comme précédemment, le Référentiel Aquitain d’Occupation du Sol à Grande Echelle a été mobilisé, après avoir été retravaillé pour harmoniser les nomenclatures, reprojeté en WGS 84-UTM30N et transformé en fichier raster de 10 mètres de résolution.
Etapes de traitement pour la cartographie de 10 mètres de résolution
Ajout des zones humides, du réseau routier et du réseau hydrographique
A la suite de la classification, l’ajout de données exogènes est mis en œuvre de la même manière que pour la cartographie à 30 mètres de résolution. Les cartes vectorielles sont rastérisées à 10 mètres de résolution. Toutefois, la couche des routes a été construite différemment. En effet, la possibilité d’avoir des routes de plus de 10 mètres de large a posé un nouveau questionnement puisqu’une route de 15 mètres de large par exemple devrait être présente sur deux cellules adjacentes.
Ainsi, la largeur des routes a été prise en compte. Cette donnée est présente dans la BD TOPO pour la plupart des routes. Certains objets ont toutefois une largeur non renseignée. Les champs manquants ont été remplis par la valeur de la largeur moyenne du type de route par département. Lorsqu’aucune largeur n’était présente dans la base de données, des largeurs arbitraires ont été fixées (en italique dans le tableau). Le tableau suivant présente les valeurs mises en place dans la base de données. Les cases vides correspondent au cas où tous les objets de ce type présents dans la base ont leur champ largeur renseigné.
Valeurs attribuées aux largeurs non renseignées dans la BD TOPO (en mètres)
Ces largeurs ont permis de créer une couche de polygones en réalisant une zone tampon autour des polylignes représentant le réseau routier. Les surfaces de route (correspondant souvent à des parkings) présentes dans la BD TOPO ont été ajoutées à ce fichier de polygones. C’est ce fichier qui a été rastérisé à 10 mètres de résolution. La présence d’une route a été assignée à une cellule lorsque sa superficie était occupée en majorité par la route.
Il faut noter qu’avec cette méthode, certaines routes apparaissent discontinues. Cela peut induire des biais pour la comparaison des cartes à 10 mètres et 30 mètres de résolution, notamment pour les indicateurs paysagers (une route discontinue ne fragmentera pas un patch d’habitat de la même manière qu’en linéaire continu). De plus, certains types de routes peu larges sont susceptibles de ne pas apparaitre. Les images ci-dessous présentent ces différences pour le site de l’aérodrome :
– les sentiers n’apparaissent pas sur l’image à 10 mètres de résolution ;
– les chemins et routes empierrées, d’une largeur moindre, apparaissent discontinues ;
– les routes à une chaussée, plus larges, apparaissent quasiment toutes continues.
L’information du réseau routier aux résolutions de 10 et 30 mètres
1.5 Indices paysagers
Les indices paysagers sont calculés avec le logiciel FRAGSTATS, afin d’obtenir des valeurs numériques permettant de décrire les caractéristiques paysagères de chaque site.
Le logiciel FRAGSTATS calcule ces valeurs en se basant sur des images (fichiers .ASCII ou .GEOTIFF), qui sont des cartographies d’habitat ou d’occupation des sols. Il faut en décrire les classes par leur code et leur nom, indiquer au logiciel s’il doit calculer les métriques pour cette classe ou non, indiquer au logiciel s’il s’agit d’un type classé en « background » ou et lui préciser la règle de voisinage choisie, ces derniers critères influençant le calcul de certaines métriques. La règle de voisinage indique au logiciel s’il doit utiliser, pour la définition des patchs homogènes, les quatre cellules jouxtant la cellule étudiée (selon les quadrants Nord-Sud et Est-Ouest) ou bien les huit cellules qui l’entourent (ajoutant le gradient Sud-Ouest/Nord-Est et Sud-Est/Nord-Ouest.
Illustration de la règle de voisinage
Sélection des métriques paysagères
Afin de réduire les temps de traitement, une analyse en mode lot (batch en anglais) est possible. Cela implique de mettre en place une légende harmonisée pour l’ensemble des sites, notamment d’harmoniser les codes (Annexe 5).
Des indices sont calculés aux niveaux du paysage et des classes d’occupation du sol. Le tableau suivant présente les indices mobilisés. Les calculs peuvent être réalisés :
– au niveau du paysage, ce qui signifie que l’ensemble de la carte est pris en compte ;
– au niveau des classes, ce qui revient à calculer les indices pour chaque type d’occupation du sol présent sur la carte ;
– au niveau des patchs (pour rappel, en écologie du paysage, les patchs sont des espaces homogènes et continus d’un même habitat ou d’une même classe d’occupation du sol). Ce dernier échelon de calcul n’a pas été utilisé puisqu’il n’apparait pas pertinent au regard de notre objectif.
Les indices utilisés sont définis dans les paragraphes suivants.
- Métriques calculées au niveau paysage
Les métriques du paysage sont calculées sur la mosaïque de patchs. Deux types de métriques peuvent être calculés pour caractériser le paysage :
– des indices de la composition et de la configuration spatiale du paysage,
– des statistiques de distribution, c’est-à-dire des résumés statistiques des métriques calculées au niveau des patchs pour l’ensemble du paysage, notamment la moyenne et l’écart-type. Dans les calculs, ces valeurs sont pondérées par la superficie des patchs et leur proportion dans le paysage.
Ces deux types de métriques seront mobilisés.
Pour rappel, les métriques au niveau paysage doivent permettre la comparaison des différents sites en termes de taille (une taille suffisante est souvent synonyme de qualité d’habitat dans la mesure où la partie « cœur » existe et que le patch n’est pas uniquement constitué de lisières), de connectivité, de fragmentation.
Au niveau du paysage, la taille peut être renseignée par les indices AREA et PARA, et indirectement par DIVISION et AI ; la connectivité par les indices CONTAG, ENN ; la fragmentation par les indices NP, ED, AI, DIVISION, PAFRAC.
Les indices peuvent être redondants entre eux, toutefois l’objectif final d’analyser leur corrélation avec la distribution de la faune amène à proposer dans ce premier temps un faisceau d’indices, qui sera affiné par la suite.
· Indices de composition et de configuration spatiale du paysage
– Nombre de patchs (NP)
Cet indice contient une information sur le niveau d’agrégation des patchs et permet donc de caractériser la fragmentation du paysage .
– Densité de lisière (ED)
Cet indice contient une information sur le niveau d’agrégation des patchs et permet donc de caractériser la fragmentation du paysage. Il faut noter également qu’il est corrélé avec le degré de fragmentation et l’abondance maximale .
– Indice de contagion (CONTAG)
Cette métrique quantifie bien les différentes composantes spatiales d’un paysage : elle rend compte de la composition du paysage et de sa connectivité.
– Indice de division du paysage (DIVISION)
Cet indice est corrélé avec le nombre de patchs et l’abondance maximale : il permet donc de renseigner sur le degré de fragmentation du paysage .
– Indice d’agrégation (AI)
Cet indice est corrélé avec le degré de fragmentation et l’abondance maximale. Il informe principalement sur le niveau d’agrégation des patchs . Il est pertinent aux deux niveaux, paysage et classe .
· Indices de composition et de configuration spatiale du paysage
Les métriques calculées au niveau des patchs, pondérées par la superficie des patchs et leur proportion dans le paysage, sont résumées par plusieurs métriques qui résument ainsi l’ensemble du paysage. Les deux caractéristiques statistiques utilisées sont la moyenne et l’écart-type.
– Moyenne, écart-type et coefficient de variation du Ratio aire-périmètre (PARA_MN, _SD)
Cet indice peut être utile pour représenter la forme des patchs (Li et al., 2005). Cela renseigne indirectement sur leur taille. Il ne dépend pas de la configuration de la carte aux niveaux paysage et classe.
– Moyenne et écart-type de la distance euclidienne au plus proche voisin (ENN_MN, _SD)
Cet indice permet de renseigner sur la connectivité potentielle. Au niveau paysage, il permet de renseigner sur la connectivité potentielle moyenne de l’ensemble des patchs et ne donne pas d’information sur la connectivité potentielle des types de milieux.
– Moyenne et écart-type de l’aire des patchs (AREA_MN, _SD)
Pour renseigner sur la composition et la configuration du paysage, l’aire de l’ensemble des patchs est calculée et des résumés statistiques permettent de caractériser la distribution de cette métrique. L’aire moyenne d’un patch (métrique couramment nommée Mean Patch Size, MPS) est, au niveau paysage, redondante avec l’indice de densité de patch (PD) qui n’est donc pas calculé.
- Métriques calculées au niveau classe
Pour aller plus loin, il est possible de comparer différents sites en fonction des mêmes caractéristiques de taille, connectivité, fragmentation, pour certaines classes étudiées. Il peut être intéressant d’observer les caractéristiques du milieu prairial sur plusieurs sites par exemple. Cela pourrait permettre une discrimination, voire une hiérarchisation des sites au regard des caractéristiques de leur habitat.
De la même manière qu’au niveau du paysage, des indices renseignant la composition et la configuration des classes peuvent être calculés, mais aussi des données statistiques renseignant sur la distribution des métriques calculées au niveau des patchs appartenant à la classe étudiée.
Au niveau des classes, la taille peut être renseignée par les indices AREA et PARA, et indirectement par PLAND, DIVISION et AI ; la connectivité par les indices CONTAG, ENN, COHESION, PROX ; la fragmentation par les indices NP, PD, ED, AI, DIVISION, PAFRAC.
· Indices de composition et de configuration spatiale des classes du paysage
– Proportion du paysage (PLAND)
Cet indice décrit la composition du paysage puisqu’il mesure la part du paysage occupée par une classe. Cette mesure est fondamentale pour beaucoup d’applications en écologie, notamment les études sur la fragmentation et la perte d’habitats .
– Nombre de patchs (NP)
Cet indice contient une information sur le niveau d’agrégation des patchs et permet donc de caractériser la fragmentation du paysage . L’aire moyenne d’un patch apparait comme une métrique pertinente lorsqu’elle est interprétée en lien avec l’aire totale de la classe, la densité ou le nombre de patchs et la variabilité des tailles des patchs .
– Densité de patchs (PD)
Cet indice renseigne sur le degré d’agrégation des patchs . Il sera utilisé notamment au regard des valeurs de l’indice d’aire moyenne des patchs.
– Densité de lisière (ED)
Cet indice contient une information sur le niveau d’agrégation des patchs et permet donc de caractériser la fragmentation du paysage.
– Indice de cohésion de patch (COHESION)
L’indice de cohésion des patchs mesure la connectivité physique du type de patch correspondant.
– Indice d’agrégation (AI)
Cet indice est corrélé avec le degré de fragmentation et l’abondance maximale. Il informe principalement sur le niveau d’agrégation des patchs . Il est pertinent aux deux niveaux, paysage et classe .
· Statistiques de distribution des métriques calculées au niveau des patchs
Les métriques calculées au niveau des patchs, pondérées par la superficie des patchs et leur proportion dans le paysage, sont résumées par plusieurs métriques qui résument ainsi l’ensemble d’une classe. Les deux caractéristiques statistiques utilisées sont la moyenne et l’écart-type.
– Moyenne, écart-type et coefficient de variation du Ratio aire-périmètre (PARA_MN, _SD)
Cet indice peut être utile pour représenter la forme des patchs (Li et al., 2005). Cela renseigne indirectement sur leur taille. Il ne dépend pas de la configuration de la carte aux niveaux paysage et classe.
– Moyenne et écart-type de la distance euclidienne au plus proche voisin (ENN_MN, _SD)
Cet indice permet de renseigner sur la connectivité potentielle. Au niveau paysage, il permet de renseigner sur la connectivité potentielle moyenne de l’ensemble des patchs et ne donne pas d’information sur la connectivité potentielle des types de milieux.
– Moyenne et écart-type de l’indice de proximité dans un rayon de 45 mètres (PROX_MN, PROX_SD)
Cette métrique fait partie du faisceau d’indices devant renseigner la connectivité d’une classe. En effet, elle prend en compte à la fois la distance d’un patch à son plus proche voisin de même classe et sa superficie : ces deux caractéristiques apparaissent primordiales en écologie.
– Moyenne et écart-type de l’aire des patchs de la classe (AREA_MN, _SD)
Pour renseigner sur la composition et la configuration de chaque classe, l’aire des patchs lui appartenant est calculée et les résumés statistiques permettent de caractériser la distribution de cette métrique. L’aire moyenne d’un patch apparait comme une métrique pertinente lorsqu’elle est interprétée en lien avec l’aire totale de la classe, la densité ou le nombre de patchs et la variabilité des tailles des patchs .
Les métriques utilisées dans cette étude ont fait l’objet d’une présentation et le choix des indices calculés explicité. Deux points techniques vont maintenant être présentés : les matrices servant au calcul des métriques liées aux lisières et les traitements statistiques effectués sur les métriques obtenues.
- Matrices edge depth et edge contrast
Pour calculer les métriques intégrant l’effet lisière, le logiciel demande deux matrices qui décrivent les différences à intégrer entre plusieurs classes d’occupation du sol (edge depth et edge contrast). Celle-ci a été construite à partir du travail de thèse de Mallard, . Elle se lit comme suit : « L’épaisseur de lisière entre l’espace artificialisé (en colonne) et la prairie (en ligne) s’étend sur 180 mètres ». Les valeurs attribuées visent à approcher l’impact d’une présence anthropique qui peut potentiellement perturber les milieux naturels, mais aussi les effets de transition entre deux types de milieux naturels, du plus ouvert au plus fermé par exemple.
Une fois les calculs effectués, une base de données peut être créée pour le traitement statistique de ce corpus. Les traitements menés vont être présentés dans le paragraphe suivant.
- Traitements statistiques
Au niveau du paysage, les traitements statistiques doivent permettre de comparer les sites entre eux, mais aussi les cartes issues du protocole présenté dans ce rapport avec les cartes du référentiel aquitaine d’occupation du sol (OCSGE) pour les quatre sites d’étude Aérodrome de Bordeaux-Saucats, Lagune de Callen, Dune de Lège-Cap Ferret, Plateau d’Argentine. Pour le site de l’Aérodrome de Bordeaux-Saucats, il s’agit aussi de repérer les similitudes et différences des cartes de résolutions différentes (30 mètres et 10 mètres).
Pour comparer ces différentes cartes, il est nécessaire d’utiliser la même légende. Ainsi, les cartes du référentiel aquitain ont été retravaillées et la légende mise en œuvre lors du protocole de cartographie par télédétection leur a été appliquée. Le tableau suivant présente la correspondance appliquée entre les deux légendes :
Correspondances des légendes du référentiel aquitain d’occupation des sols à grande échelle et des cartographies réalisées pour le programme Les sentinelles du climat
De plus, la carte, d’origine disponible au format vectoriel, a été rastérisée afin d’être traitée par le logiciel FRAGSTATS de la même manière que les cartographies réalisées dans le cadre du programme.
Correspondances des légendes du référentiel aquitain d’occupation des sols à grande échelle et des cartographies réalisées pour le programme Les sentinelles du climat.
Le corpus complet des cartes a été intégré au logiciel FRAGSTATS pour calculer les différentes métriques présentées précédemment.
Des analyses statistiques ont été menées d’une part sur les indices calculés au niveau paysage et d’autre part sur ceux calculés pour chaque classe. Les analyses statistiques ont été effectuées avec le logiciel Microsoft Excel et son extension XLStat, version 19.02.
- Métriques calculées au niveau paysage
Une matrice de proximité, basée sur le coefficient de corrélation de Spearman permet d’établir (ou non) des corrélations entre les différentes cartes, en comparant les valeurs de l’ensemble des indices calculés pour l’ensemble des images. Pour p = 0.001, le seuil de corrélation retenu est de rho = 0.85.
Une Analyse en Composantes Principales (ACP) et une Classification Ascendante Hiérarchique (CAH) ont été effectuées sur les indices paysagers calculés pour toutes les cartes du site de l’Aérodrome de Bordeaux-Saucats (référentiel aquitain rastérisé à 10 et 30 mètres, 1 carte à 30 mètres de résolution et 2 cartes à 10 mètres de résolution réalisées dans le cadre du programme). L’ACP et la CAH sont basées sur la similarité selon le coefficient de corrélation de Spearman (alpha = 0.05). La CAH a été tronquée par la méthode d’entropie.
- Métriques calculées au niveau classe
L’étude s’est ici focalisée sur les classes d’occupation du sol correspondant aux habitats potentiels des espèces sentinelles (1.1). Les classes conservées sont : dunes grises, forêts de feuillus denses et clairsemées, forêts mélangées, forêts en transition, landes, pelouses, prairies, plans d’eau et ceinture végétale des bords des eaux.
Sur le même principe qu’au niveau paysage, des matrices de similarité/dissimilarité ont été effectuées pour chaque métrique calculée au niveau classe, basées sur le coefficient de corrélation de Spearman, afin d’observer les similitudes (ou non) entre les différentes cartes.
Une Analyse en Composantes Principales (ACP) a été effectuée sur les indices paysagers calculés au niveau des classes d’occupation du sol pour les cartes du site de l’Aérodrome de Bordeaux-Saucats de 30 mètres de résolution et 10 mètres de résolution réalisées dans le cadre du programme). L’ACP est basée sur la similarité selon le coefficient de corrélation de Spearman (alpha = 0.05).
1.6 Résultats exploratoires
Cartographies de 30 mètres de résolution
Pour rappel, les cartographies de 30 mètres de résolution ont été effectuées pour quatre sites : Aérodrome de Bordeaux-Saucats (voir plus haut), Lagune de Callen (A ci-dessous), Dune de Lège-Cap Ferret (B ci-dessous) et Plateau d’Argentine (C ci-dessous).
Localisation des sites d’étude Lagune de Callen, Dune de Lège-Cap Ferret, Plateau d’Argentine
Le site de Lège-Cap Ferret est celui dont la cartographie diffère le moins avec la base de données aquitaine : l’espace très contraint entre Bassin d’Arcachon et Océan Atlantique a été fortement urbanisé durant les dernières décennies. La cartographie obtenue semble même accentuer cet effet en attribuant régulièrement les quelques espaces boisés aux zones artificialisées. L’intérêt d’utiliser la télédétection pour affiner l’occupation du sol se trouve principalement pour le milieu dunaire : la dune grise, herbacée, a pu être différenciée de la dune blanche. Des espaces de transition entre la dune grise et la dune boisée ont également pu être mis en exergue et classés en landes et broussailles. Dans ce milieu très ouvert, où la végétation s’installe progressivement selon un gradient depuis la plage jusqu’à la forêt de pins, il n’est pas simple de placer une limite nette entre dune blanche et dune grise lorsque le travail de cartographie est mené par photo-interprétation seule.
Le site du Plateau d’Argentine a une légende complexe (16 classes) avec plusieurs classes « redondantes » : prairies/cultures, prairies permanentes, prairies humides. Ces informations supplémentaires apportent peu cartographiquement. En revanche, les précisions doivent servir pour l’établissement des indices paysagers, car elles permettent d’identifier le degré d’anthropisation. L’analyse dynamique en sera dépendante : une prairie temporaire renvoie à une possible utilisation pour l’agriculture, ou bien à des pratiques de fauchage ou de pâturage, qui ont des effets différents sur la faune. La classe prairie/cultures englobe ces différents usages possibles, non visibles en télédétection, voire en photo-interprétation.
Les prairies et pelouses sont des types d’occupation du sol difficilement reconnus. La pelouse calcicole connue du Plateau d’Argentine apparait très hétérogène : plusieurs classes définissent un espace connu comme relativement homogène par les naturalistes effectuant les suivis sur ce site.
La Lagune de Callen prend place dans un environnement plus homogène, principalement occupé par des forêts plantées de conifères. Certains espaces de culture sont assez bien reconnus et différenciés des espaces de prairies/cultures notamment grâce à leur forme particulière (cercle lié à l’irrigation). Quelques espaces de landes ou de zones humides apparaissent en groupes de pixels assez restreints, voire en pixels isolés, ce qui sera probablement reflété par les indices paysagers.
Le site de l’aérodrome Bordeaux-Saucats est assez représentatif des apports du protocole mis en place : l’hétérogénéité des milieux présents dans le périmètre de l’aérodrome ressort bien : les pistes artificialisées, les pelouses fauchées, entretenues à proximité des pistes, et la prairie plus humide où sont suivis les papillons et le cortège végétal.
Certains espaces de prairies/cultures apparaissent au sein de la forêt plantée de conifères. Des suivis réguliers permettront d’identifier si ces espaces, qui semblent correspondre à une exploitation de la forêt, seront replantés ou bien laissés en jachère. Les prairies/cultures sont difficilement reconnues sur ce site. La base de données agricoles n’y recense pas de cultures, ce qui peut être un élément en faveur de la classe prairies, mais aussi une conséquence du mode de collecte de ces données (déclarations des agriculteurs). Cette classe mixte permet donc d’envisager les différentes possibilités.
Une nomenclature harmonisée pour tous les sites a été nécessaire pour le calcul des indices paysagers et le travail par lot. Cependant, il faut noter que la légende mise en œuvre reste assez générale et qu’un même libellé peut recouvrir plusieurs réalités : les espaces végétalisés en zone artificialisée qualifient les pelouses entretenues de l’aéroport mais aussi les jardins, chemins de propriété à l’écart de l’urbanisation… La nomenclature vise à regrouper des espaces dont les usages sont relativement similaires et correspondent à un type d’effet sur les milieux « naturels » et la faune présente.
Les classes « forêt mixte » et « forêt en transition » sont également particulières car elles peuvent qualifier des espaces bien identifiés comme tels, mais aussi des espaces de forêt pour lesquels il y a un doute sur le type de végétation dominante (feuillus/conifères).
Les cartes réalisées sont présentées ci-après et sont comparables visuellement avec la carte du référentiel aquitain d’occupation du sol placée en vis-à-vis (figures suivantes).
Comparaison de l’occupation du sol du site de l’Aérodrome Bordeaux-Saucats (33) à 30 mètres de résolution et issue du référentiel aquitain.
Comparaison de l’occupation du sol du site de la Lagune de Callen (40) à 30 mètres de résolution et issue du référentiel
Comparaison de l’occupation du sol du site de la dune de Lège-Cap Ferret (33) à 30 mètres de résolution et issue du référentiel
Comparaison de l’occupation du sol du site du plateau d’Argentine (24) à 30 mètres de résolution et issue du référentiel
Cartographie de 10 m de résolution
La figure suivante présente la comparaison de l’occupation du sol du site de l’Aérodrome Bordeaux-Saucats (33) entre les cartes à 10 mètres de résolution, issues du rééchantillonnage (A) et de l’amélioration de la netteté panchromatique (B), et la carte du référentiel aquitain.
Comparaison de l’occupation du sol du site de l’Aérodrome Bordeaux-Saucats (33) entre les cartes à 10 mètres de résolution, issues du rééchantillonnage (A) et de l’amélioration de la netteté panchromatique (B), et la carte du référentiel aquitain
Evolution des indices paysagers
Comme précédemment, les résultats des analyses paysagères avec le logiciel FRAGSTATS seront présentés selon leur niveau de calcul : paysage ou classe.
- Métriques calculées au niveau paysage
· Comparaison de l’ensemble des métriques paysagères
La matrice de similarité/dissimilarité exprime le niveau de corrélation de l’ensemble des valeurs des indices paysagers calculés pour les différentes cartes au niveau paysage. Elle se base sur la corrélation de Spearman.
Le tableau suivant présente cette matrice appliquée aux sites Lagune de Callen (LCALL), Dune de Lège-Cap Ferret (LO305) et Plateau d’Argentine (ARGEN). L’objectif est d’y rechercher une corrélation (ou non) entre les cartes réalisées dans le cadre du programme et les cartes du référentiel aquitain d’occupation du sol.
Il apparait que les indices paysagers calculés pour ces deux types de cartes ne sont pas corrélés pour les sites LCALL et LO305. En revanche, la carte réalisée pour le site ARGEN apparait corrélée à la carte du référentiel aquitain (Test de Spearman, p < 0.001, ρ= 0.911).
Matrice de similarité/dissimilarité des cartes réalisées à 30 mètres de résolution et du référentiel aquitain pour les sites Lagune de Callen, Dune de Lège-Cap Ferret et Plateau d’Argentine
La non-corrélation du site LCALL et la corrélation du site ARGEN apparaissent visuellement sur la comparaison des cartes (voir les deux cartes suivantes) : le site LCALL apparait moins homogène sur la carte réalisée que sur le référentiel, tandis que la structuration de l’espace du site ARGEN apparait plus similaire sur les deux cartes.
Comparaison de la carte réalisée avec la carte du référentiel aquitain rastérisé (résolution 30 mètres) pour le site Lagune de Callen
Comparaison de la carte réalisée avec la carte du référentiel aquitain rastérisé (résolution 30 mètres) pour le site Plateau d’Argentine
En revanche, les résultats de cette matrice sont plus surprenants pour le site LO305 : les deux cartes apparaissent proches visuellement, à l’exception de la présence ajoutée du réseau de sentiers et pistes cyclables dans l’espace de dune boisée de la forêt domaniale de Lège-Cap Ferret.
Comparaison de la carte réalisée avec la carte du référentiel aquitain rastérisé (résolution 30 mètres) pour le site Dune de Lège-Cap Ferret
Ces résultats confirment l’apport de la cartographie à la résolution de 30 mètres : des informations paysagères contenues dans ces cartes peuvent compléter celles du référentiel.
Concernant le site de l’Aérodrome Bordeaux-Saucats, les indices paysagers de la carte réalisée dans le cadre du programme et du référentiel aquitain, pour la résolution 30 mètres, n’apparaissent pas corrélés.
En revanche, les indices paysagers des deux cartes réalisées à 10 mètres de résolution sont corrélés avec ceux de la carte à 30 mètres (respectivement, ρ= 0.922 et ρ= 0.917). Les deux cartes réalisées à 10 mètres de résolution sont corrélées entre elles (ρ= 0.996). Le tableau suivant présente ces résultats. Pour rappel, ces deux cartes ont été construites selon le même protocole, à l’exception du prétraitement nécessaire pour les images exprimant la réflectance dans l’infrarouge moyen : le groupe « PANSH » correspond au traitement par amélioration de la netteté panchromatique, le groupe « RESAMPLE » correspond au seul rééchantillonnage. D’après cette analyse statistique, l’information paysagère, calculée au niveau paysage, est globalement similaire pour les deux cartes.
Concernant le site de l’Aérodrome Bordeaux-Saucats, les indices paysagers de la carte réalisée dans le cadre du programme et du référentiel aquitain, pour la résolution 30 mètres, n’apparaissent pas corrélés. En revanche, les indices paysagers des deux cartes réalisées à 10 mètres de résolution sont corrélés avec ceux de la carte à 30 mètres (respectivement, ρ= 0.922 et ρ= 0.917). Les deux cartes réalisées à 10 mètres de résolution sont corrélées entre elles (ρ= 0.996). Le tableau Tab. X présente ces résultats. Pour rappel, ces deux cartes ont été construites selon le même protocole, à l’exception du prétraitement nécessaire pour les images exprimant la réflectance dans l’infrarouge moyen : le groupe « PANSH » correspond au traitement par amélioration de la netteté panchromatique, le groupe « RESAMPLE » correspond au seul rééchantillonnage. D’après cette analyse statistique, l’information paysagère, calculée au niveau paysage, est globalement similaire pour les deux cartes
Ces résultats statistiques semblent correspondre aux résultats intuitifs liés à l’observation des cartes réalisées en comparaison avec les cartes du référentiel. La carte à 30 mètres de résolution montre l’apport du protocole, notamment pour l’hétérogénéité présente au sein du périmètre défini comme l’aérodrome dans la carte du référentiel, mais aussi pour l’hétérogénéité des espaces classés en forêts de conifères :
Comparaison de la carte réalisée avec la carte du référentiel (résolution 30 mètres) pour le site Aérodrome de Bordeaux-Saucats
Ce constat est le même pour les cartes de résolution 10 mètres (voir figure ci-dessous). La comparaison de ces deux cartes montre une similitude que confirme le coefficient élevé de corrélation, puisque la structure est globalement la même, avec des espaces au périmètre plus homogène pour l’image RESAMPLE. Cela s’explique par le mode de construction de cette image, qui reflète la résolution 20 mètres.
Comparaison de la carte réalisée avec la carte du référentiel (résolution 10 mètres) pour le site Aérodrome de Bordeaux-Saucats (A-RESAMPLE et B-PANSH)
L’analyse en composantes principales (ACP) permet de mettre en évidence des similarités entre les valeurs des paramètres des indices paysagers pour les différents types de traitement d’image (figure ci-dessous). Les calculs de l’ACP choisie sont basés sur une matrice composée des coefficients de corrélation de Spearman. La matrice de corrélation (Indice de Spearman, p < 0,05) et le test de sphéricité de Bartlett (Χ² (ddl = 14) = 122.224, p < 0,0001) indiquent qu’au moins l’une des corrélations entre les variables est significative.
Analyse ACP sur les similarités entre les valeurs des paramètres des indices paysagers pour les différents types de traitement d’image
L’analyse des valeurs propres des axes factoriels décrit la qualité de la projection des 5 dimensions ou variables et permet de choisir à partir de la méthode de critère du coude le nombre d’axes, ici les deux premiers axes F1 et F2 (F1 : valeur propre = 3.975, variabilité = 79.495 % ; F2 : valeur propre = 0.921, variabilité = 18.425%).
Sur le graphique de l’ACP (ci-dessus), les variables sont projetées sur un plan factoriel vers le bord du cercle de rayon unité, elles sont bien représentées. Toutes les variables sont représentées sur l’axe F1.
L’indice paysager PARA est l’indice qui explique le plus les groupes de corrélation qui sont les suivants d’après la Classification Ascendante Hiérarchique (CAH) (voir figure ci-dessous), selon un critère de similarité de Spearman (entropie) :
– 1er groupe (ρ = 0.608) : AEROD_30M_OCS et AEROD-10M_0CS
– 2ème groupe (ρ = 0.895) :
- Sous-groupe 2.1 (ρ = 0.991) AEROD_30M
- Sous-groupe 2.2 (ρ = 0.991) AEROD_10M_RESAMPLE et AEROD_10M_PANSH
Analyse CAH sur les similarités entre les valeurs des paramètres des indices paysagers pour les différents types de traitement d’image
Pour le site de l’Aérodrome Bordeaux-Saucats, le référentiel aquitain, qu’il ait été rastérisé à une résolution de 10 m ou de 30 m, est significativement différent des cartes du programme de même résolution. La carte de résolution 30 m est différente des cartes de résolutions 10 m.
Les indices qui expliquent les corrélations entre les groupes sont dans l’ordre d’importance : ratio périmètre-aire (PARA), nombre de patchs (NP), densité de lisière (ED), densité de patchs (PD) et distance euclidienne au plus proche voisin (ENN).
La carte de l’aérodrome de résolution 30 mètres est caractérisée principalement par des indices d’aire et de distance euclidienne au plus proche voisin. La résolution à 10 mètres permet d’affiner la définition des patchs : leur nombre et donc leur densité, la densité de lisière et le ratio aire-périmètre. Les indices liés au découpage des patchs apparaissent donc plus corrélés (Test de Spearman) aux cartes de 10 mètres de résolution.
· Comparaison par métrique paysagère
– Métriques de composition du paysage : NP, PD, PARA, AREA
Pour rappel, l’indice NP calcule le nombre de patchs présents dans le paysage, l’indice PD construit le ratio entre le nombre de patchs présents et la superficie totale du paysage, les indices AREA_MN et _SD expriment la moyenne et la distribution de la taille des patchs, et les indices PARA_MN et _SD expriment la moyenne et la distribution du ratio périmètre-aire des patchs.
La valeur de l’indice du nombre de patchs seule donne une information limitée, elle doit être complétée par les informations sur la superficie, la distribution ou la densité des patchs.
Pour le site de l’Aérodrome de Bordeaux-Saucats, l’indice NP de la carte de 30 mètres de résolution est largement inférieur à celui de la carte de 10 m de résolution (respectivement 309 patchs et 1474 patchs pour PANSH). Pour les indices NP et PD, les cartes des sites de résolution 30 mètres sont plus précises que les cartes associées du référentiel de 30 m, de 5 à 20 fois plus précis.
L’aire moyenne des patchs apparait plus réduite (de 0.9 à 2.6 ha ± de 3.2 à 9.9 (écart-type) pour les cartes du programme, de 6.7 à 19.2 ± de 24.5 à 67.5 (écart-type) pour les cartes du référentiel).
L’aire moyenne des patchs (PARA_MN) est plus petite pour la carte de 30 m de résolution et le périmètre y est plus grand que pour la carte du référentiel (de 864.8 à 1040.1 (± 322.7 à 366.7) pour les cartes 30 m ; de 549.1 à 692.1 (± 350.9 à 403.5) pour le référentiel). Il faut toutefois noter que le rapport périmètre-surface, qui permet de mesurer la complexité de la forme des patchs notamment, est très sensible à la taille du patch (à forme constante, une augmentation de la taille aura un impact sur le rapport périmètre-aire).
Pour les cartes de 10 mètres de résolution, le nombre de patchs est plus élevé (5x + que carte de 30 mètres de résolution), ce qui influe sur tous les indices. En conséquence, la densité des patchs est plus importante. L’aire moyenne est plus petite, ce qui influence le ratio périmètre-aire qui devient énormément plus important (effet de taille). L’écart-type est significatif pour le PARA de la résolution 10 m.
L’ensemble des valeurs d’indices présentées sont résumées dans le tableau suivant :
Valeurs des indices paysagers de composition calculés au niveau paysage
– Métriques de configuration du paysage : fragmentation (ED, DIVISION, AI) et connectivité (ENN, CONTAG)
Pour rappel, l’indice ED calcule le ratio de la somme des longueurs de toutes les lisières sur la surface totale du paysage, l’indice DIVISION exprime la probabilité que deux pixels choisis aléatoirement dans le paysage ne soient pas situés dans un même patch, l’indice AI exprime en pourcentage le niveau d’agrégation des patchs (AI tend vers 1 quand le paysage est constitué d’un seul patch).
Dans la mesure où les cartes réalisées dans le cadre du programme ont plus de patchs, l’indice de lisière ED apparait plus important (de 2 à 6 fois plus) que celui des cartes du référentiel aquitain. Le paysage est plus divisé dans la carte du programme que dans celle du référentiel (de 0.90 à 0.98 pour les cartes du programme ; de 0.37 à 0.77 pour le référentiel – NB. Site Lagune de Callen très homogène). L’indice d’agrégation rend compte de patchs plus agrégés dans les cartes du référentiel (de 87.3 à 95.6 %) que dans les cartes du programme (de 63.7 à 81.4%). Cela s’explique par le mode de construction des images : le protocole par photo-interprétation utilisé pour dessiner le référentiel ne prend en compte que les objets de grande superficie, tandis que la classification par télédétection ne tient pas compte des superficies concernées mais seulement du comportement spectral.
Ainsi, globalement, les cartes du référentiel sous-estiment plus la fragmentation des paysages que la méthode développée dans le cadre du programme.
Concernant la connectivité, l’indice ENN n’est pas significatif : l’écart-type très important ramène la différence entre la valeur moyenne et l’écart-type à environ 1. L’indice de contagion, qui inversement lié à l’effet de lisière et exprime la contagion observée par rapport à la contagion maximale possible, confirme le constat soulevé précédemment : les cartes du référentiel ont une contagion plus élevée que les cartes réalisées dans le cadre du programme (respectivement, de 50.9 à 70.6 ; de 34.5 à 47.7).
Les indices permettent de confirmer et de quantifier les différences observables sur les cartes. Malgré ces différences, les analyses statistiques globales montrent une forte corrélation entre la carte de 30 m et la carte de 10 m de résolution.
L’ensemble des valeurs d’indices présentées sont résumées dans le tableau suivant :
Valeurs des indices paysagers de fragmentation et de connectivité calculés au niveau paysage
– Une métrique calculée au niveau des classes mais renseignant sur la composition du paysage dans son ensemble : PLAND
L’indice paysager PLAND décrit la proportion occupée par une classe de type d’occupation du sol au sein de l’ensemble du paysage pour les différents étudiés. Le pourcentage de paysage quantifie l’abondance proportionnelle de chaque type de parcelle dans le paysage. Il s’agit d’une mesure de la composition du paysage importante dans de nombreuses applications écologiques et est appropriée à la comparaison de paysages différents (puisque c’est une mesure relative).
D’un point de vue global, une matrice de similarité/dissimilarité révèle une différence entre les cartes réalisées dans le cadre du programme pour la résolution de 30 mètres, sauf pour le site de milieu dunaire à Lège-Cap Ferret (LO305) pour lequel les deux classes apparaissent comme des objets similaires selon la corrélation de Spearman (ρ= 1 ). Pour la résolution 10 mètres, les deux méthodes de rééchantillonnage et d’amélioration de la netteté panchromatique aboutissent globalement au même résultat pour cette métrique puisque les deux cartes sont corrélées significativement (ρ= 0.873). Les indices PLAND correspondant aux cartes de résolution différente ne sont pas similaires.
D’un point de vue simplement descriptif, les cartes réalisées dans le cadre du programme et le référentiel sont comparées par des diagrammes circulaires.
Site de la Dune de Lège-Cap Ferret (LO305)
Pour ce site, les différences de classes entre la carte réalisée et celle du référentiel montrent que la classe forêt de conifères (équivalente à la classe dune boisée) est affinée par les classes landes et broussailles d’une part et dune grise d’autre part :
Proportion des types d’occupation du sol pour le site LO305 en résolution de 30 m (A-Réalisation LSDC, B-OCS)
Site Lagune de Callen (LCALL)
Pour ce site, la classe forêt de conifères de la carte du référentiel aquitain a été redécoupée en plusieurs classes par les infrastructures de transport, les cultures, différents types de forêts mixtes et feuillus, zones humides, etc :
Proportion des types d’occupation du sol pour le site LCALL en résolution de 30 m (A-Réalisation LSDC, B-OCS)
Site Plateau d’Argentine (ARGEN)
Pour ce site, les différences classes entre la carte du programme et celle du référentiel résident dans l’ajout des zones humides et des types d’agriculture. Cependant, ces nouvelles classes ont un comportement d’effet de lisière et de contraste similaires avec celles du référentiel, expliquant la corrélation entre les indices paysagers des deux cartes au niveau global :
Proportion des types d’occupation du sol pour le site ARGEN en résolution de 30 m (A-Réalisation LSDC, B-OCS)
Site Aérodrome de Bordeaux-Saucats (AEROD)
Pour ce site, la classe forêt de conifères du référentiel est affinée sur la carte de résolution 30 m et de 10 m du programme en plusieurs classes de prairies, landes et différents types de forêt : feuillus clairsemée et dense, transition, etc :
Proportion des types d’occupation du sol pour le site AEROD en résolution 30 m (A- LSDC, B-OCS)
Le passage de la résolution de 30 m à 10 m montre une augmentation de la classe landes et broussailles correspondant à des zones trouées dans les patchs de forêts :
Proportion des types d’occupation du sol pour le site AEROD en résolution 10 m (A-LSDC RESAMPLE, B-LSDC PANSH, C-OCS)
- Métriques calculées au niveau classe
· Analyse en Composantes Principales des indices paysagers par classes d’occupation du sol
L’ACP permet de mettre en évidence des similarités entre les valeurs des paramètres des indices paysagers pour les différents types de traitement d’image (voir figure ci-dessous). Les calculs de l’ACP choisie sont basés sur une matrice composée des coefficients de corrélation de Spearman. La matrice de corrélation (Indice de Spearman, p < 0,05) et le test de sphéricité de Bartlett (Χ² (ddl =35) = 187.121, p < 0,0001) indiquent qu’au moins l’une des corrélations entre les variables est significative.
ACP des indices paysagers des classes d’occupation du sol
L’analyse des valeurs propres des axes factoriels décrit la qualité de la projection des 5 dimensions ou variables et permet de choisir à partir de la méthode de critère du coude le nombre d’axes, ici les deux premiers axes F1 et F2 (F1 : valeur propre = 3.419, variabilité = 42.739% ; F2 : valeur propre = 2.961, variabilité = 37.012%).
Sur le graphique de l’ACP, les variables sont projetées sur un plan factoriel vers le bord du cercle de rayon unité, elles sont bien représentées. Les variables représentées sur l’axe F1 sont : PD, ED, PARA. Les variables représentées sur l’axe F2 sont : PLAND, AREA, COHESION, AI. Les variables les mieux représentées sont : ED et PD.
Dans la carte de l’aérodrome de 10 mètres de résolution (image du groupe pansharpening), la classe forêt mixte et forêt de feuillus (cos² = 0.6) sont plus représentés au niveau de l’indice PARA. Pour la carte de 30 mètres de résolution, la classe des landes et prairies humides (cos² = 0.4) sont représentées au niveau de l’aire et indice d’agrégation.
· Métriques de composition des classes : NP, PD, PARA, AREA
Pour chaque métrique, une matrice de similarité/dissimilarité a été réalisée pour observer les différences amenées par chaque carte (30 mètres, 10 mètres, référentiel).
Pour tous les indices, les métriques calculées confirment la similarité des cartes du référentiel, qu’elles aient été rastérisées à 10 ou 30 mètres de résolution. Cela s’observe sur les cartes également : un rééchantillonnage spatial visant à améliorer la résolution ne suffit pas si elle ne prend pas en compte l’hétérogénéité au sein des espaces définis comme homogènes par le travail de photo-interprétation réalisé. Les cartes aux deux résolutions sont donc toujours identifiées comme des objets similaires (ρcompris entre 0.990 et 1.000).
Pour les indices NP, PD, AREA_MN et PARA_MN, comme pour l’indice PLAND précédemment, au niveau des classes, il y a une différence entre les cartes du référentiel aquitain et les cartes réalisées dans le cadre du programme pour la résolution de 30 mètres, sauf pour le site LO305 (objets similaires : ρ = 0.997).
Les méthodes PANSH et RESAMPLE aboutissent à des indices paysagers NP plus mitigés : la corrélation n’est plus significative. En revanche, pour l’indice AREA_MN, il y a une corrélation entre les deux images à 10 mètres de résolution (ρ= 0.932).
· Métriques de configuration du paysage : fragmentation (ED, COHESION, AI)
Comme les indices précédents, pour les indices ED et COHESION, au niveau des classes, il y a une différence entre les cartes du référentiel aquitain et les cartes réalisées dans le cadre du programme pour la résolution de 30 mètres, sauf pour le site LO305 (objets similaires :ρ = 1.000).
Les indices ED de chaque classe sont différents entre les cartes de 30 mètres et de 10 mètres.
Les indices COHESION et AI des images de résolution 10 mètres sont corrélées significativement (respectivement, ρ= 0.917 et ρ= 0.862). Les indices COHESION des cartes de l’aérodrome de 30 mètres de résolution et de 10 mètres de résolution sont corrélées significativement (ρ= 0.965).
Les indices paysagers ont été exploités pour comprendre les différences apportées par les cartes réalisées dans le cadre du programme, à 30 puis 10 mètres de résolutions, vis-à-vis de la donnée d’occupation du sol la plus précise disponible pour la Nouvelle-Aquitaine : le référentiel d’occupation du sol. Le protocole de cartographie n’ayant pas encore été réalisé sur un nombre suffisant de sites, aucune comparaison ni hiérarchisation entre sites de même milieu n’a été réalisée.
1.7 Discussion
Retour critique et perspectives de la méthodologie
L’objectif final – travailler sur les indices paysagers – nécessite des données d’occupation du sol de résolution spatiale fine pour un grand nombre de sites. La nécessité d’obtenir des résultats opérationnels rapidement a orienté la mise en place d’un protocole hybride, entre télédétection et photo-interprétation. Si les résultats obtenus semblent satisfaisants pour la suite de l’analyse, certains biais et manques sont apparus.
- Des données exogènes multiples : quid des métadonnées
Tout d’abord, l’utilisation de multiples sources d’informations pose un problème d’adéquation des dates. En effet, l’interprétation des classes dépend des signatures spectrales issues des images de 2014 (Landsat 8) et 2016-2017 (Sentinel-2) mais aussi de la reconnaissance visuelle sur une orthophotographie de 2012 (pour Landsat 8) et 2017 (pour Sentinel-2). Ce décalage temporel peut amener à des erreurs d’interprétation. Toutefois, il faut noter que lors de cette étape, les informations apportées par les signatures spectrales des classes sont apparues cohérentes avec l’interprétation visuelle.
Hétérogénéité des dates de construction des données utilisées
- L’interprétation des courbes spectrales
Un autre type de biais apparait dans ce tableau d’interprétation des courbes spectrales, mis en place de manière qualitative :
L’allure générale de la courbe : les courbes « eau », « végétal », « minéral » sont a priori sans ambiguïté, mais les courbes mixtes ont posé question : quand la courbe passe-t-elle de « végétal/minéral » à « mixte à dominance végétal/minéral » ? quand le plateau de réflectance est-il suffisamment horizontal pour placer la classe dans la catégorie « mixte plat » (Fig. 45) ?
Les échelles de signal : la décision de placer la croix dans une case intermédiaire est simple, mais à partir de quelle valeur le chiffre peut-il être considéré suffisamment proche pour être placé sur l’une des cases avec valeur ?
Le ton : la majorité des classes apparaissent sombres. Cela peut être dû également à une confusion avec la présence d’eau. Par ailleurs, l’échelle allant du plus clair au plus sombre est amenée à varier en fonction des classes et la perception de l’étendue des courbes. Même si la « définition » avait été harmonisée en fonction des différentes valeurs prises, certaines valeurs peuvent par exemple être placées en ton « plutôt sombre » plutôt qu’en ton « sombre » pour faire apparaitre dans le tableau une différenciation visible sur les courbes (cf. Classes 3 et 6 qui se détachent des autres courbes au mois de septembre).
Pour pouvoir comparer les courbes entre elles et avoir la même lecture concernant la proximité ou non aux valeurs seuils présentes sur l’échelle des ordonnées, tous les graphiques ont été mis en page de la même façon :
– une échelle des ordonnées allant de 6*103 à 1.8*104
– des unités distantes de 2*103
– lorsque les courbes comprenaient des valeurs supérieures à 1.8*104, la même unité a été conservée, le graphique étant augmenté verticalement de sorte à conserver le même espacement visuel entre les unités malgré une échelle des ordonnées plus grande.
Pour pallier ces problèmes d’interprétation en amont, un tableau contenant ces mêmes informations, mais de manière quantitative, a été préparé :
– valeurs de la réflectance dans le proche infrarouge, en mars et en septembre,
– valeurs de la réflectance dans l’infrarouge à ondes courtes, en mars et septembre,
– valeurs moyennes des réflectances dans les canaux du visible, en mars et en septembre,
– valeurs de la pente, de l’altitude et de l’exposition.
Plutôt que d’être mobilisé pour l’interprétation des courbes, ce tableau pourrait servir à des analyses statistiques qui regrouperaient les classes ayant des caractéristiques similaires avant l’étape d’interprétation visuelle/spectrale. Cela inverserait le protocole tel qu’il a été réalisé jusqu’à présent, où les classes sont regroupées entre elles après la phase d’interprétation. Il s’agira de tester cette méthode et de comparer les résultats avec ceux du protocole tel qu’établi. Si les résultats étaient similaires, le protocole pourrait évoluer en ce sens, ce qui permettrait d’automatiser une étape supplémentaire. Tout en restant prudent, une classification au sens statistique et au sens écologique ne se rencontre pas nécessairement. L’automatisation de cette étape serait une solution pour réduire le caractère chronophage du protocole.
Biais possibles lors de l’interprétation des courbes spectrales
Indices paysagers
Les premiers résultats présentés indiquent que si au niveau du paysage, les cartes réalisées à 30 mètres et 10 mètres de résolution sont caractérisées par des indices paysagers corrélés entre eux, les indices calculés au niveau des classes montrent des différences entre les deux résolutions. Cela ne permet pas de conclure quant à un choix de protocole à appliquer aux autres sites afin de procéder à leur comparaison et leur hiérarchisation.
De plus, la tentative de mesurer l’apport de chaque résolution par rapport à la carte d’occupation du sol peut être biaisée de plusieurs façons. D’une part, pour être comparable, la carte d’occupation du sol a fait l’objet d’une réattribution de certains items de légende : la zone définie comme aéroport a par exemple été classée toute entière en « espace végétalisé en zone artificialisé », pour correspondre à la légende mise en œuvre dans le protocole. Pour le site dunaire à Lège-Cap Ferret (LO305), la carte du référentiel du a été reclassée de telle sorte que la « plage » devienne « dune blanche » et que la « dune » devienne « dune grise ». Ainsi, l’apport de la télédétection qui permet d’affiner la partie « dune » pour intégrer la transition dune blanche, dune grise, dune boisée n’est pas ressorti des analyses statistiques (cartes considérées comme similaires pour la majorité des indices). Par ailleurs, il faut souligner que la phase d’interprétation des classes est soumise à la subjectivité du cartographe. Ainsi, sur l’image de la BD ORTHO 2012, certains espaces de forêts de conifères plantés en transition ont été attribués à la classe prairies/cultures pour signifier une impossibilité de choisir entre la « naturalité » d’une prairie de type humide et l’anthropisation du milieu liée à l’exploitation sylvicole ; tandis qu’avec l’image de la BD ORTHO 2017, ces mêmes espaces ont été classés en landes et broussailles, correspondant ainsi au type de milieu présent et sans tenir compte de la possibilité d’une nouvelle exploitation à venir. Certains changements intervenant entre les deux images s’expliquent donc uniquement par la subjectivité du cartographe et non par une différence liée à l’amélioration de la résolution.
Les indices paysagers utilisés ont été choisis en amont en fonction de leur comportement statistique identifié dans la littérature scientifique. Ainsi, l’augmentation de l’indice NP entre une carte à fine résolution et une carte de résolution moins élevée, observée pour le site de l’aérodrome, correspond à un comportement connu (Li et al., 2005). De même, la diminution de l’aire moyenne des patchs avec l’augmentation de la résolution avait été identifiée par les mêmes auteurs. Une augmentation de l’aire moyenne des patchs parallèlement à l’augmentation de l’agrégation, comme cela est exprimé par les indices des cartes du référentiel, était également attendue (Li et al., 2005). Une forte corrélation a été notée entre une évolution de cet indice PARA_MN et la résolution . En revanche, les mêmes auteurs notent que la métrique CONTAG, si elle est utile en soi, n’est pas pertinente pour la comparaison de cartes de différentes résolutions. La carte du référentiel, si elle a été rastérisée à la même résolution que la carte réalisée, n’a pas été construite pour cette résolution. La conclusion tirée de l’observation de cette métrique, à savoir qu’elle confirme un apport de la carte réalisée en télédétection vis-à-vis du référentiel, dont le mode de construction amène à une surreprésentation des continuités de milieux, doit donc être prise avec précaution.
Perspectives
Pour les sites de suivi de certaines espèces, des analyses supplémentaires apparaissent pertinentes : pour la Grenouille des Pyrénées, dont la reproduction est dépendante du torrent de montagne, une analyse du réseau hydrographique permettrait d’aborder certaines problématiques (les débits d’eau notamment) qui ne peuvent pas l’être par la cartographie de l’occupation du sol.
L’utilisation de la base de données agricole a été bornée à l’apport d’une confirmation pour les espaces de cultures diverses et une précision pour les espaces de prairies. Au sein de la classe cultures diverses, les cultures d’été et d’hiver pourraient par exemple être précisées, s’il y avait un lien possible avec la phénologie des espèces étudiées. La pertinence, vis-à-vis de l’objectif final de la thèse, à savoir la modélisation de la répartition des espèces sentinelle, d’introduire cette dimension dynamique selon un rythme saisonnier, pourrait être explorée.
Par ailleurs, certains types de végétation ne sont pas identifiés précisément avec la méthode décrite. Or, leur lien avec les espèces sentinelles rend nécessaire leur localisation précise. Il apparait pertinent, par exemple, pour le lépidoptère Azuré des mouillères, de rendre compte de la présence de sa plante-hôte, la Gentiane pneumonanthe, puisqu’il en dépend directement. L’ajout d’une image rendant compte d’observation de présence de certaines espèces floristiques semblerait intéressant et permettrait de préciser, par exemple, l’occupation du sol « pelouse » (données récoltées et centralisées par l’OBV).
Enfin, outre ces précisions qui pourraient être apportées, le protocole développé ne semble pas pertinent pour traiter les sites du milieu montagnard. En effet, la pratique de la télédétection en montagne est rendue compliquée par les fortes pentes, qui créent entre autres un problème d’ombres portées rendant les signaux plus difficiles à saisir. Par ailleurs, les milieux sont globalement moins fragmentés, ils semblent plus homogènes. La présence de neige en mars empêche également la comparaison des caractéristiques aux deux dates pour identifier les types de végétation. Le protocole devra donc être adapté en se basant principalement sur un travail du MNT, tirant parti de l’exposition, de la pente, de l’énergie potentielle, de l’altitude, pour y associer les différents types d’occupation du sol en fonction de l’étagement de la végétation .
Une fois le protocole établi pour les cinq types de milieu, il pourra être appliqué à l’ensemble des sites de suivi. Les données d’occupation du sol permettront le calcul d’indices paysagers, intégrables au modèle de répartition des espèces sentinelles. Ces indices serviront également à qualifier, voire hiérarchiser, les sites de suivi en fonction de leurs caractéristiques.
Si certains indices viendront caractériser les sites de suivi par des statistiques globales (c’est-à-dire pour l’ensemble de la superficie de 4 km² définie au début du protocole), des indices paysagers, attribués à chaque pixel, pourront constituer la base du modèle de répartition des espèces sentinelles, sous la forme d’un automate cellulaire, auquel il s’agirait d’ajouter des agents, les espèces sentinelles, pour en faire un système multi-agents. Cet outil de modélisation permet « de formaliser des relations entre processus écologiques et processus sociaux et économiques intégrés par la géographie » . Les données issues de ce modèle pourraient être utilisées en intrant du Species Distribution Model (SDM) permettant la modélisation prédictive globale de la répartition des espèces sentinelles sous l’effet du changement climatique (Mallard, 2017a).
Les données d’occupation du sol actuelles gagneraient à être complétées de leur état passé, la prospective nécessitant une information sur les structures du territoire, façonnées au cours du temps. Un protocole similaire devrait être mis en œuvre pour obtenir une cartographie de l’occupation du sol dans les années 2000. Un pas de temps de dix ans apparait pertinent : en écologie du paysage, le fonctionnement du paysage est défini à l’échelle décennale . Il correspond également à un temps de réponse de la faune : les réponses de la libellule aux changements sont identifiées au bout de 10 ans . Le Référentiel aquitain d’occupation du sol est d’ailleurs constitué des données de 2009 mais aussi de 2000, ce qui permettrait de mobiliser le même protocole.
Enfin, l’occupation du sol étant visible dans le paysage, elle peut constituer un socle d’échanges avec les politiques et les citoyens, dans le cadre de l’objectif de médiation scientifique. Une simulation des changements d’occupation du sol, en lien avec le changement climatique, et leurs effets sur les indices paysagers pourraient permettre une prise en main de cette notion et la base d’un débat.
Le protocole mis en place permet d’obtenir des données d’occupation du sol discontinues : chaque pixel est défini par son appartenance à une classe. Il s’agit donc d’une donnée qualitative et discrète, qui ne permet pas d’exprimer les transitions, une limite étant rarement nette dans la nature, etc. Les indices paysagers pouvant être obtenus sur cette base correspondront au modèle PMM. Les inconvénients liés à l’utilisation d’un modèle discontinu ont été évoqués. Délimiter le paysage implique une perte de connaissances potentiellement pertinentes sur les processus écologiques expliquant telle ou telle configuration paysagère. L’étude du contexte (10 ou 20 km autour du site de suivi) devra permettre d’enrichir l’analyse du paysage. L’étude multiscalaire est en effet nécessaire pour comprendre les structures spatiales.
La télédétection a permis de mener cette classification mais il serait également possible de travailler sur des données continues, avec les valeurs de réflectance notamment. Les indices paysagers pourraient être obtenus par des outils de morphologie mathématique adaptés pour travailler des données continues. Cela revient à travailler des images en niveaux de gris plutôt que des images binaires .
Les logiciels d’indices paysagers permettent de bien décrire la structure du paysage mais l’expliquent peu : ces indices sont donc « rarement [utilisés] comme facteur explicatif dans les approches écologiques » . Pour le programme sentinelles du climat, il s’agit d’utiliser ces indices, capables de révéler les processus écologiques à l’œuvre, pour expliquer la répartition et la réponse des espèces suivies au changement climatique. Cela s’inscrit dans un enjeu pour la recherche en écologie du paysage : « le passage d’une pratique visant à décrire des configurations et à chercher des corrélations à des recherches ayant pour objectif de mettre en évidence des processus afin d’expliquer des dynamiques » .
Ainsi, le programme Les sentinelles du climat semble confirmer que « les travaux sur la biodiversité participent d’une transformation de la recherche en écologie et en systématique (et plus généralement dans les sciences de la nature) » et qu’il existe des « liaisons multiples et complexes entre la construction de la biodiversité comme problème public et les mutations contemporaines du monde académique » .
1.8 Conclusion
Le travail présenté dans ce rapport s’intègre dans un projet de modélisation de la répartition spatiale de la biodiversité sous l’effet du changement climatique en Nouvelle-Aquitaine. L’objectif était de mener un travail préparatoire à cette modélisation, qui sera développée au cours de la thèse 2018-2021.
A cet objectif à long terme correspondait un objectif à court terme : la mise en place d’indices paysagers permettant de caractériser les sites de suivi. La description du contexte paysager doit permettre d’identifier des processus à l’œuvre, parallèlement aux processus du changement climatique, et qui expliquent en partie la répartition des espèces suivies dans le cadre du programme de recherche. Les indices paysagers nécessitent une connaissance préalable de l’occupation du sol.
Un état des lieux des données d’occupation du sol en Nouvelle-Aquitaine a révélé que la résolution, soit spatiale, soit thématique, des données existantes ne correspondaient pas aux besoins spécifiques du programme, qui recherche des connaissances sur des espèces dont les déplacements sont de quelques kilomètres au plus. Prenant acte de ces lacunes, un protocole a été mis en place pour obtenir une cartographie de l’occupation du sol à une résolution spatiale de 30 mètres et une résolution thématique de type Corine Land Cover niveau 4. Ce protocole hybride utilise des méthodes de télédétection et de photo-interprétation et y associe un jeu de données exogènes. Il mobilise des images satellites ainsi que des données SIG au format vectoriel, mais le travail est toujours mené en mode raster.
Les indices paysagers permettent de caractériser et de quantifier les apports des différentes résolutions. Ils n’ont pas encore été mobilisés pour leur objectif final : la hiérarchisation des sites de suivi au regard de leurs caractéristiques paysagères, pour leur pertinence à circonscrire les effets potentiels du changement climatique.
Le protocole de cartographie des sites sera complété et adapté (notamment pour le milieu montagnard) puis étendu à d’autres sites du programme de recherche. La possibilité de retravailler ces données de manière continue pourrait enrichir la compréhension du paysage des sites.
Les données d’occupation du sol ainsi que les indices paysagers intègreront le modèle global de répartition des espèces sentinelles : elles en formeront le socle, afin d’introduire dans le modèle le rôle joué par l’espace. Enfin, si l’étude présentée dans ce rapport a été menée au niveau des sites, à plusieurs résolutions, l’imbrication et l’adéquation des résolutions et échelles, entre le niveau des sites de suivi et le niveau régional, sera au cœur des questionnements de la thèse.
2 Modéliser les effets spatio-temporels du changement climatique sur les espèces sentinelles en intégrant la matrice paysagère à l'échelle régionale
2.1 Introduction
La compréhension des effets du changement climatique sur la biodiversité au niveau local est nécessaire pour la mise en place d’actions de conservation des espèces. Pour étudier l’impact du changement climatique sur les espèces faunistiques et floristiques, la modélisation informatique est fréquemment utilisée . Ces modèles visent à étudier la corrélation entre l’occurrence d’une ou plusieurs espèces (variable dite réponse) et des variables environnementales (dites explicatives ou prédictives), notamment climatiques. Nommés Species Distribution Models (SDM), Ecological Niche Models (ENM) ou Habitat Suitability Models (HSM), ils visent à projeter cartographiquement la répartition des espèces. En y intégrant les données climatiques futures, issues des scénarios proposés par le GIEC, ces modèles permettent de confronter les répartitions actuelles et possibles à l’avenir, pour comprendre les dynamiques d’évolution de l’espèce .
Ainsi, les modèles se focalisent généralement sur la corrélation entre le climat et la présence de l’espèce. Si ce choix apparait pertinent pour la compréhension à des échelons continentaux ou mondiaux, d’autres variables explicatives sont indispensables à l’étude de la répartition des espèces à des échelons plus fins. En effet, il est alors nécessaire d’intégrer des variables qualifiant l’habitat, le paysage, la végétation ou les interactions biotiques . En négligeant ces variables, notamment la connectivité paysagère, la plupart des projections basées sur des modèles de niche écologique sont limitées et ne permettent pas de lier la théorie de l’écologie et les recherches en modélisation. Bien qu’ils apparaissent fondamentaux et devraient donc être explicitement inclus dans les modèles de répartition d’espèce visant à prédire la réponse des espèces face aux changements environnementaux , la prise en compte des processus écologiques liés à la connectivité et la dispersion est assez récente dans ces recherches .
Pourtant, ces processus sont étudiés, notamment en écologie du paysage. La composition et la structure du paysage peuvent être caractérisées par des indices mathématiques, les métriques paysagères, qui sont mises en lien avec les processus écologiques à l’œuvre dans cet espace. Les indices calculés permettent d’exprimer certaines dynamiques, par exemple en renseignant sur la connectivité entre différents patchs d’habitat, ou sur leur fragmentation . Ces données sont importantes pour comprendre la capacité des espèces à se déplacer et à survivre, en lien avec le déplacement possible de leur aire de répartition sous l’effet du changement climatique . Ce type de modélisation ne vise pas la projection cartographique de la niche de l’espèce étudiée, mais en fournit toutefois elle aussi une caractérisation.
Ces deux approches peuvent être réunies : la caractérisation des habitats, souvent utilisée comme un indicateur de biodiversité, peut être utilisée comme variable(s) explicative(s) dans un SDM . Tenir compte de ces facteurs permettrait d’approcher les interrelations entre nature et société, et ainsi de dissocier les effets liés à l’anthropisation, de ceux liés au changement climatique. Cette hypothèse de recherche a été initiée en 2016 par F. Mallard (Cistude Nature) dans la mise en place de la démarche de recherche du programme les sentinelles du climat . Une méthode alors proposée est de s’appuyer sur des indices paysagers permettant de replacer les milieux étudiés dans l’espace en étudiant leur taux de dégradation et les échanges entre les systèmes voisins dans le paysage . Ensuite, la rencontre en 2017 entre Cistude Nature et l’UMR PASSAGES – CNRS (L. Couderchet) a permis de développer un projet de travaux de recherche exploratoire sur la prise en compte des éléments paysagers dans la modélisation des répartitions des espèces sentinelles du climat mené par E. Lobry . Puis ses travaux ont amené en 2018 au projet de thèse intitulé « Modéliser les effets spatio-temporels du changement climatique sur la biodiversité en Nouvelle-Aquitaine : pistes et enjeux méthodologiques » (co-encadrement : L. Couderchet UMR PASSAGES-CNRS et F. Mallard, Cistude Nature/UMR PASSAGES-CNRS).
Dans ce chapitre, l’intérêt et les enjeux méthodologiques inhérents à l’utilisation des métriques paysagères, calculées avec les méthodes de l’écologie du paysage, en tant que variables explicatives dans un SDM seront explicités. Les métriques paysagères sont fréquemment calculées à partir de cartes d’occupation du sol. Or, ces cartes sont souvent produites pour répondre à plusieurs enjeux en matière d’aménagement du territoire. Ainsi, elles ne sont souvent pas assez précises et négligent les caractéristiques écologiques, qui sont fondamentales pour la faune et la flore . Elles sont généralement réalisées au format vectoriel et proposent dès lors une visualisation discrète : les espaces sont délimités et définis par des catégories, par opposition à des cartes au format raster, réalisées par télédétection, où la donnée peut être continue, la seule limite visible étant le périmètre de la cellule . Cette discrétisation en types d’occupation du sol peut sembler inadaptée à l’objectif poursuivi. Cependant, cette problématique peut être nuancée dans le cas où l’étude porte sur une espèce spécialiste d’un habitat ainsi catégorisé . De plus, ces bases de données sont généralement disponibles en France, ce qui permet une certaine reproductibilité de la méthode proposée, et la compréhension des changements d’occupation du sol semble primordiale dans la mesure où ils agissent sur l’état de la biodiversité et a fortiori dans le contexte du changement climatique .
La prise en compte de la connectivité paysagère, en lien avec les capacités de dispersion des espèces étudiées, permettrait d’affiner les prédictions des SDM sur le déplacement de l’aire de répartition d’une espèce sous les effets combinés du changement climatique et du paysage. Cependant, l’intégration de ces facteurs nécessite une compréhension, pas encore établie dans la littérature, des liens entre les processus opérant à l’échelle du paysage et ceux constituant l’aire de répartition à des échelles plus larges .
A cette question s’ajoutent les problèmes, théoriques et méthodologiques, de l’utilisation des métriques paysagères ou de l’occupation du sol en tant que variables explicatives dans un SDM. En effet, la programmation du SDM, avec le package BIOMOD2 développé en langage R, impose l’emploi d’un lot de variables explicatives spatialisées, construites au format raster selon une projection, une emprise géographique et des résolutions spatiale et temporelle similaires . Cette contrainte interroge la pertinence d’utiliser, pour construire les données paysagères, les résolutions spatiale et temporelle des données climatiques, alors que les phénomènes ne se déroulent pas nécessairement dans les mêmes échelles d’espace et de temps. Ainsi, pour correspondre à la résolution spatiale des variables climatiques, les métriques paysagères doivent être dégradées ou reconfigurées. D’une certaine façon, des résolutions spatiales différentes peuvent ainsi être mobilisées, toutefois leur concordance et leur articulation doivent être explicitées.
Souvent, les données paysagères, dérivées de cartes d’occupation du sol, sont retravaillées soit en calculant la classe dominante au sein d’une maille, soit en mesurant la part de chaque type d’occupation du sol au sein de cette maille . Pour calculer des indices paysagers, différents logiciels ont été développés, le plus utilisé étant FRAGSTATS . Il permet de mesurer des indices a-spatiaux, qui définissent le paysage, ou une classe d’occupation du sol, dans son ensemble, mais il peut aussi, par le principe d’une fenêtre coulissante, calculer des indices spatialisés : à chaque maille de l’espace étudié correspondent ainsi des valeurs caractérisant la taille, la forme, la connectivité, etc. des mailles qui l’environnent et qui sont contenues dans la fenêtre d’étude. Avec un principe similaire, le logiciel GuidosToolBox mobilise la morphologie mathématique pour catégoriser l’espace : espace-cœur, lisière, corridor, etc. .
Des variables de structure et de composition de la végétation peuvent aussi être obtenues par le traitement d’images, notamment la télédétection : images satellite multi-capteurs, LiDAR, drone, apportent des données sur la présence de la végétation (par exemple, indice de végétation par différence normalisé NDVI) ou sa structure verticale (hauteurs de végétation) et plusieurs auteurs ont ainsi testé l’utilisation de ces données dans des SDM .
Ainsi, des variables paysagères peuvent être créées de multiples façons. Toutefois, la pertinence du modèle de répartition d’espèce et des prédictions qu’il permet dépend de la qualité des données utilisées pour le construire . De plus, la quantité de variables-prédicteurs doit être limitée et dépend du nombre d’observations de l’espèce étudiée . L’identification des variables appropriées et leur nombre doit constituer un préalable à la modélisation. Un grand nombre de variables peut améliorer la précision du modèle mais en réduire la force prédictive . Enfin, la performance du modèle est améliorée lorsque les variables sont de nature différente : ainsi, il apparait pertinent de choisir des données décrivant les structures horizontales et verticales du paysage et les caractéristiques du terrain .
L’objectif de ce chapitre est donc d’interroger la possibilité d’intégrer des variables paysagères dans le modèle de répartition de trois espèces de rainettes suivies dans le cadre du programme : Hyla arborea, Hyla molleri et Hyla meridionalis. Il s’agira d’étudier la pertinence d’utiliser des variables construites avec les méthodes d’écologie du paysage et des données d’occupation du sol disponibles dans la région en tant que prédicteurs pour le modèle de répartition régional. Cela semblerait intéressant puisque, par leur correspondance avec les échelons d’action politique, les modèles créés à l’échelon du paysage sont les plus pertinents pour jouer leur rôle d’aide à la décision en matière d’environnement .
2.2 Matériels et méthodes
Données utilisées
Les données d’occurrence des trois espèces étudiées sont issues de la base de données répertoriées par l’association Cistude Nature depuis 2004 dans le cadre notamment des Atlas des Amphibiens d’Aquitaine. Ainsi, l’aire de cette étude est l’ancienne région Aquitaine et sera étendue à l’ensemble de la Nouvelle-Aquitaine lors de l’acquisition des données pour les anciennes régions Limousin et Poitou-Charentes. Ces données prennent la forme d’un fichier vectoriel de points utilisable dans un logiciel SIG. Elles ont été exportées vers un tableur afin de correspondre au format attendu par le package BIOMOD2 .
Les données d’occupation du sol sont issues du référentiel aquitain d’occupation du sol à grande échelle (OCS-GE). Fabriquées par photo-interprétation, elles sont disponibles au format vectoriel, pour les années 2000, 2009 et 2015 pour les départements de l’ancienne région Aquitaine (en 2020, des cartes seront disponibles pour la région Nouvelle-Aquitaine pour les années 2009 et 2015). L’unité minimale cartographiée est de 10 000 m² (soit une maille de 100 m de côté) pour les territoires agricoles, forêts et milieux semi-naturels, zones humides et surfaces en eau et de 1 000 m² pour les territoires artificialisés. La résolution thématique disponible correspond au niveau 4 de la base de données CORINE Land Cover, et dont les classes sont adaptées aux types d’occupation du sol présents dans la région.
Les résultats obtenus avec cette base de données seront confrontés à ceux construits avec les données CORINE Land Cover, d’une résolution spatiale moindre (unité minimale cartographiée 25 000 m², soit une maille de 500 m de côté).
Afin d’être utilisables par la suite avec le package BIOMOD2, qui impose une même projection cartographique pour toutes les variables explicatives, toutes les données utilisées sont reprojetées selon le système Lambert II étendu (EPSG : 27572) afin de correspondre à celui des données climatiques qu’il s’agit de ne pas transformer spatialement.
Méthode de préparation des variables paysagères
Les variables paysagères explorées dans ce chapitre correspondent au type d’occupation du sol présent dans des mailles de tailles diverses. Les mailles de 8 kilomètres de côté, qui correspondent au maillage des données Météo France, ont été subdivisées selon la résolution spatiale de création des données d’occupation du sol : des mailles de 500 mètres de côté pour CORINE Land Cover (CLC) et des mailles de 100 mètres de côté pour le Référentiel aquitain d’occupation du sol à grande échelle (OCS-GE). Le schéma suivant présente une comparaison des résolutions spatiales des différents jeux de données.
L’enjeu de l’articulation des mailles de différentes résolutions spatiales : une maille Météo France contient 256 mailles de CORINE Land Cover et 6 400 mailles du Référentiel aquitain
L’objectif étant de constituer un jeu de données paysagères et de tester les possibilités d’articuler des données de plusieurs résolutions, un même protocole de préparation et d’analyses a été effectué sur les deux sources de données (CLC et OCS-GE). Il est décrit dans la figure suivante.
Protocole de préparation et d’analyse des données
Par un principe de jointure spatiale, les informations sur les types d’occupation du sol sont associées aux mailles. Cela permet d’obtenir d’une part l’information du type dominant, c’est-à-dire celui dont la surface est majoritaire au sein de chaque maille ; d’autre part la composition de chaque maille, c’est-à-dire le détail de la surface de chaque type d’occupation du sol présent. Ces informations peuvent être projetées cartographiquement, permettant une première analyse visuelle, et leurs tables attributaires analysées statistiquement. Pour que les jeux de données soient comparables, la même résolution thématique est utilisée : le niveau 3 de la nomenclature CLC.
Les jointures spatiales et calculs permettant d’obtenir les tables de forme 1 et 2 et les cartes thématiques ont été effectués avec les couches d’occupation du sol au format vectoriel par des requêtes SQL.
Script modèle de requête SQL pour l’extraction des données d’occupation du sol au sein des mailles
Le tableau suivant présente les différentes requêtes lancées selon ce modèle, en fonction des données utilisée.
Lancements des requêtes
Les données CLC étant disponibles pour l’ensemble de la région, le calcul est réalisé directement à cet échelon. En revanche, les données OCS-GE sont disponibles à l’échelon départemental. Une fusion des fichiers aurait abouti à un fichier lourd et des temps de traitements suivants plus longs, les calculs ont donc été effectués à l’échelon des départements et assemblés a posteriori. Les mailles correspondant aux limites des départements ont en revanche nécessité au préalable une fusion des données OCS-GE afin de prendre en compte l’ensemble de la maille et pas uniquement la partie située dans un département en particulier. Ainsi, pour ces mailles en limites de département, les résultats de la couche fusionnée viennent remplacer ceux des calculs par département.
Pour l’occupation du sol renseignée avec le Référentiel aquitain, certaines mailles de 8 km de côté ont une information incomplète : ainsi, lorsque les superficies des différents types d’occupation du sol au sein des mailles sont additionnées, 160 mailles ont des superficies inférieures à 63 km². Elles correspondent aux mailles en limites régionales : c’est l’effet de bord lié à la construction de la base de données. Ce nombre pourrait être réduit, pour les mailles situées à l’Ouest et correspondant à l’Océan Atlantique, en augmentant la taille des entités correspondant au type « Mers et océans » de telle sorte que la maille soit pleinement renseignée. Cela concerne une trentaine de mailles. En utilisant la base de données CORINE Land Cover, il suffit d’aller rechercher l’information avec les données concernant les régions limitrophes.
Enfin, la couche du Référentiel aquitain pour l’année 2015 possède quelques entités dont le type d’occupation du sol est inconnu et noté 99. Pour ces mailles, un travail peut être effectué en récupérant le type d’occupation du sol de l’année 2009, à condition d’observer une régularité de la présence de ce type dans les millésimes précédents. Ces mailles sont principalement situées en zone montagneuse où l’occupation du sol est plutôt stable dans le temps.
Les tables de forme 3 et les cartes choroplèthes sont issues d’un traitement « Pivot table » effectué dans le logiciel SIG (le champ « pivot » étant le code d’occupation du sol et le champ « valeur » étant la surface). Ce traitement permet d’obtenir l’information de composition interne, en regroupant les informations en une ligne par maille. Ces tables ont fait l’objet de quelques analyses statistiques, permettant d’une part d’explorer et de qualifier le jeu de données. D’autre part, elles seront reprises pour la création d’indices paysagers renseignant la composition des mailles.
Analyses statistiques
Les analyses statistiques ont été menées sur les tables de forme tab3 , pour les mailles de 8 km de côté avec les bases de données CLC et OCS-GE, et pour les mailles de 500 m de côté avec la base de données CLC. Les analyses pour les mailles de 100 m de côté avec la base de données OCS-GE portent sur des jeux de données de taille plus conséquente et sont donc encore en cours.
Matrice permettant de calculer la fréquence des mailles en fonction de leur composition pour la réalisation de l’histogramme de fréquence
L’objectif des analyses statistiques est dans un premier temps de caractériser les jeux de données, et plus particulièrement de renseigner la manière dont la composition interne des mailles est retranscrite par chaque jeu de données.
Tout d’abord, le nombre de types d’occupation du sol différents au sein d’une maille est calculé. Cela permet de rechercher ensuite le nombre, et la fréquence, des mailles en fonction de cette composition. Il faut rappeler que pour pouvoir comparer les jeux de données, la nomenclature de niveau 3 est utilisée. Le nombre possible de types d’occupation du sol au sein d’une maille varie de 1 à 30 pour les mailles de 8 km de côté. Un histogramme de fréquence est réalisé afin de déterminer la méthode de discrétisation adaptée à la distribution des données. L’amplitude étant relativement importante, le nombre de types d’occupation du sol est regroupé de 5 en 5.
Les histogrammes de fréquence suivants montrent des distributions dissymétriques;
Histogrammes de fréquence du nombre de types d’occupation du sol différents présents dans une maille. 1- Référentiel aquitain (maille 8 km) ; 2- CORINE Land Cover (maille 8 km) ; 3- CORINE Land Cover (maille 500 m)
Il y a 761 mailles de 8 km de résolution. D’après la méthode de Huntsberger, 10 classes sont donc nécessaires et d’après le coefficient de Brooks-Carruthers, le nombre de classes ne doit pas dépasser 14. Pour la discrétisation, la méthode des moyennes emboitées sera donc utilisée. Les bornes correspondront à la moyenne et aux moyennes de second et de troisième ordre, puisqu’un quatrième ordre aboutirait à un nombre trop élevé de classes (16).
Ces calculs sont répétés en prenant en compte le type d’occupation du sol dominant de la maille. Celui-ci est rapporté à son appartenance au niveau 1 de la nomenclature (1 : territoires artificialisés, 2 : territoires agricoles, 3 : forêts et milieux semi-naturels, 4 : zones humides, 5 : surfaces en eau). Ainsi, plusieurs colonnes sont ajoutées au modèle du tableau des fréquences décrit précédemment (voir tableau suivant). L’objectif est d’observer si les mailles les plus hétérogènes sont liées à un type d’occupation du sol dominant.
Exemple du tableau permettant de calculer la fréquence des mailles en fonction de leur composition et du type d’occupation dominant
Enfin, la proportion occupée par le poste dominant au sein de la maille est calculée. L’histogramme de fréquence suivant montre une distribution dissymétrique avec deux modes pour les mailles OCS-GE et une simple distribution dissymétrique pour les mailles CLC. Afin de correspondre au premier cas, et pour permettre la comparaison des deux sources de données, cette variable est discrétisée selon la méthode des déciles.
Histogrammes de fréquence de la proportion occupée par le poste dominant au sein de la maille
Les résultats de ces analyses statistiques servent ensuite à une projection cartographique, qui permet d’autres analyses et notamment une mise en relation avec les points de présence des espèces étudiées.
Analyses cartographiques
Plusieurs séries de cartes ont été réalisées : des cartes thématiques, qui décrivent le type d’occupation du sol dominant, et des cartes choroplèthes, qui décrivent la composition interne de la maille (Fig. 232). Ces cartes permettent la visualisation et la spatialisation des informations analysées statistiquement.
- Cartes thématiques
Les cartes thématiques renseignent sur le type d’occupation dominant, c’est-à-dire celui dont la superficie est la plus élevée. Pour la résolution spatiale de 8 km, les deux bases de données, CLC et OCS-GE, sont comparées. La résolution spatiale correspondant à la construction des bases de données (500 m pour CLC, 100 m pour OCS-GE) permet d’affiner la visualisation et d’observer immédiatement les « manques » de la résolution 8 km pour renseigner sur le paysage.
Pour être facilement comparables, le niveau 3 de la nomenclature est utilisé pour tous les jeux de données et les couleurs utilisées sont les mêmes (codes définis par CLC).
- Cartes choroplèthes
Les cartes choroplèthes permettent de décrire la composition interne des mailles de 8 km de côté. Ainsi, elles complètent et apportent un contrepoint aux cartes précédentes en précisant notamment la part de la superficie occupée par le type d’occupation dominant, ou le nombre de types d’occupation du sol différents présents dans les mailles.
- Mise en lien avec les données d’occurrence des espèces étudiées
Pour une première approche de la corrélation entre la présence des espèces étudiées et les informations analysées statistiquement et cartographiquement, une jointure spatiale est réalisée entre le fichier de points de présence et les cartes précédentes. Il s’agit de mettre en regard la présence des espèces avec les caractéristiques de leur habitat telles qu’elles ont été définies par les analyses précédentes.
2.3 Résultats
Les résultats présentés dans ce chapitre sont organisés en deux parties. D’abord, les effets de la résolution spatiale sur la caractérisation de l’occupation du sol et son lien avec la présence des espèces étudiées sont exposés (1). Ensuite, la composition des mailles et la configuration des patrons paysagers sont décrites et mises en relation avec la présence des espèces étudiées (2).
Comparaison des deux bases de données
Les cartes thématiques présentées dans la figure suivante rendent compte du type d’occupation du sol dominant, au sein de mailles de différentes résolutions spatiales.
L’occupation du sol dominante en Aquitaine au sein des mailles de 8 km de résolution selon le Référentiel aquitain (1) et CORINE Land Cover (2)
Ainsi, en Dordogne, l’habitat de type forêt de feuillus, reconnu par le Référentiel aquitain, apparait comme systèmes culturaux et parcellaires complexes dans CORINE Land Cover. En Gironde et dans les Landes, l’hétérogénéité au sein de la forêt de conifères, reconnue par le Référentiel aquitain, est classée comme des espaces forestiers et de végétation arbustive en mutation selon CORINE Land Cover.
Sur la carte construite avec le Référentiel aquitain, de grandes unités se dessinent : forêt de conifères du triangle landais, territoires agricoles dans le Lot-et-Garonne et dans la zone limitrophe des Landes et des Pyrénées-Atlantiques, forêt de feuillus en Dordogne et en Pyrénées-Atlantiques, vignobles principalement dans l’Entre-Deux-Mers girondin. Dans la carte de CORINE Land Cover, ces unités semblent « dérangées » par une hétérogénéité interne.
Par une jointure spatiale, l’information sur le type d’occupation du sol dominant dans la maille est attribuée aux points de présence des rainettes qui se trouvent dans la maille. Les cartes suivantes montrent le résultat de cette opération en fonction des bases de données utilisée.
Correspondance entre présence des espèces et types d’occupation du sol dominants selon le Référentiel aquitain (1) et CORINE Land Cover (2)
Le tableau suivant compare le rattachement des points de présence aux postes dominants des mailles de 8 km de résolution.
Comparaison de la part des points de présence d’au moins une espèce Hyla rattaché à un type d’occupation du sol dominant, selon le Référentiel aquitain et CORINE Land Cover
En effet, avec le Référentiel aquitain, la présence de ces espèces se trouve dans les forêts de conifères, dans les prairies et dans le tissu urbain continu, alors qu’elle est située dans la forêt de conifères dans une moindre mesure, dans les systèmes culturaux, dans les espaces forestiers en cours de mutation et dans le tissu urbain discontinu avec CORINE Land Cover.
Des cartes montrant le type d’occupation dominant au sein des mailles dont la résolution spatiale de rendu correspond à celle de sa construction ont été réalisées pour le département de la Gironde (sur la figure suivante, avec (1) la donnée CORINE Land Cover à 500 m de résolution et (2) le Référentiel aquitain à 100 m de résolution). La quantité d’information contenue dans ces cartes est bien plus importante : alors qu’il est constitué de 203 mailles de 8 km de résolution, le département girondin est caractérisé par 1 299 200 mailles de 100 m de résolution.
L’occupation du sol dominante en Gironde au sein des mailles de 500 m de résolution selon CORINE Land Cover 2012 (1) et des mailles de 100 m de résolution selon le Référentiel aquitain 2015 (2)
Ainsi, l’hétérogénéité qui apparaissait à la résolution 8 km dans les données CORINE Land Cover se retrouve dans la carte à 500 m de résolution : les espaces classés en forêt de conifères et ceux classés en forêt et végétation arbustive en mutation s’entremêlent.
Les tableaux suivants comparent les résultats de l’attribution du type d’occupation du sol dominant aux points de présence situés dans la maille, en fonction de la base de données et de la résolution utilisée.
Le premier présente les résultats pour les cartes créées avec CORINE Land Cover, aux résolutions 8 km et 500 m.
Comparaison de la part des points de présence d’au moins une espèce Hyla rattachés à un type d’occupation du sol dominant, d’après CORINE Land Cover, selon deux résolutions spatiales
D’après cette base de données, à 8 km de résolution, les points de présence des rainettes seraient situés dans les systèmes culturaux et parcellaires complexes et les vignobles (44.45 % des points de présence), les forêts de conifères et espaces forestiers en mutation (28.68 %) et le tissu urbain discontinu (10.35 %). Lorsque les données sont retravaillées à 500 m de résolution, la part des points de présence dans les territoires agricoles cités diminue (23.85 %), au profit d’un autre type d’occupation du sol agricole : les prairies et surfaces en herbe à usage agricole (15.84 %). La présence des rainettes dans les forêts de conifères et les espaces forestiers en mutation est confirmée (30.89 %) et complétée par une présence dans des forêts de feuillus et des forêts mélangées (8.51 %). Enfin, il faut remarquer l’apparition du poste marais intérieurs (4.30 %).
Le second tableau présente les résultats pour les cartes créées avec le Référentiel aquitain, aux résolutions 8 km et 100 m.
Comparaison de la part des points de présence d’au moins une espèce Hyla rattachés à un type d’occupation du sol dominant, d’après le Référentiel aquitain, selon deux résolutions spatiales
D’après cette base de données, les points de présence des rainettes sont situés principalement dans les prairies et autres surfaces toujours en herbe à usage agricole et dans les forêts de conifères (66.31% pour la résolution 8 km, 42.89 % pour la résolution 100 m). La diminution de la proportion des points attribués à ces deux postes d’occupation du sol entre les deux résolutions est notable. La présence des rainettes dans les territoires artificialisés varie : la carte de 8 km de résolution n’identifie que des espaces urbains continus comme poste dominant, alors que celle à 100 m de résolution différencie des espaces urbains continus, discontinus et des zones industrielles et commerciales. Au total, la présence est plus importante dans les espaces artificialisés dans la carte de 100 m de résolution que dans celle de 8 km de résolution (respectivement 18.67 % et 8.62 %).
Les figures suivantes comparent la proportion des points de présence dans l’habitat (tons foncés) et la proportion de la présence de cet habitat dans le département (tons clairs) dans les cartes réalisées avec le Référentiel aquitain.
Le tableau permet de mettre en parallèle les résultats obtenus en fonction des résolutions spatiales utilisées.
Disponibilité des types d’occupation du sol rattachés à la présence des rainettes
Le graphique permet de synthétiser ces résultats.
Proportion des points de présence des rainettes et des types d’occupation du sol associés, en Gironde, d’après le Référentiel aquitain
La proportion des points de présence des rainettes dans un type d’occupation ne correspond pas à celle de la superficie totale de ce type d’occupation du sol dans le département. Les résultats avec la carte de 100 m de résolution montrent que les prairies, marais intérieurs, landes et broussailles et plans d’eau concentrent près de 40 % des points de présence de rainettes alors que ces types d’occupation du sol représentent 13.5 % du territoire girondin. A l’inverse, les forêts de conifères et vignobles constituent presque la moitié du territoire et rassemblent un cinquième des points de présence. A la résolution de 8 km, le constat pour les prairies et les forêts de conifères restent valables. En revanche, un équilibre est visible entre la proportion de présence des rainettes et la part de la superficie du département classée en vignobles.
Après avoir comparé les effets des résolutions spatiales sur l’identification des types d’occupation du sol et sur leur relation avec les points de présence des rainettes, la seconde partie des résultats présente une première approche de l’utilisation d’indices paysagers.
Composition et configuration internes des mailles de 8 km de résolution
Les résultats présentés ici constituent une première approche pour le développement d’une méthode visant à intégrer les informations internes aux mailles de 8 km de résolution. Ces informations sont disponibles lorsque les données sont travaillées à une résolution plus fine. L’étude est effectuée à l’échelon régional et mobilise en parallèle les deux bases de données d’occupation du sol.
Le tableau suivant présente la fréquence du nombre de types d’occupation du sol différents au sein des mailles de 8 km de résolution.
Un indice de composition : les multiples types d’occupation du sol présents dans les mailles de 8 km de résolution
La donnée « nombre de postes différents » a été discrétisée selon la méthode des moyennes emboitées. Les mailles construites avec le Référentiel aquitain (OCS-GE) apparaissent plus hétérogènes que celles construites avec CORINE Land Cover (CLC) : l’amplitude du nombre de types d’occupation du sol est plus élevée (respectivement 29 et 20) et la moyenne est bien supérieure (respectivement 17.6 et 9.3). La valeur la plus proche de la moyenne du nombre de types d’occupation du sol présents dans une maille CLC est la borne de la première classe, soit la moyenne de troisième ordre inférieur, pour OCS-GE (9.3 types).
Le tableau suivant présente une analyse complémentaire en tenant compte du lien avec le grand type d’occupation du sol dominant dans la maille. Pour rappel, ce qui est nommé « grand type » correspond à l’appartenance au niveau 1 de la nomenclature (1 : territoires artificialisés, 2 : territoires agricoles, 3 : forêts et milieux semi-naturels, 4 : zones humides, 5 : surfaces en eau).
Un indice de configuration : homogénéité ou hétérogénéité mise en lien avec le type d’occupation du sol dominant dans les mailles de 8 km de résolution
Les mailles dont la surface dominante est classée en territoires artificialisés apparaissent très hétérogènes : près de 9 dixièmes de ces mailles appartiennent aux trois classes les plus élevées pour les deux bases de données, c’est-à-dire entre 19 et 30 types d’occupation différents pour les mailles construites avec le Référentiel aquitain, et entre 11 et 22 postes pour les mailles CORINE Land Cover. Les mailles dont les zones humides constituent le poste dominant sont également très hétérogènes : entre 20 et 30 types d’occupation du sol pour les mailles OCS-GE et entre 10 et 13 types d’occupation du sol pour les mailles CLC. Les mailles dont les types dominants sont des territoires agricoles, des forêts et milieux semi-naturels ou des surfaces en eau apparaissent hétérogènes mais les tendances sont moins prononcées que pour les deux grands types cités précédemment.
La figure suivante représente graphiquement ces résultats.
Configuration des mailles : nombre de postes d’occupation du sol différents au sein de la maille en fonction du grand type dominant
Les fréquences sont compilées et la ligne rouge représente la borne de classe correspondant à la moyenne. Ce graphique permet de visualiser rapidement le résultat énoncé précédemment : les mailles dont la surface dominante est occupée par un grand type d’occupation du sol « territoires artificialisés » ou « zones humides » sont les plus hétérogènes, avec un nombre de types d’occupation du sol différents supérieur à la moyenne. En reliant visuellement les classes, une différence apparait principalement, entre les deux bases de données, pour les mailles dont le grand type dominant est constitué de territoires agricoles. En effet, alors que la majorité des mailles OCS-GE apparaissent plus hétérogènes que la moyenne, il y a autant de mailles CLC dont l’hétérogénéité est supérieure à la moyenne que de mailles dont elle lui est inférieure.
Les informations présentées statistiquement ont été projetées sous forme de cartes choroplèthes. Les cartes suivantes visent à exprimer respectivement la composition et la configuration de l’occupation du sol au sein des mailles de 8 km de résolution.
La carte du Référentiel aquitain montre un effet de bord lié au manque de données pour l’ensemble des mailles en limites de région (figure suivante). Les mailles composées du plus petit nombre de types d’occupation du sol différents sont situés dans les unités relativement homogènes : le triangle landais et les Pyrénées.
Le nombre de types d’occupation présents par maille comme indice de composition (1- Référentiel aquitain ; 2- CORINE Land Cover)
Ces cartes permettent de constater que les mailles les plus homogènes se trouvent globalement dans les mêmes espaces, proportion gardée du nombre différent entre les deux bases de données. La carte du Référentiel aquitain (1) tend à montrer les espaces de transition, plus hétérogènes, entre les unités homogènes. Ce contraste est moins visible sur la carte de CORINE Land Cover.
La composition rattachée au grand type dominant comme indice de configuration (1- Référentiel aquitain ; 2- CORINE Land Cover)
L’objectif de ces analyses est de caractériser les espaces dans lesquels les rainettes sont présentes. Comme précédemment, les variables créées sont donc mises en lien avec les points de présence des trois espèces par le principe d’une jointure spatiale effectuée avec le logiciel de SIG. Le tableau suivant présente la part des points de présence en fonction de la classe renseignant le nombre de types d’occupation du sol différents présents dans la maille.
Composition des mailles dans lesquelles les rainettes sont présentes
La majorité des points de présence se situent dans des mailles composées de nombreux types d’occupation du sol : respectivement 86.29% et 73.29% des points de présence sont constitués d’un nombre supérieur à la moyenne (de 18 à 30 pour OCS-GE et de 10 à 22 pour CLC).
La configuration peut être exprimée par la proportion de surface occupée par le type d’occupation du sol dominant. Cela permet d’observer si le poste dominant est susceptible de « partager » la maille avec d’autres types d’occupation du sol. Les cartes suivantes permettent d’observer la proportion de la surface de la maille occupée par le poste dominant.
La proportion occupée par le poste dominant comme indice de l’homogénéité ou de l’hétérogénéité interne de la maille (1- Référentiel aquitain ; 2- CORINE Land Cover)
La carte du Référentiel aquitain (1) montre la présence de structures spatiales, plus que la carte de CORINE Land Cover (2). Cela permet de voir que les mailles classées en forêt de conifères sont homogènes alors que d’autres types comme les vignobles et prairies apparaissent dans des mailles plus hétérogènes.
Le tableau suivant présente la mise en lien de cette variable avec la présence des rainettes. Dans les deux bases de données, la majorité des points de présence se trouve dans les 1er et 2ème déciles, le 4ème décile et les 8 et 9ème déciles. Les 1er et 2ème déciles concentrent un tiers des points de présence.
Importance de la représentativité du poste dominant pour expliquer la présence des rainettes
2.4 Discussion
Les modèles de répartition d’espèces analysent la corrélation entre l’occurrence d’une ou plusieurs espèces et des variables climatiques. Si cette corrélation apparait pertinente aux échelons globaux ou continentaux, le climat seul ne suffit pas à expliquer la répartition des espèces aux échelons régionaux ou locaux . A ces échelons, d’autres variables explicatives sont indispensables : des informations sur l’habitat, le paysage, la végétation ou les interactions biotiques (ibid.). L’utilisation et/ou la création de ces variables nécessite au préalable des questions et choix méthodologiques, dans la mesure où l’ensemble des variables explicatives utilisées dans un SDM doivent être spatialisées, au format raster, avec une emprise géographique et des résolutions spatiales et temporelles similaires .
L’enjeu principal du travail présenté dans ce chapitre réside dans l’exploration des effets des différentes résolutions des données : celle des données d’occupation du sol, qui servent à créer des variables paysagères, avec celle des données climatiques et la possibilité de les articuler. Les premières analyses exposées montrent la possibilité d’exprimer des données paysagères créées à plus fine résolution dans des mailles de 8 km de résolution. Cette inclusion d’une résolution élevée est rendue nécessaire par le choix des espèces étudiées dans le cadre du programme de recherche : avec des capacités de déplacement limitées, leur niche écologique est réduite. Les espèces suivies sont spécialistes de certains types d’habitat, souvent de petite taille (les lagunes au sein des forêts de conifères dans les Landes par exemple).
Une réflexion sur le choix des variables paysagères constitue le second enjeu de ce travail. De nombreuses variables permettant de caractériser le paysage peuvent être calculées, notamment grâce à des méthodes et outils issus de la recherche en écologie du paysage . Toutefois, le nombre limité de variables explicatives à implémenter dans le SDM oblige à la parcimonie . Comme toutes les variables explicatives, la corrélation entre la donnée d’occurrence de l’espèce étudiée et les variables doit être validée statistiquement. Par ailleurs, il est nécessaire d’être prudent dans l’utilisation de données d’occupation du sol actuelles vis-à-vis de l’objectif prédictif de la modélisation .
Sur les enjeux liés à l’articulation des résolutions
La comparaison entre les deux bases de données d’occupation du sol disponibles en Nouvelle-Aquitaine, CORINE Land Cover (CLC) et le Référentiel aquitain d’occupation du sol à grande échelle (OCS-GE), met en exergue les différences de résultats et d’interprétations possibles, qui sont liées à la résolution spatiale de fabrication de ces données.
Avec CLC, les espaces hétérogènes sont généralement classés dans des postes plus génériques, flous et/ou hétérogènes par définition : « forêt et végétation arbustive en mutation », « systèmes culturaux parcellaires complexes », « forêts mélangées ». Cela s’explique par la taille de l’unité minimale cartographiée (25 hectares). Ainsi, des espaces de petite taille sont agglomérés en une entité nécessairement qualifiée par un titre de thème reflétant l’hétérogénéité interne de l’entité constituée.
Paradoxalement, avec OCS-GE, dont la surface d’unité minimale cartographiée est de 10 hectares, se dessinent sur la carte de grandes unités qui ressemblent notamment aux unités écopaysagères dessinées par l’Union Régionale des Conseils d’Architecture, d’Urbanisme et de l’Environnement de Nouvelle-Aquitaine (URCAUE) dans le cadre de leur dispositif Assistance Continuités Ecologiques (URCAUE Nouvelle-Aquitaine, 2018). En effet, l’identification d’entités de plus petite superficie conduit à leur « invisibilisation ». Lors de la création de la carte de 8 km de résolution, les superficies des entités sont additionnées et regroupées par classe afin de ne conserver que la classe dominante, c’est-à-dire ayant la superficie la plus élevée au sein de la maille. Ainsi, les petites entités liées aux espaces de transition disparaissent de la carte.
Le schéma suivant illustre l’effet de la résolution spatiale utilisée pour la création de la donnée « occupation du sol ».
Effet de la résolution spatiale lors de l’étape de création de la donnée « occupation du sol »
Dans cette maille, trois espaces sont différenciés par OCS-GE : l’un classé en « forêt de conifères », un autre en « landes et broussailles » et un troisième classé « forêt et végétation arbustive en mutation », qui forme la transition entre les deux premiers types identifiés. La superficie des espaces en « landes et broussailles » et en « forêt et végétation arbustive en mutation » étant faible pour eux-mêmes, la base de données CLC dessine une entité de taille plus importante et l’attribue à une classe, hétérogène par définition, « forêt et végétation arbustive en mutation ». Lorsque les superficies sont calculées afin d’attribuer le type dominant à une maille de 8 km, la superficie la plus importante pour OCS-GE est celle de la classe « forêt de conifères », mais pour CLC, c’est la classe « forêt et végétation arbustive en mutation » qui occupe le plus de surface.
Pour aller plus loin, ces effets ont été explorés à la résolution spatiale en sortie qui correspond à celle utilisée en entrée, lors de la création de la donnée « occupation du sol », plutôt qu’en recherchant immédiatement la résolution de 8 km. Ainsi, les bases de données vectorielles OCS-GE et CLC ont été comme rastérisées selon la résolution correspondant à la taille de l’unité minimale cartographiée : respectivement 100 m ( 10 ha) et 500 m ( 25 ha). Les cartes ainsi créées permettent d’observer les informations contenues dans les bases de données et qui « disparaissent » lorsqu’elles sont utilisées à la même résolution spatiale que les données climatiques.
Lorsque les données d’occupation du sol sont mises en lien avec la présence des espèces étudiées, les effets de la résolution spatiale utilisée pour la création de ces données ont des conséquences sur la perception de ce qui sera nommé « habitats » des espèces (cf. Fig. 237). Dans cette première étude, les trois espèces Hyla arborea, Hyla meridionalis et Hyla molleri ont été étudiées indifféremment, tout en sachant qu’elles n’ont pas toutes le même habitat. Les analyses sont restées générales, c’est-à-dire que les points de présence n’ont pas été différenciés en fonction des espèces, pour tester la méthode et seront effectuées pour chaque espèce par la suite.
Les résultats montrent des différences dans la perception des habitats des espèces en fonction de la base de données utilisée : aux forêts de conifères (OCS-GE) s’ajoutent des espaces forestiers en cours de mutation (CLC) ; aux prairies (OCS-GE) se substituent les systèmes culturaux complexes (CLC). Ces changements sont directement liés aux effets décrits précédemment (cf. Fig. 244). L’utilisation des données construites à la résolution d’entrée rendent visibles de nouveaux habitats tels que les « marais intérieurs » et « landes et broussailles », qui correspondent notamment à un habitat attendu pour certaines espèces qui préfèrent les milieux frais de type lagune ou lande humide. Ces types d’occupation du sol, nommés ici secondaires (par opposition au type dit dominant), et reconnus aux résolutions permises par les bases de données étudiées, semblent ainsi plus pertinents pour décrire les habitats des rainettes.
Ces premiers résultats démontrent l’importance de la question de la résolution spatiale comme un préalable. D’une part, parce que la résolution spatiale de création des données d’occupation du sol, et donc du paysage, a des conséquences sur la manière dont sont reconnues les entités qui les composent. Les métadonnées informent sur cette résolution et donc la validité de l’utilisation de la base de données. D’autre part, la résolution de travail permet, ou non, d’obtenir des informations pertinentes pour l’objectif de l’étude. En effet, la résolution spatiale peut constituer un facteur de compréhension : l’étude du degré de corrélation entre les données paysagères de diverses résolutions spatiales et l’occurrence des espèces pourra indiquer la résolution spatiale permettant de reconnaitre certains arrangements spatiaux, notamment la connectivité paysagère. Il s’agit de questionner la compatibilité entre la résolution spatiale et la question de recherche : le lien entre l’espèce étudiée et son habitat.
Dans leurs propositions pour l’étude des changements basée sur des données d’occupation du sol, Bousquet et al. (2013) mettent en œuvre une étude des transitions des types d’occupation du sol à différentes dates. En l’adaptant à l’étude des changements entre résolutions, une telle matrice de transition pourrait se révéler importante pour la compréhension des mécanismes présidant les variations observées par les analyses menées, et permettrait d’en tirer des conclusions sur les possibilités d’articulation des résolutions spatiales, voire thématiques. En effet, si dans ce chapitre, les variations entre les deux bases ont été explorées en fonction de la résolution spatiale, l’effet de la résolution thématique nécessiterait d’être étudié (un niveau supplémentaire est disponible pour le OCS-GE).
Les résolutions plus fines permettent d’obtenir l’information « perdue » lorsque seul le type d’occupation dominant dans la maille est conservé. Si cette information peut être visible à des résolutions spatiales supérieures, la possibilité d’articuler les résolutions en décrivant la composition interne et en associant cette information aux mailles de 8 km de résolution a donc été explorée.
Ces nouvelles cartes montrent que les points de présence s’expliquent non pas par le poste dominant mais par les autres types d’occupation du sol présents dans ces mailles. La présence des espèces étudiées dans des mailles de 8 km de résolution composées de nombreux types d’occupation du sol. Cela amène à identifier des habitats plutôt de petite taille, qui coexistent avec de nombreux autres habitats. Ce résultat confirme l’importance de tenir compte des informations disponibles à des résolutions spatiales fines, qui apparaissent plus pertinentes pour décrire l’habitat de ces espèces.
Perspectives : l’utilisation des données paysagères dans les SDM
Grâce à une augmentation de la disponibilité des données paysagères, plusieurs études utilisent ce type de données dans les SDM. En général, ces variables caractérisent la structure et la composition de la végétation : l’indice de végétation par différence normalisé NDVI renseigne sur sa structure horizontale, les hauteurs de végétation obtenues par LiDAR sur sa structure verticale . L’acquisition par télédétection amène à des données continues, comme peuvent l’être les données climatiques utilisées comme variables explicatives dans les SDM.
La donnée d’occupation du sol, discrète par définition, peut être utilisée pour définir de nouvelles variables continues : un degré d’adaptation de l’habitat à l’espèce étudiée (Fournier et al., 2017) ou servir à calculer des graphes paysagers, permettant de décrire la connectivité paysagère, qui seront intégrés comme variables explicatives dans le SDM .
Toutefois, certains auteurs mettent en garde contre une utilisation excessive des variables paysagères. Par leur tendance à améliorer la précision de la projection de la répartition actuelle de l’espèce étudiée, l’utilisation d’un grand nombre de variables paysagères peut réduire la généralité du modèle et sa reproductibilité. Ainsi, les variables paysagères doivent être utilisées parcimonieusement et surtout, l’objectif de leur intégration dans un SDM doit être explicité, afin de ne pas confondre la modélisation de l’aire de répartition actuelle et l’aire de répartition potentielle .
Dans le cadre du programme de recherche, il s’agit de proposer non pas une modélisation de l’aire de répartition actuelle mais d’envisager ses possibles variations en fonction du changement climatique. Ainsi, les variables paysagères devront décrire non pas les habitats actuels, mais des processus susceptibles d’influer sur la répartition aujourd’hui et à l’avenir : la connectivité, la fragmentation des milieux. La notion de paysage doit être envisagée plus largement. D’abord, parce que cette notion permet de penser les interrelations entre la société et la nature. Ensuite, parce qu’elle correspond à une échelle qui permet d’envisager une modélisation par écosystème.
2.5 Conclusion
Les analyses présentées dans ce chapitre constituent une première étape vers la constitution d’un jeu de données paysagères intégrables en tant que variables explicatives dans les SDM. L’étude a été focalisée sur les enjeux liés à la résolution spatiale des données et une première exploration des possibilités d’articuler des informations disponibles à différentes résolutions.
Dans un premier temps, il s’agissait de comparer deux bases de données d’occupation du sol construites à des résolutions spatiales différentes et d’observer la manière dont l’interprétation des habitats des espèces étudiées varie en fonction de ces résolutions.
Dans un second temps, les informations contenues dans les bases de données ont été utilisées pour préciser la composition et la configuration interne des mailles de 8 km de résolution. Cette méthode permet d’articuler les différentes résolutions : conserver les données d’occupation du sol tout en les exploitant à la même résolution que les données climatiques.
Dans ce chapitre, les données d’occupation du sol ont été simplement mises en lien avec les données d’occurrence des espèces par une jointure spatiale. Les corrélations statistiques entre la présence de l’espèce et les variables paysagères devront être testées, d’une part, pour identifier la ou les résolutions qui permettent de reconnaitre au mieux le lien entre l’espèce et son habitat, et d’autre part, pour vérifier la possibilité de leur utilisation en tant que variable explicative dans le SDM.
Si leur intégration en tant que variables explicatives dans un SDM parait complexe, les données d’occupation du sol et les indices paysagers doivent permettre d’introduire, d’une part, le rôle joué par l’espace, et d’autre part, les interactions entre la société et la Nature et les dynamiques inhérentes au socio-écosystème.
Enfin, l’enjeu de la résolution spatiale n’est pas lié uniquement à la question des données d’occupation du sol et du paysage. Dans le cadre du programme de recherche, il est également essentiel d’étudier l’articulation des données climatiques fournies par Météo France avec les données météorologiques collectées sur les sites de suivi, qui définissent l’enveloppe climatique du site (sondes à 1.10-1.30 m du sol) mais aussi le microclimat (sondes à 20 cm du sol).