1 Introduction
La modification des aires de répartition des espèces est reconnue comme l’un des effets principaux du changement climatique sur la flore . Étant donné l’ampleur de ce dernier dans la région Nouvelle Aquitaine pour les décennies à venir , des bouleversements importants de la répartition des espèces végétales pourraient survenir comme le suggèrent les travaux de Thuiller et ses collaborateurs prédisant un taux de substitution de près de 70% à l’horizon 2080 (selon le scénario RCP 8.5 de poursuite des émissions de gaz à effet de serre) de la flore.
Le territoire de Nouvelle Aquitaine est riche de nombreuses communautés végétales potentiellement sensibles aux modifications climatiques tels que celles des tourbières, des forêts à Hêtre, des pelouses sèches, des gazons amphibies, des dunes littorales ou encore des pelouses acidiphiles montagnardes . Pour chacun d’eux, les facteurs de changement et les hypothèses d’évolution sont différents. La saisonnalité des pluies plus marquée avec des étés plus longs, plus chauds et secs pourraient ainsi entrainer un assèchement des milieux humides menaçant les tourbières ou les gazons amphibies . Sur les coteaux calcaires, la hausse des températures favoriserait les espèces d’affinités méditerranéennes et les cortèges d’annuelles au profit des vivaces . Les forêts à Hêtre pourraient dépérir rapidement , notamment sous l’effet d’une aridité accrue . Les dunes littorales, soumises aux impacts mécaniques (érosion) et physiques (réchauffement, sécheresse) du changement climatique, connaitraient d’importants bouleversements en termes de flore et d’habitats avec la progression d’espèces thermophiles et la troncature de séquence dunaire . Enfin, des modifications de régime des pluies avec une baisse d’humidité atmosphérique, associées à des retombées d’azote liée au réchauffement, impacteraient fortement les cortèges de pelouses acidiphiles en particulier montagnardes . Dans tous les cas, un processus de remplacement d’espèces devrait s’effectuer avec des gains et pertes, aussi bien à une échelle locale que globale .
Les réponses spatiales de la flore face aux évolutions du climat, à savoir la persistance, la migration, l’extension et la régression, sont utilisées ici pour définir un indice de sensibilité climatique. En effet, la tendance et l’amplitude d’évolution de l’aire de répartition des espèces (c’est-à-dire l’évolution chorologique) apportent des informations d’intérêt pour appréhender leur vulnérabilité ou leur stabilité. L’utilisation de SDM (Species Distribution Model) a donc été choisie pour répondre à cet objectif, en se basant sur les données floristiques recensées dans l’Observatoire de la Biodiversité Végétale de Nouvelle Aquitaine .
Dans un premier temps, les étapes de calibration des modèles (sélection des variables environnementales adéquates, préparation des données floristiques, choix et paramétrages des modèles) ont permis d’établir des niches écologiques et cartes de présence potentielle actuelle d’espèces les plus pertinentes possibles . Bien que ces aspects puissent encore être améliorés, les étapes de projection de la répartition potentielle future des espèces ont pu être menées et sont détaillées dans le présent rapport. La comparaison entre la répartition théorique actuelle et la répartition future des espèces selon différents horizons permet ainsi d’appréhender l’évolution chorologique de la flore. Les sorties des modèles (contribution des variables, courbes de réponses) fournissent des éléments pour l’interprétation de ces évolutions pour chaque espèce afin de juger de leur pertinence.
Afin de discuter des prédictions ainsi générées, un lot d’espèces représentatives des milieux suivis dans le cadre du programme « les Sentinelles du climat » a fait l’objet des traitements. En parallèle, l’exercice a été appliqué aux végétations forestières à Hêtre de la région pour tenter d’appréhender les évolutions d’aire de répartition à l’échelle des communautés végétales.
2 Méthodologie d'analyse des données de suivi : évolution des communautés végétales
La méthodologie de traitement des suivis de communautés végétales sera testée et appliquée sur les données issues des dispositifs de pelouses calcicoles. Le choix de cet indicateur repose sur le fait que :
1- le réseau de suivi est relativement important à l’échelle régionale (285 dispositifs au total),
2- de nombreux dispositifs bénéficient de 2 voire 3 lectures réalisées entre 2011 et 2019,
3- les protocoles d’observations utilisés sont homogènes, évitant ainsi une étape de transformation des données.
Il s’agit donc d’une base de données relativement opérationnelle tant sur le plan du développement méthodologique que sur le plan des résultats d’analyses diachroniques.
2.1 Réseau de suivi
Le réseau de suivi des communautés végétales de pelouses calcicoles est le plus étendu de Nouvelle-Aquitaine ; il se compose de 285 dispositifs permanents repartis sur toute la région, avec une plus forte concentration dans les départements de Charente et de Dordogne. Cela étant dû à la plus grande densité de pelouses au sein de ces derniers :
Fig. 8. Carte du réseau de suivis des pelouses calcicoles en Nouvelle-Aquitaine
Les dispositifs de suivi mis en place sur les pelouses sont, en grande majorité (276 sur 285), des quadrats de fréquence dans lesquels la composition floristique, la structure et la fréquence de chaque espèce sont notées. Ces quadrats de fréquence suivaient initialement 2 formats différents en fonction des ex-régions : 16 m² (avec fréquence estimée à partir de 16 quadrats élémentaires) en Aquitaine et 9 m² (avec fréquence estimée à partir de 9 quadrats élémentaires) en Poitou-Charentes. En amont des suivis effectués en 2019, une harmonisation méthodologique a été menée avec le CBN Massif Central et le CBN des Pyrénées et Midi-Pyrénées pour aboutir à un unique protocole tout en gardant des données comparables aux niveaux spatial et temporel ente l’ancien et le nouveau format de quadrat . Ainsi, l’ensemble des données utilisées pour les analyses se base sur des quadrats de fréquence de 9 m².
2.2 Données floristiques issues des suivis
La base de données générale des suivis de pelouses calcicoles comporte 357 lectures parmi 276 quadrats de fréquence, réalisées en 2011, 2012, 2013, 2017, 2018 et 2019. Le nombre total de taxons recensés, en tenant compte des plantes indéterminées, s’élève à 610.
A partir des observations floristiques réalisées, la fréquence de chaque taxon est calculée pour chaque dispositif et exprimée en pourcentage selon la formule suivante :
Où Nb pres = nombre de quadrats élémentaires où le taxon est présent (valeur de 1 à 9)
Nb tot = nombre total de quadrats élémentaires (9 par défaut)
Concernant les taxons considérés comme rares au sein du quadrat de fréquence car observés seulement en dehors des quadrats élémentaires, une valeur de 0,5 leur est attribuée de façon arbitraire (soit une fréquence de 6%).
Sur les 276 quadrats existants, 72 ont été lus 2 fois dont 9 lus 3 fois. Seuls ces dispositifs ayant bénéficié de plusieurs lectures seront utilisés pour la partie analytique.
Afin d’harmoniser les données floristiques en vue des analyses, les biais possibles de détermination sont limités en agrégeant certains taxons complexes en groupes (ex : Galium pumilum et Galium timeroyi transformés en Galium gr. pumilum) et en utilisant le rang d’espèce comme rang taxonomique le plus fin (ex : Poa pratensis subsp. pratensis et Poa pratensis subsp. angustifolia transformés en Poa pratensis). Par ailleurs, les individus non-identifiés ou déterminés seulement au rang « genre » ou « famille » sont écartés de la phase d’analyse, excepté pour des taxons complexes déterminés usuellement au genre (ex : Rubus, Taraxacum). Cela se justifie par les informations, peu interprétables écologiquement et négligeables par rapport à leur occurrence, qu’apportent ces données. Enfin, les taxons de faibles occurrences sont également écartés car ne pouvant être interprétés avec fiabilité. Les seuils étant établis arbitrairement en fonction de l’homogénéité des données , seuls sont retirés les taxons « accidentels » retrouvés au sein d’une unique lecture. Le but de ces étapes est d’obtenir un jeu de données floristiques fournissant des informations écologiques substantielles avec un minimum de variables (ici de taxons) pour garder la part de variance expliquée la plus élevée possible.
In fine, le jeu de données utilisé pour les traitements statistiques est constitué de 153 lectures de quadrats et de 257 taxons.
2.3 Indices écologiques
En raison de l’indisponibilité des variables environnementales mesurées sur les sites de suivis (notamment des données de stations météo) dans le temps imparti, des indices écologiques synthétiques sont déterminés à partir des données floristiques et pourront servir à l’interprétation des dimensions d’analyses multivariées et de changements entre lectures.
Ce travail reprend les valeurs indicatrices des plantes vasculaires pour 9 paramètres (luminosité, température, continentalité, humidité atmosphérique et édaphique, acidité du sol, trophie du sol, texture du sol et richesse en matière organique) issus du catalogue Baseflor (Julve, 2018). Des valeurs indicatrices n’étant pas renseignées pour certaines espèces, comprenant essentiellement des thérophytes méditerranéens, elles sont déterminées à dire d’expert en croisant diverses sources informatives sur leur autécologie et leur répartition . Cette base de données intègre également différentes variables qualitatives d’intérêt telles que la chorologie et le type biologique des espèces. Ces dernières ont fait l’objet d’une simplification par agrégation de catégories pour augmenter la part explicative de ces variables.
Les valeurs moyennes des différents paramètres sont calculées pour chaque lecture de dispositif en pondérant par la fréquence de chaque espèce présente. De même, pour chaque lecture, le nombre d’espèces pour les différents types chorologiques et biologiques sont mentionnés. Les spectres chorologiques, des types biologiques et les divers indices ainsi déterminés peuvent alors être comparés entre dispositifs et entre plusieurs lectures d’un même dispositif ; informant sur la stabilité ou la dynamique de la communauté végétale suivie . Au total, 50 variables disponibles pour chaque lecture de quadrat sont incorporées au jeu de données.
2.4 Analyses statistiques
L’ensemble des traitements statistiques détaillés ci-après sont effectués avec le logiciel R (R core team, 2019, v3.6.1) et différents packages qui lui sont attachés. La première étape consiste en l’exploration des données aussi bien floristiques qu’écologiques, pour caractériser de façon synthétique le jeu de données. La typologie des dispositifs est directement en lien avec la démarche d’analyse diachronique qui suit, car permettant d’affiner l’interprétation des évolutions mises en évidence au sein d’entités plus cohérentes et homogènes écologiquement et floristiquement.
– Approche exploratoire
Tout d’abord, des tests de corrélation (test de Spearman) sur les indices écologiques issus de Baseflor sont réalisés, en utilisant les packages « corrplot » et « psych », pour identifier des liens particuliers entre ces variables explicatives. Cette démarche sert notamment à faciliter l’interprétation écologique et floristique des analyses mentionnées ci-après. Dans ce cadre, les variables de traits de vie des espèces (chorologie et types biologiques) ont fait l’objet d’un second niveau de simplification pour améliorer la lisibilité des relations existantes.
Une description synthétique du jeu de données, à partir des observations floristiques et des indices écologiques, est menée à travers des analyses multivariées. Celles-ci permettent notamment de relier des variables ou individus entre eux selon qu’ils sont considérés comme proches, opposés ou sans lien. Une propriété intéressante de ce type d’analyses est de réduire le nombre de dimensions nécessaires à la compréhension des relations entre les individus, sans pour autant altérer la richesse de l’information de départ.
Considérant la nature des données, une ordination effectuée par analyses en composantes principales (ACP) est privilégiée dans un premier temps. Ce type d’analyses est en effet adapté pour décrire et co-interpréter des données de nature quantitative, soit dans ce cas les fréquences d’espèces et les valeurs numériques d’indices . Toutefois, l’hétérogénéité des sites d’étude et donc des observations floristiques entre dispositifs conduit à la présence de nombreux « zéros » dans le jeu de données liés à l’absence des espèces. Cette information de l’absence conjointe d’espèces au sein d’un lot de dispositifs est prise en compte pour regrouper ces dispositifs lors d’une ordination par ACP ; or cette proximité ne signifie pas forcément une affinité écologique ou une similarité de cortège floristique. Pour éviter ce problème et accorder davantage d’importance aux présences qu’aux absences d’espèces dans le traitement des données, une ordination par analyses factorielles des correspondances (AFC) est finalement retenue . L’interprétation écologique des dimensions de l’AFC est effectuée en se basant sur les positions des espèces et groupes d’espèces sur la carte factorielle et sur la signification écologique des regroupements. L’analogie avec les résultats d’ACP permettant d’afficher des facteurs explicatifs (ici indices Baseflor et coordonnées géographiques des quadrats) sur ses dimensions est également utilisée pour appuyer les interprétations. Ces analyses multivariées sont menées avec les packages « FactoMineR » et « ade4 ».
– Approche typologique
Une typologie des dispositifs de suivi permet de caractériser plus finement le jeu de données grâce à des unités plus cohérentes en termes de biotopes, de cortèges floristiques et de traits de vie des espèces . Cette étape doit également faciliter l’interprétation des changements observés à travers l’approche diachronique ; ceux-ci ayant potentiellement des causes différentes pour chaque sous-ensemble. L’ordination et le regroupement des dispositifs affines est réalisé en couplant une AFC et une classification ascendante hiérarchique (CAH) sur composantes principales, basée sur les distances euclidiennes calculées selon la méthode de Ward, que permet la fonction « HCPC » du package « FactoMineR ». Cette méthode est la plus couramment utilisée pour la typologie de communautés végétales, elle consiste à regrouper les objets de façon à minimiser l’inertie intra-classe tout en maximisant l’inertie inter-classes .
La classification automatique ainsi produite est affinée par un tri semi-automatique et manuel avec le logiciel JUICE (Tichỳ, 2002) et l’algorithme de classification TWINSPAN. L’objectif étant de définir des groupes ayant la plus grande cohérence écologique et floristique.
– Approche diachronique
La comparaison des résultats issus de différentes années de lecture peut s’effectuer de plusieurs manières, chacune apportant des informations complémentaires.
La première consiste à comparer les moyennes des indices écologiques obtenues entre 2 lectures de dispositifs à partir d’un test paramétrique de Student apparié . Ce test est réalisé dans le cas où les différences entre échantillons suivent une loi normale ; si ces conditions ne sont pas respectées, la comparaison s’opère via son équivalent non-paramétrique : le test de Wilcoxon apparié. Les résultats permettent de voir si les modifications floristiques sont significatives ainsi que d’interpréter les tendances d’évolution générale et leur importance.
La seconde se repose sur l’ordination des dispositifs de suivi générée par analyse multivariée. La comparaison des positions de chaque dispositif et des barycentres des groupes de dispositifs sur les axes factoriels entre 2 lectures s’effectue également à travers un test de Wilcoxon apparié . Cela permet de quantifier le décalage éventuel, évaluer sa significativité et visualiser sa direction. Cela sert alors à tirer de premières conclusions sur les changements par rapport à l’interprétation des axes factoriels.
Enfin, une hiérarchisation des taxons en fonction de leur régression, progression, apparition ou disparition entre les lectures assure une mise en évidence plus factuelle des modifications de cortèges. Cette opération s’effectue en calculant la différence entre, d’une part, la fréquence moyenne du taxon lors de la première lecture et sa fréquence moyenne en seconde lecture ; et d’autre part de son occurrence entre les 2 lectures.
3 Modélisation des répartitions potentielles d'espèces et de communautés végétales
3.1 Objectifs de la modélisation
Les modèles spatiaux nous permettent d’effectuer des comparaisons entre les répartitions potentielles des espèces obtenues compte-tenu des conditions actuelles des milieux et celles prédites pour des périodes situées dans un futur plus ou moins éloigné. De ces comparaisons, des conclusions peuvent être tirées quant à la dynamique démographique des plantes en fonction du changement climatique. Les espèces qui seront identifiées comme les plus sensibles à ces modifications de leur environnement pourront alors être considérées comme des espèces « sentinelles du climat ».
3.2 Rassembler et mettre en forme les données floristiques
– Données sources
L’Observatoire de la biodiversité végétale (OBV) de Nouvelle-Aquitaine est la source exclusive des données floristiques utilisées dans cette étude. Compte-tenu de l’état de la connaissance pour les différents groupes taxonomiques, seule la flore vasculaire (Trachéophytes) est analysée. Elle comprend les Spermatophytes d’une part (plantes à fleurs) et les Ptéridophytes d’autre part (fougères et plantes affines). Au total, près de 4,5 millions de données d’observation sont recensées pour ces taxons sur l’ensemble de la région Nouvelle-Aquitaine. Ces observations correspondent à des présences avérées de plantes, géographiquement localisées, précisément datées et associées à un observateur identifié.
– Résolution
La résolution des données sources dépend de la stratégie d’inventaire employée sur le terrain. En l’occurrence, les inventaires systématiques de la flore de Nouvelle-Aquitaine sont menés à l’échelle de la maille de 5 km², avec le souci de réaliser des prospections dans un maximum des mailles de 1 km² qu’elle contient. Ainsi, l’exhaustivité floristique est recherchée à la maille 5 km². A la maille 1 km², les botanistes ne relèvent parfois que les taxons qui n’ont pas déjà été observés précédemment, les taxons rares et patrimoniaux, ceux de milieux d’intérêt floristique particulier. De plus, les espèces rencontrées peuvent varier fortement selon la saison. Il n’est donc pas possible d’obtenir une image exacte de la répartition régionale de ces espèces à partir des cartes de répartition des taxons à la résolution d’1 km². Pour modéliser la répartition potentielle des taxons, c’est tout de même cette résolution qui a été retenue car un compromis a dû être trouvé entre données floristiques et données environnementales disponibles (Annexe 4). Parmi les nombreux jeux de données environnementales réunis pour cette étude, certaines des variables (45% du total) présentent des résolutions bien inférieures au kilomètre carré et ont fait l’objet d’un upscaling (dégradation de la résolution) pour redescendre à ce niveau de représentation. A l’inverse, les données climatiques (35% du total) issues du modèle SAFRAN-ISBA de Météo France ont subi un downscaling (augmentation de la résolution) pour arriver à l’échelle du kilomètre carré.
– Filtres appliqués
De nombreux filtres ont été appliqués pour mieux cibler les informations pertinentes au sein de ce jeu de données. Ceux-ci sont de 3 types principaux : temporels, géographiques et taxonomiques.
Tout d’abord, seules les données récentes, c’est-à-dire celles récoltées entre 1995 et 2019 ont été conservées. Ces bornes chronologiques ont été sélectionnées pour aboutir à un seuil d’ancienneté suffisamment englobant pour inclure les données de différentes ex-régions administratives, tout en excluant les données trop anciennes qui ne reflèteraient plus vraiment la réalité des répartitions actuelles des taxons. Historiquement, les inventaires floristiques ont été menés plus tôt dans certaines ex-régions, notamment en Limousin, que dans d’autres comme l’Aquitaine, ou encore le Poitou-Charentes où ceux-ci ne sont pas encore terminés.
Ensuite, seules les données localisées précisément et présentant une géométrie adéquate à l’échelle de travail (1km²) ont été conservées. Ainsi, les relevés floristiques associés à des géométries de superficie supérieure au kilomètre carré ont été exclus de l’analyse. Ceux intersectant plusieurs mailles de 1 km² ont été affectés à la maille avec le plus grand pourcentage de surface (ou linéaire) de chevauchement dès lors que ce pourcentage maximal de recouvrement atteignait au moins 30 % de la superficie du relevé. En-deçà de ce seuil, les relevés n’ont pas été conservés. Enfin, tous les relevés inclus dans des mailles 1km² qui intersectent le territoire de la Nouvelle-Aquitaine ont été utilisés. Ceci inclut donc notamment certains relevés réalisés à l’extérieur de la région mais à proximité immédiate de ses bordures, de telle façon qu’ils se retrouvent à l’intérieur d’une maille 1km² située en zone frontalière des deux régions. De cette façon, les potentiels effets de bords sont évités.
Sur le plan taxonomique, le niveau retenu pour l’instant est celui de l’espèce, suivant la nomenclature TaxRef12 . Les mentions de sous-espèces ou variétés ont donc été traitées au niveau spécifique de façon à simplifier le jeu de données et à travailler à un niveau taxonomique homogène. De plus, les analyses menées ici ne visant qu’à définir une méthodologie pour la modélisation de la répartition potentielle des plantes, seul un lot restreint d’espèces a été mis à contribution dans cette édition. Dix espèces de pelouses calcicoles ont ainsi été sélectionnées en fonction de leur fréquence dans la région (rares ou plus communes), de leur aire de répartition supposée, du caractère plutôt diffus ou aggloméré de leur répartition, de leur type biologique (arbustes, chaméphytes, hémicryptophytes, etc.).
– Biais spatiaux
Les données floristiques rassemblées au sein de l’OBV proviennent de programmes d’inventaire différents, réalisés par trois Conservatoires Botaniques Nationaux (CBN), à des périodes à des périodes plus ou moins distinctes, et parfois en utilisant des protocoles différents. De ces divergences résulte un état de la connaissance qui n’est pas homogène à l’échelle de la région Nouvelle-Aquitaine. On remarquera tout particulièrement le déficit d’informations pour trois des départements de l’ex-région Poitou-Charentes, à savoir la Charente (16), les Deux-Sèvres (79) et la Vienne (86). Ces départements n’ont pas encore fait l’objet d’un inventaire systématique. En revanche, l’inventaire systématique de l’Aquitaine étant presque terminé, cette ex-région est assez bien couverte et l’on remarque seulement quelques lots de mailles qui n’ont pas encore été parcourues, ou dont les données récoltées n’ont pas encore été intégrées à l’OBV. On peut également noter la répartition plus agglomérée des observations en Limousin, avec des zones lacunaires réparties tout autour de mailles qui, à l’inverse, sont très densément inventoriées. Ces variations dans la structuration de l’information floristique entre les anciennes régions administratives résultent de choix différents qui ont été effectués au cours des dernières décennies par chacun des CBN. Il peut en découler un effet notable sur les résultats des modèles de répartition potentielle des espèces , même si certains auteurs relativisent au contraire l’influence de ce facteur .
Nombre d’observations floristiques par maille de 1km² (Source : OBV – septembre 2019)
Outre ces biais géographiques entre zones administratives, un autre biais ne dépendant pas de l’historique des prospections va également intervenir. Il résulte plutôt d’une propriété des données spatiales : l’autocorrélation spatiale. Celle-ci suppose que deux localités proches l’une de l’autres, en l’occurrence deux mailles de 1km², présentent généralement des valeurs similaires pour les variables étudiées, ou du moins des valeurs plus proches que celles obtenues en prenant n’importe quelle autre localité au hasard à une distance suffisante de la première. Ainsi, l’un des postulats de départ des analyses statistiques, à savoir que ces valeurs sont censées être réparties dans l’ensemble des mailles indépendamment de leurs positions relatives, n’est donc pas respecté .
Dans le cas présent, il y a donc une probabilité supérieure de trouver une espèce dans une maille proche d’une autre où elle aurait déjà été observée que dans toute autre maille plus éloignée. Dans le cadre d’une modélisation de la répartition des espèces, ce phénomène en induit un autre, la distorsion des résultats par surreprésentation de certaines conditions environnementales dans le processus d’échantillonnage-apprentissage. Le risque est alors d’aboutir à une distorsion de la répartition générale des espèces qui ne sera pourtant pas relevée par les indices , tel que l’AUC (Area Under the receiver operating Curve – HANLEY & MCNEIL, 1982), couramment utilisé pour juger de la précision et de la justesse des modèles.
Illustration de différents cas de figure lors du processus d’échantillonnage systématique au sein des données de présence des espèces
Pour remédier à ces sources de biais, certains auteurs recommandent d’utiliser une méthode d’échantillonnage systématique au sein des données sources qui conduit à n’en conserver qu’une partie . On sélectionnera ainsi une quantité moindre de données de présence, de façon à la fois aléatoire et régulièrement répartie, en ne retenant qu’une seule des mailles de 1km² où la présence d’une espèce a été observée au sein d’un lot de 4. En pratique, on ne conserve que la maille de 1km² qui correspond à l’observation la plus récente de la plante dans une maille de 2km² l’englobant (Fig. 5). Si cette méthode n’élimine pas totalement les biais spatiaux, elle a néanmoins été évaluée comme étant la plus efficace pour les atténuer , et l’une des plus simples à mettre en place.
L’utilisation de cartes recensant les biais est une autre des options proposées par certains modèles, tel MaxEnt . Cependant, une étude comparative des effets de différentes méthodes de gestion des biais spatiaux semble conclure qu’un échantillonnage aléatoire et régulier est souvent préférable à ces méthodes plus complexes et répond à un panel de situations plus large . Cette méthode présente aussi l’avantage de ne pas imposer une direction particulière au modèle, direction qui pourrait elle-même s’avérer biaisée par un manque de connaissance a priori.
3.3 Rassembler et mettre en forme les données
La méthodologie de modélisation de la répartition potentielle actuelle des communautés végétales et les projections de répartition future sera testée sur les forêts à Hêtre de plaines. Elle doit pouvoir s’appuyer sur un travail de typologie relativement fine de ces communautés . Cela est envisageable à travers une connaissance suffisante de leur écologie, et particulièrement de leur déterminisme climatique et édaphique, mais également grâce à la disponibilité d’observations de présence géoréférencées de façon assez précise .
Une synthèse typologique sur les végétations à Hêtre de plaines de Nouvelle Aquitaine , entreprise dans la cadre du programme « les Sentinelles du climat », a permis d’accéder à ces informations qualitatives et quantitatives, nécessaires à des travaux de modélisation pertinents.
3.3.1 La typologie phytosociologique
La compréhension fine de l’écologie des communautés végétales et leur description repose ici sur la phytosociologie sigmatiste . En effet, celle-ci utilise la capacité des cortèges floristiques à intégrer les conditions environnementales et dynamiques des milieux . Elle s’appuie sur des méthodologies de terrain et d’analyses éprouvées, adossées à un système de classification hiérarchisée, largement partagée et susceptible d’évolution en tenant compte de l’amélioration des connaissances.
Le travail de typologie des végétations forestières à Hêtre concerne les forêts dans lesquelles cette espèce est susceptible de structurer le peuplement, seul ou en mélange avec d’autres essences (chênes pédonculée, sessile ou pubescent et Charme notamment). Au niveau géographique, l’étude est centrée sur les forêts de plaines du Bassin Aquitain, correspondant par extension aux étages planitiaire et collinéen de Nouvelle Aquitaine, d’altitude majoritairement inférieure à 500 mètres :
Carte de l’emprise géographique de l’étude des forêts à Hêtre de plaine
Les forêts montagnardes sont abordées ici de façon fragmentaire et mériteraient une étude complémentaire à part entière. Par ailleurs, les végétations forestières affines aux forêts à Hêtre, relevant du Carpinion betuli, mais dont ce dernier est exclu pour des raisons climatiques, sont également intégrées. Cela afin de mieux cerner les facteurs déterminants et d’identifier les cortèges floristiques sensibles.
Cette étude comporte 3 étapes successives :
- collecte et centralisation des relevés phytosociologiques d’intérêt sur le territoire d’étude ;
- analyses et tri des relevés permettant de distinguer des groupes homogènes sur le plan floristique et donc écologique (= syntaxons élémentaires) ;
- rattachement des syntaxons élémentaires mis en évidence à des végétations décrites par ailleurs dans un système de classification.
Au total, cette typologie se base sur un total de 1967 relevés phytosociologiques, dont 764 d’origine bibliographique et 357 inédits réalisés dans le cadre du programme, comportant 750 taxons de plantes vasculaires et 57 taxons bryophytiques.
Le système de classification utilisé est le synopsis des végétations du CBN Sud-Atlantique . Celui-ci est structuré de façon hiérarchique en partant du niveau le plus grossier de définition des végétations (= classe phytosociologique), puis du niveau intermédiaire plus précis (= alliance ou sous-alliance phytosociologique) jusqu’au niveau le plus fin (= association végétale, sous-association ou variante).
3.3.2 Les différents types de végétations à Hêtre en Nouvelle Aquitaine
Cette synthèse phytosociologique a permis de mettre en évidence la présence avérée ou potentielle d’une vingtaine d’associations forestières à Hêtre en Nouvelle Aquitaine. Celles-ci se répartissent au sein de 6 alliances définies par les conditions édaphiques (acidité, trophie et humidité du sol) et climatiques essentiellement, puis d’ordre topographique.
Ces conditions sont brièvement décrites ci-après pour chacune des alliances, associées à la mention d’espèces diagnostiques pour la région. L’alliance du Carpinion betuli, dans laquelle le Hêtre est naturellement absent, est également présentée.
– Carpino betuli – Fagion sylvaticae
Forêts planitiaires à collinéennes sur sols neutroclines à large amplitude, mésophiles pouvant tolérer un léger excédent d’eau ou ressuyage. Elles se développent sous climat frais à doux (10 à 12°C en moyenne), assez arrosé (> 800 mm/an) avec des précipitations assez régulières limitant le risque de déficit hydrique marqué. À l’étage planitiaire où le climat général est défavorable car trop aride, elles trouvent refuge dans des conditions permettant une compensation atmosphérique (exposition nord, bas de versants et vallons encaissés) et/ou édaphique (sol épais à bonne réserve utile).
Espèces diagnostiques : Fagus sylvatica, Lonicera xylosteum, Rosa arvensis, Hyacinthoides non-scripta, Anemone nemorosa, Lamium galeobdolon, Luzula sylvatica, Hypericum androsaemum, Pulmonaria affinis, Galium odoratum, Melica uniflora, Milium effusum, Arum maculatum.
– Fagion sylvaticae
Forêts montagnardes sur sols neutroclines à large amplitude, mésophiles pouvant tolérer un léger excédent d’eau ou ressuyage. Elles se développent sous climat continentalisé frais (< 10°C en moyenne), bien arrosé (> 1100 mm/an) et sans déficit hydrique.
Espèces diagnostiques : Fagus sylvatica, Abies alba, Cardamine heptaphylla, C. pentaphyllos, Daphne laureola, D. mezereum, Hordelymus europaeus, Epilobium montanum, Drymochloa altissima, Polygonatum verticillatum, Paris quadrifolia et Tractema lilio-hyacinthus.
– Cephalanthero damasonii – Fagion sylvaticae
Forêts sur sols plutôt basiques et mésoxéphiles. Elles sont essentiellement collinéennes en Nouvelle Aquitaine et se développent sous climat doux (12,5°C en moyenne) et moyennement arrosé (850-900 mm/an). Elles se retrouvent préférentiellement en contexte de versants assez abrupts en exposition nord ou de vallons encaissés, conditions permettant le maintien d’une humidité atmosphérique assez importante, favorable au Hêtre.
Espèces diagnostiques : Fagus sylvatica, Sorbus aria, Carex digitata, Neottia nidus-avis, associées au cortège des chênaies pubescentes (Quercus pubescens, Cephalanthera rubra, Brachypodium rupestre, Carex flacca, Rubia peregrina, etc.)
– Luzulo luzuloidis – Fagion sylvaticae
Forêts montagnardes sur sols acides, mésophiles pouvant tolérer un léger excédent d’eau. Elles se développent sous climat continentalisé frais (< 10°C en moyenne), bien arrosé (> 1100 mm/an) et sans déficit hydrique.
Espèces diagnostiques : Fagus sylvatica, Abies alba, Sorbus aucuparia, Prenanthes purpurea, Maianthemum bifolium, Vaccinium myrtillus, Polygonatum verticillatum, Gymnocarpium dryopteris, Lactuca muralis.
– Quercion roboris
Forêts collinéennes sur sols acides, mésophiles pouvant tolérer un léger excédent d’eau. Elles se développent sous climat plutôt frais (10 à 11°C en moyenne), assez arrosé (> 1000 mm/an) et sans déficit hydrique.
Espèces diagnostiques : Fagus sylvatica, Quercus petraea, Q. robur, Betula pendula, Sorbus aucuparia, Ilex aquifolium, Vaccinium myrtillus, Avenella flexuosa, Digitalis purpurea, Galium saxatile.
– Quercion pyrenaicae
Forêts planitiaires à collinéennes sur sols acides, mésophiles pouvant tolérer un léger excédent d’eau ou ressuyage. Aspect clairiéré permettant le développement d’une strate herbacée assez dense. Elles se développent sous climat doux à chaud (11,5 à 13,5°C en moyenne), modérément à bien arrosé (850 à 1250 mm/an) et à déficit hydrique estival plus ou moins marqué. Les communautés structurées par le Hêtre préfèrent toutefois les secteurs assez arrosés (> 900 mm/an) et sans déficit hydrique marqué. À l’étage planitiaire, celles-ci trouvent donc refuge dans des conditions permettant une compensation atmosphérique (exposition nord, bas de versants et vallons encaissés).
Espèces diagnostiques : Quercus pyrenaica, Sorbus torminalis, Erica scoparia, Frangula alnus, Ruscus aculeatus, Asphodelus albus, Carex umbrosa, Molinia caerulea, Pseudarrhenatherum longifolium.
– Carpinion betuli
Forêts planitiaires surtout, sur sols neutroclines à large amplitude, mésophiles mais souvent ressuyés. Elles se développent sous climat doux à chaud (> 12°C en moyenne) et sec à peu arrosé (< 850 mm/an) avec une saisonnalité importante des précipitations à l’origine d’un déficit hydrique estival marqué, défavorable au Hêtre.
Espèces diagnostiques : Carpinus betulus, Ulmus minor, Sorbus domestica, Prunus spinosa, Ruscus aculeatus, Rosa gr. sempervirens, Dioscorea communis, Pulmonaria longifolia, Luzula forsteri, Arum italicum.
Pour les travaux de modélisation qui suivent, seules les alliances bénéficiant d’un nombre de relevés jugé suffisamment représentatif de leur occurrence et de leur répartition théorique seront utilisées. Celles-ci sont listées dans le tableau ci-dessous.
Alliances forestières retenues pour la modélisation
3.4 Rassembler et mettre en forme les données environnementales
3.4.1 Données sources
Pour déterminer la chorologie potentielle, présente et future, des espèces et végétations et donc estimer leur répartition spatiale théorique, il est nécessaire de disposer au préalable d’un certain nombre d’informations concernant le territoire lui-même, ses sols, sa topographie, ou encore la façon dont les réseaux hydrographiques structurent les milieux et le paysage.
Une première catégorie de descripteurs environnementaux a donc été mobilisée, sous la forme de couches d’information géographique couvrant l’ensemble de la Nouvelle Aquitaine. Cette catégorie correspond aux descripteurs qui resteront fixes entre l’actuel et les différents horizons futurs. Leur liste est présentée dans le tableau ci-dessous, ainsi que leurs sources et les métadonnées associées.
Variables environnementales
Pour compléter ces informations, une autre catégorie de descripteurs est utilisée, celle correspondant aux variables climatiques qui seront quant à elles amenées à évoluer en fonction des différents scénarios d’émission de gaz à effet de serre et horizons temporels considérés. Les données à l’origine de la création des couches d’information géographique décrivant ces variables climatiques proviennent pour la plupart directement des simulations ALADIN52 (CNRM 2014). Certaines en revanche sont le fruit d’un travail préalable de combinaison de différentes variables de départ afin d’en retirer des indices plus synthétiques, comme l’indice d’aridité de Martonne ou le quotient pluviométrique d’Emberger (Glad & Hugon com. pers.). D’autres indices, décrivant la variabilité journalière (écart-type, écart en le 10ème et le 90ème percentile), les minima et maxima, ou encore le nombre de journées consécutives pour un phénomène climatique particulier, ont également été utilisés afin de représenter l’amplitude des variations possibles pour la plupart des descripteurs climatiques (Glad & Hugon com. pers.). La liste finale des variables disponibles est détaillée dans le tableau ci-dessous.
Variables climatiques
3.4.2 Choix des variables environnementales et climatiques
– Choix des variables
Le choix de ces variables va conditionner les résultats de la modélisation et revêt donc une grande importance. De nombreuses méthodes de tri ont été proposées et testées dans la littérature . Au vu des résultats de ces études, nous opterons ici pour une méthode combinant l’analyse de la colinéarité des variables, l’évaluation via des indices de l’importance de chacune dans la modélisation, ainsi qu’un examen de la pertinence écologique de chacune pour prédire la répartition des espèces (§ 1.3.1). En effet, quand bien même une variable environnementale présenterait tous les indices mathématiques d’une influence notable sur la répartition d’une espèce, il apparait primordial de pouvoir justifier de la signification biologique des interactions entre les plantes et les variables environnementales retenues .
Dans le cadre d’une modélisation de la répartition future des espèces végétales, une autre condition sine qua none pour l’utilisation des variables environnementales est la disponibilité de cartes de ces mêmes variables pour les périodes qui feront plus tard l’objet d’une projection. Si l’on peut raisonnablement considérer que les cartes actuelles des principales caractéristiques géologiques, édaphiques et physico-chimiques en général sont relativement transposables à l’échelle de plusieurs décennies, qu’en est-il des autres ? En confrontant les cartes anciennes de l’IGN et les couches d’occupation du sol disponibles pour la période actuelle, on peut rapidement s’apercevoir des nombreux changements intervenus. Par ailleurs, il apparait difficile de préjuger de l’occupation du sol dans 50 à 80 ans, les pratiques agricoles et de gestion forestière pouvant évoluer dans le temps, tout comme les choix relatifs à l’urbanisation. Certains auteurs mettent même en doute le fait que ces informations soient réellement indispensables pour prédire la répartition des espèces à certaines échelles . Ils soulignent toutefois que, parmi les types d’occupation du sol possibles, certains apportent tout de même une information qui n’est pas corrélée aux variables bioclimatiques déjà intégrées, et donc contribuent à l’amélioration des résultats des modèles. Dans ce cadre, un travail de prise en compte des éléments paysagers dans la modélisation a été initié au sein du programme « les Sentinelles du Climat » et fera prochainement l’objet d’une thèse. Ces résultats ne sont pas encore disponibles à l’heure actuelle mais auront vocation à intégrer le corpus des éléments pris en compte dans la modélisation de la répartition des espèces végétales.
Pour les essais de modélisation réalisés dans ce chapitre, le choix est donc fait d’exclure a priori les données d’occupation du sol et de se limiter aux variables ayant trait à ses conditions physico-chimiques, au climat, à l’hydrologie et à la topographie de la Nouvelle-Aquitaine. Le climat n’est bien entendu pas considéré comme un élément stable mais pourra justement s’avérer l’élément variable de l’équation grâce aux données de projection produites par le modèle ALADIN-Climat v5.2 de Météo France . Là encore, une adéquation entre les variables utilisées pour modéliser les répartitions actuelles des plantes et celles disponibles pour le futur devra être recherchée pour permettre la comparaison des résultats.
– Homogénéisation des données
Les variables rassemblées sont disponibles à des résolutions très différentes les unes des autres, allant de pixels de 25m de coté à des mailles de 8 km². La couverture spatiale de ces couches est elle aussi très diverse, allant de l’ensemble du globe à la stricte Nouvelle-Aquitaine. Enfin, les systèmes de projection géographiques, tout comme les formats de données, sont également très différents d’une couche à l’autre. Ces données ont donc fait l’objet de nombreux traitements en vue d’homogénéiser l’emprise et la résolution des rasters qui sont par la suite utilisés pour la modélisation. La plupart de ces étapes sont réalisées via le logiciel FME de SAFE SOFTWARE qui propose une interface permettant de générer des chaînes de transformations multiples pour aboutir au résultat désiré. Il permet également de visualiser sous forme de schémas l’ensemble des processus de traitement.
Exemple d’une chaîne de traitements FME visant à passer d’un raster à la résolution comprise entre 100m et 1 km à un raster de résolution 1km
Exemple d’une chaîne de traitements FME visant à passer d’un vecteur à un raster, de résolutions et projections différentes, via un tirage de points tous les 100m
Parmi les traitements réalisés, certains visent à éviter des effets indésirables qui surviennent lors du passage d’une emprise géographique et/ou d’une résolution à l’autre. Des choix ont donc dû être effectués quant à la gestion des données manquantes, des effets de bord, des gammes de valeurs pour les variables. Une moyenne des valeurs des mailles voisines est ainsi préférée dans certains cas pour éliminer les données manquantes, tandis que dans d’autres cas, c’est l’application d’une valeur nulle pour ces mailles qui a été effectuée. Sur les pourtours de la zone d’étude, des choix différents sont également intervenus pour gérer les effets de bord. En effet, la situation n’est pas la même entre une maille chevauchant à la fois une partie du territoire de Nouvelle-Aquitaine et celui d’une région voisine, et une maille située en zone côtière dont la surface est amputée par la partie correspondant à l’océan Atlantique.
A l’issue de l’ensemble de ces traitements, on aboutit à un lot relativement important de rasters renseignant des variables environnementales variées qui correspondent bien aux grands types de prédicteurs recommandés dans la littérature .
3.4.3 Variables environnementales et climatiques sélectionnées
Pour effectuer le tri nécessaire entre les nombreuses variables environnementales disponibles, trois critères ont été retenus : la colinéarité des variables, leur influence sur les résultats des modèles et leur pertinence écologique.
Le premier de ces critères, la colinéarité des variables, va induire des biais si l’on cherche à entrainer un modèle sur une région donnée et/ou une période donnée, puis que l’on désire prédire la répartition d’une espèce pour une région différente et/ou une période différente , car la structure de colinéarité y est alors inconnue. Elle est évaluée via des tests statistiques de corrélation entre les valeurs obtenues pour chacune des mailles de 1km², par paires de variables environnementales. Les résultats de ces tests de corrélations peuvent en effet être considérés comme des approximations du degré de colinéarité entre variables .
La matrice de corrélation entre paires de variables peut être calculée en utilisant le coefficient paramétrique de Pearson si les valeurs des variables suivent une distribution s’approchant de la loi normale. Dans le cas contraire, il faudra recourir au coefficient non paramétrique de Spearman, moins puissant mais qui ne nécessite pas de satisfaire à cette condition. Lorsque la forme des distributions des valeurs n’est pas préalablement connue, il est donc conseillé d’utiliser la version non paramétrique de Spearman .
Pour visualiser l’ensemble de ces liens entre variables, la matrice des corrélations est transformée en carte de chaleur sous R via le package heatmap.plus . Afin, de mieux percevoir les groupes de variables positivement corrélées entre elles, celles-ci sont rassemblées selon une méthode de partitionnement appelée Classification Ascendante Hiérarchique (CAH) via la fonction hclust du package stats (inclus dans R). Les coefficients de corrélation font alors office de distances entre les variables et la méthode d’agrégation la plus courante, et qui est préconisée dans la littérature , est celle de Ward. Enfin, les branches du dendrogramme sont ordonnées selon la méthode de sériation OLO (Optimal Leaf Ordering) du package dendextend , dans le but de faire ressortir plus nettement les groupes de variables fortement corrélées.
Matrice des corrélations entre les variables disponibles
Les variables positivement corrélées entre elles sont regroupées par le biais d’une Classification Ascendante Hiérarchique (CAH) via la fonction hclust (incluse dans R v4.0.3). On peut ensuite procéder à la sélection d’au moins une variable par groupe ou sous-groupe, jusqu’à obtenir un lot de descripteurs environnementaux et climatiques qui présentent des taux de corrélation moindres par rapport au lot de départ (voir figure ci-dessous). Cette sélection se base alors sur les taux de corrélation entre variables mais aussi sur une évaluation à dire d’experts (K. Romeyer et R. David) de leur pertinence écologique pour décrire les affinités des plantes avec les conditions environnementales.
Matrices des corrélations entre les variables sélectionnées
Enfin, le dernier paramètre entrant en jeu dans la sélection des descripteurs est leur capacité à couvrir l’ensemble des grands types de variables qui caractérisent les milieux naturels. Ces types sont au nombre de 8, dont 5 principaux (Mod et al., 2016). Les variables sélectionnées sont ainsi triées en fonction de leur appartenance à tel ou tel type dans le tableau ci-dessous:
Variables climatiques et environnementales retenues, regroupées par grands types (selon Mod et al. 2016)
3.5 Modèles de répartition potentielle des espèces et des communautés
– Choix des modèles
Depuis une vingtaine d’années, de nombreux algorithmes d’apprentissage automatique ont été développés et leurs performances évaluées dans la littérature . Il ressort de ces études qu’aucun modèle en particulier ne fournit une réponse universelle à tous les cas de figure, ni ne dépasse clairement les performances de tous les autres . Plutôt que d’élire un unique modèle, la communauté s’est donc majoritairement tournée vers des modèles dits d’ensemble, et c’est le logiciel BIOMOD2 qui est généralement utilisé pour assembler les résultats des modèles individuels.
Pour cette étude, les résultats obtenus sont donc testés via différents grands types d’algorithmes (arbres décisionnels, réseaux neuronaux, régressions, entropie maximale, splines, etc.). Le modèle MaxEnt a particulièrement été utilisé ici car il permet de produire automatiquement la plupart des indices nécessaires à l’évaluation de la qualité des résultats et autorise ainsi des comparaisons rapides entre les différents essais de paramétrage. L’assemblage des résultats des autres modèles a ensuite été effectué via BIOMOD2 pour produire un unique modèle d’ensemble en fonction des scores de validation de chacun.
– Paramétrage des modèles
De même qu’il existe une grande variété d’algorithmes, de nombreux choix de paramétrages interviennent lors de la réalisation d’un modèle. Ces choix ont un impact significatif sur les résultats des prédictions de répartition, qu’il convient donc de prendre en compte.
L’un des paramètres qui semble jouer un rôle prépondérant dans le calcul est le choix des pseudo-absences générées lors de la phase d’apprentissage . Leur nombre semble ainsi impacter fortement les résultats. Plus précisément, il s’agît du ratio entre le nombre total de mailles dans la région d’une part et le nombre des présences avérées de la plante d’autre part qui influence les prédictions.
Plus la zone étudiée est vaste, et/ou plus la résolution est importante, plus le nombre de pseudo-absences nécessaires doit être augmenté. Pour la Nouvelle-Aquitaine à la résolution d’1 km², il est ainsi recommandé d’utiliser un seuil de 20% du nombre total de mailles (86 332), soit environ 20 000 pseudo-absences .
De même, plus le nombre de mailles de présence avérée de la plante est grand, plus le nombre de pseudo-absences venant contrebalancer le poids de ces présences devra augmenter. L’objectif de cette démarche est de fournir suffisamment de pseudo-absences relevant de conditions proches de celles des présences, de manière à bien les discriminer les unes des autres lors de la phase d’apprentissage.
A l’inverse, si la plante est rare et présente donc un faible nombre de mailles de présence avérée, la grande différence d’effectifs (20 000 pseudo-absences face à quelques dizaines de présences) engendre des biais dans les résultats du modèle . Il est ainsi proposé de rééquilibrer en diminuant le nombre de pseudo-absences ou bien en pondérant leur influence via l’utilisation d’un facteur (W). Du fait de la gamme très étendue des possibilités en la matière concernant les plantes de la région, cet aspect n’a pour l’instant fait l’objet que de tests sommaires (10 000 ou 20 000 pseudo-absences) et sera développé ultérieurement. Le nombre de pseudo-absences utilisées par la suite sera donc généralement fixé à 20 000, sans adaptation vis-à-vis de la rareté ou non de la plante.
Parallèlement au nombre des pseudo-absences, leur stratégie d’implantation peut également faire l’objet d’un paramétrage. En effet, celle-ci peut être aléatoire ou ciblée, suivant diverses règles. Il apparait, là encore, que la méthode de sélection aléatoire ressort comme la plus performante . En effet, la sélection de pseudo-absences proches des présences avérées semble conduire à une sous-estimation de la répartition des plantes, tandis qu’une sélection excluant les mailles trop proches des présences avérées ne permettra pas de cerner précisément les limites de la niche écologique et induira donc une surestimation de la répartition du taxon. En cas de non-équilibre de l’aire de répartition, c’est-à-dire lorsque la niche réalisée diffère sensiblement de la niche potentielle de l’espèce , les auteurs de cette étude comparative avancent que la sélection aléatoire des pseudo-absences présente l’avantage d’échantillonner à la fois des mailles proches des présences avérées et d’autres plus éloignées, couvrant ainsi de façon plus homogène l’ensemble du spectre des conditions environnementales qui ne correspondent pas à la répartition constatée des espèces végétales .
– Projection de la répartition potentielle future
Une fois la liste des descripteurs environnementaux et climatiques définie, des modèles de répartition potentielle des taxons peuvent être produits pour chaque période, présente ou future, ainsi que pour chaque scénario d’émission de gaz à effet de serre. Nous nous limiterons ici au scénario RCP 4.5 qui correspond au niveau d’émission intermédiaire entre les scénarios RCP 2.6 (émissions faibles) et RCP 8.5 (émissions fortes). En revanche, tous les horizons futurs (H1 : 2021-2050 ; H2 : 2041-2070 ; H3 : 2071-2100) feront l’objet de cartes de répartition estimée des taxons.
Pour produire ces cartes, c’est le modèle MaxEnt qui a été utilisé, avec une série de paramétrages déjà définis et explicités au sein du chapitre concernant les communautés végétales de plaine et de montagne dans le tome précédent des Sentinelles du Climat . Ceux-ci visent à pallier notamment le phénomène de sur-apprentissage qui conduit à une mauvaise transposabilité des résultats de projection pour le futur , ce que l’on cherche à éviter absolument ici. De même, le nombre de pseudo-absences, la méthode pour les échantillonner sur l’ensemble du territoire néo-aquitain, le ratio entre le nombre de données utilisées pour la phase d’apprentissage et celles conservées pour la phase de test, ont été établis en fonction des tests déjà effectués pour ce précédent tome des Sentinelles du Climat .
Pour prédire des répartitions estimées pour les horizons futurs, le modèle commence donc par une première phase d’apprentissage à partir des informations qui lui ont été fournies pour la période actuelle. Il s’agît d’une part des données floristiques de présences avérées telles que rassemblées au sein de l’Observatoire de la Biodiversité Végétale de Nouvelle Aquitaine, et des descripteurs environnementaux et climatiques préalablement sélectionnés d’autre part. À l’issue de cet apprentissage, le modèle a pu construire des gammes de potentialité de présence pour le taxon étudié, relatives à chacune des variables disponibles. Il a également pu tester l’importance que revêtent chacune de ces variables vis-à-vis de la répartition spatiale du taxon et comment elles peuvent ou non interagir entre elles pour favoriser ou contraindre sa répartition régionale.
La phase de projection à proprement parler peut alors commencer. Des probabilités de présence de l’espèce étudiée sont générées pour chacune des mailles de 1 km², pour la période actuelle et pour chacun des trois horizons futurs, aboutissant ainsi à quatre cartes de probabilité potentielle de la plante. Ces cartes affichent des gradients complets allant d’une probabilité de présence nulle (0) à totale (1).
Pour obtenir des cartes chorologiques présentant des limites franches d’aires de répartition, une étape de seuillage des probabilités de présence est nécessaire. La valeur seuil retenue peut être déterminée via diverses méthodes , implémentées dans le logiciel MaxEnt. Par commodité, et compte tenu du nombre d’espèces analysées ici, ces méthodes n’ont pas été employées pour le moment et une valeur seuil unique a été fixée à 0,5 pour toutes les plantes. Ce chiffre a été choisi car il correspond à la valeur que le modèle applique par défaut au « background » lors du calcul, c’est-à-dire à toute maille qui n’est pas associée à une présence avérée de l’espèce. En effet, les modèles de ce type basent leurs projections sur des présences avérées d’une part et sur des pseudo-absences d’autre part, faute d’absences avérées disponibles. La probabilité de présence dans ces mailles est alors considérée comme étant de l’ordre de 0.5, c’est-à-dire que présence et absence sont en fait équiprobables. Une fois que les cartes à gradient de probabilité complet ont été seuillées de cette façon, on aboutit à une représentation binaire (présence/absence) de la répartition de chaque espèce.
Ces cartes pour chacun des horizons futurs (H1, H2, H3) sont ensuite confrontées une à une à la carte obtenue pour la période actuelle et qui fait office de chorologie de référence. On produit ainsi trois cartes régionales de l’évolution estimée de la répartition spatiale pour chacune des espèces étudiées, à chaque fois entre la période de référence (1995-2020 pour les données botaniques) et l’un des trois horizons futurs. Les mailles pour lesquelles la probabilité de présence pour l’espèce dépasse le seuil de 0,5 à la fois pour la période actuelle et pour l’horizon futur concerné sont associées à la catégorie « maintien ». Celles pour lesquelles ce seuil n’est franchi que pour l’horizon futur sont classées dans les « apparitions », et à l’inverse, celles pour qui le seuil n’est dépassé que pour la période actuelle sont considérées comme des « disparitions ». Enfin, les mailles pour lesquelles le seuil n’est dépassé dans aucun cas sont affichées comme des « absences ».