Ecologie_analyse/exploration de données présence/absence avec R

a marqué ce sujet comme résolu.

Bonjour,

J’aimerais solliciter votre aide afin de réfléchir quant à l’exploration de mes données (représentation, exploration, analyse …). Je suis relativement à l’aise avec Excel, R et Statistica.

Il s’agit de données sur 4 ans, de janvier 2014 à décembre 2017. 97 points m’envoient (ou pas) chaque semaine des données de présence/absence d’espèces animales. J’ai donc des données binaires avec 1= espèce observée, 0= pas d’espèce observée et n/a=semaine sans observateur. Voici ci-dessous un échantillon du type de tableau que j’ai :

Image utilisateur

J’aimerais explorer au maximum mes données afin d’essayer d’identifier des patterns spatiaux (= est-ce que certaines espèces vont être regroupées dans certaines zones géographiques, avec des signatures ?) et de les présenter au mieux graphiquement.

J’aimerais trouver un moyen de mettre en évidence (et/ou représenter graphiquement) la récurrence de la présence de certaines espèces d’une semaine sur l’autre, voire plusieurs semaines à la suite et également les successions de différentes espèces au fil du temps (= de telle semaine à telle semaine nous avons l’espèce 1, suivie de l’espèce 2 etc.).

Avez-vous des idées pour m’aider à réfléchir sur le sujet ?

Merci beaucoup pour vos réponses,

Que penses tu d’utiliser un fond de carte et a chaque spot indiquer la présence des espèces repérée via un texte reprenant le nom de l’espèce ? A coté de chaque nom, tu indiquerai le nombre d’observation, et en dessous une barre temporelle sur laquelle la période d’observation la plus fréquente serait indiquée. Si une espère est observée uniquement de janvier à juin, la moitié de la barre serait colorée par exemple.

Avec R, ggplot2 et les packages de carte, ça devrait être possible de faire tout ça !

+2 -0

Ce sont des problèmes qui apparaissent sous les terminologies "capture-recapture" et "mark-resight" dans la littérature scientifique. Je n’ai malheureusement pu survoler que très rapidement ce genre de thématiques, je m’intéressais davantage à l’aspect plus théorique de l’analyse spatio-temporelle. J’ai quelques souvenirs un peu vagues et davantage liés à cette dernière. J’espère que quelqu’un saura mieux d’indiquer que moi sur ces problématiques. Un des grands noms dans l’analyse des processus ponctuels est Diggle.

La première étape consiste à voir s’il existe une réelle dépendance spatio-temporelle, qu’on ne soit pas capable d’analyser une composante sans l’autre. On emploie pour cela un test spécial.

Si la dépendance n’est pas évidente. On peut alors décomposer le problème avec une analyse beaucoup plus simple. Avec, d’une part, un point de vue spatial: Krieging, conditional autoregressive (CAR/SAR), Gibbs/Cox point processes. Et d’autre part temporel, le canonique ARIMA et études des corrélations entre les différentes séries temporelles par les fréquences.

Si la dépendance est importante, ça devient très compliqué. On retrouve du Krieging, du STARMA (spatio-temporal ARMA), CAR, VAR et un peu de Kalman. Il existe également des approches plus bayésiennes, Sampling Importance Resampling ou Integrated Nested Laplace Approximation.

Bref, c’est sans doute sortir un char d’assaut ^^. Le plus simple consiste, à mon avis, à représenter le problème avec les points en différentes couleurs et une barre pour changer la période de temps. Les relations peuvent également être intéressantes, avec notamment les "local indicator of spatial association" (LISA) qui sont une généralisation des Moran’s I. Il y a également des représentations très jolies à base d’Extended Orthogonal Functions mais c’est plus employé en météo.

+1 -0
Connectez-vous pour pouvoir poster un message.
Connexion

Pas encore membre ?

Créez un compte en une minute pour profiter pleinement de toutes les fonctionnalités de Zeste de Savoir. Ici, tout est gratuit et sans publicité.
Créer un compte