Caracterização da área de estudo
A caracterização da área de estudo, para a projeção dos modelos será baseada na área de calibração continental conhecida como região Neotropical, abrangendo a faixa de latitude e longitude 39° N –38° S; –105° W –58° W (cuja região geográfica engloba todos os países da América do Sul, América Central, incluindo a parte sul do México e da península da Baja California, o sul da Florida e todas as ilhas do Caribe). A região neotropical abriga a maioria das espécies de morcegos da chamada zona tropical (GARBINO et al., 2020), é nessa região onde há registros de distribuição de todas as 14 espécies de quirópteros reportadas com evidências sorológicas positivas para hantavírus.
A distribuição geográfica das 6 espécies de morcegos que apresentaram evidências genéticas positivas para hantavírus na região neotropical será observada através dos MNE. As regiões onde ocorreram os estudos que reportam a presença de Orthohantavirus em morcegos e que embasam este estudo, estão localizadas em dois Biomas do Brasil (Amazônia e Cerrado), e compreende os Estados de São Paulo, Minas Gerais e Mato Grosso.
Obtenção dos dados
A obtenção dos dados de ocorrência das 6 espécies de morcegos ocorreu através de bancos de dados online disponíveis nas redes GBIF - Global Biodiversity Information Facility, (www.gbif.org), Specieslink (http://splink.cria.org.br) e com auxílio da literatura científica especializada. As buscas pelas publicações literárias (artigos científicos) que citam as espécies alvo deste estudo, foram realizadas pelos sites eletrônicos usando as palavras-chave "Bats", "hantavirus infection among bats", "hantaviridae" e "Hantavirus Among Phyllostomid Bats". PubMed (https://pubmed.ncbi.nlm.nih.gov), Scopus (https://www.elsevier.com/pt-br/solutions/scopus) e Web of Science – (https://apps.webofknowledge.com), portal virtual que indexa e sumariza publicações acadêmicas a nível mundial de alta qualidade e corresponde a uma das bases de dados mais utilizadas para realizar pesquisas de literatura e levantamento de dados (CHADEGANI et al., 2013).
Tratamento dos dados
Quanto aos registros de ocorrência (dados geográficos) das espécies selecionadas, estes foram inicialmente baixados de duas bases de dados GBIF - Global Biodiversity Information Facility, (www.gbif.org) e Specieslink (http://splink.cria.org.br), através de API (Application Programming Interface), dentro do software R 4.0.5 (R CORE TEAM, 2022) em 14 setembro de 2022. Este procedimento e todos os passos seguintes foram desenvolvidos dentro do R. A busca de dados por espécie foi realizada em ambas as bases de dados citadas, sendo encontrado um total de 79.968 registros no GBIF e 14.051 registros no Specieslink. Somando as duas bases de registros obteve-se uma tabela com total de 15.506 registros de ocorrência das espécies estudadas. Com isso, após a obtenção desses dados brutos realizou-se a conferência da escrita nas tabelas dos nomes científicos de cada uma das espécies de morcegos, onde realizou-se a correção das alterações nas nomenclaturas das espécies. Em seguida, efetuou-se a exclusão dos dados duplicados/repetidos e/ou imprecisos. As etapas de limpeza de dados incluíram: (1) revisão e avaliação de possíveis erros taxonômicos no banco de dados, remoção de registros provavelmente não correspondentes ao imposto em questão; (2) remoção de ocorrências sem referências geográficas, registros com ponto “0, 0” para coordenadas geográficas e registros duplicados; (3) realocação (para o pixel mais próximo) de registros que estavam no mar, mais próximos à costa (ou seja, erros relacionados à resolução de pixels) e (4) bufferização dos registros, através da seleção de um raio mínimo para que não haja mais de um ponto dentro do mesmo raio (COBOS et al., 2018). Continuando com a triagem das informações, realizou-se o recorte das informações irrelevantes da tabela, sendo selecionados apenas os itens species, decimalLatitude e decimalLongitude. Posteriormente, a tabela contendo os dados de registro das 6 espécies de quirópteros foi recortada para um determinado período, que vai de 1970 à 24 de janeiro de 2023 (GBIF Occurrence Download https://doi.org/10.15468/dl.jmyt6b). Com isso, após esse recorte, o número de dados de ocorrências das espécies estudadas foi para 5.164 registros.
Variáveis Ambientais
Para gerar os MNE das espécies de morcegos (Phyllostomidae), serão descarregadas primeiramente 19 variáveis bioclimáticas com resolução espacial de 10 arc minutos (≈ 20 km). O conjunto das variáveis bioclimáticas apresenta-se consistente com a escala regional segundo a classificação de Pearson e Dawson (2003). Todos os procedimentos de conversão para raster estão sendo feitos no programa QGis, versão 3.18.2.
Os dados primários das camadas vêm da fonte CMIP5, obtida a partir da base Worldclim, versão 1.4, para modelar o período atual (1960-1990), disponível no site (www.worldclim.com/) (HIJMANS et al., 2017).
Posteriormente a obtenção das 19 variáveis bioclimáticas, fez-se necessário o tratamento dessas variáveis, ou seja, cortá-las para a área onde as espécies-alvo ocorrem e identificar as variáveis mais correlacionadas com cada uma das espécies de quirópteros, a fim de evitar a colinearidade (GUISAN; THUILLER 2005; DALAPICOLLA, 2016). Para levar em conta a correlação entre os preditores, o conjunto final de variáveis foi selecionado considerando o coeficiente de correlação de Pearson |r| < 0,75 (HERNANDEZ et al., 2006; LOBO et al. 2010; ANCILLOTTO et al., 2020) em cada uma das áreas de calibração, para cada espécie. Esse procedimento foi realizado no ambiente R versão 4.0.5 (R CORE TEAM, 2022). A seleção das variáveis foi determinada por meio de método heurístico (COBOS et al., 2019) avaliando todas as combinações possíveis de pelo menos três dessas variáveis. Portanto, depois de analisadas quanto a suas correlações, as variáveis bioclimáticas utilizadas para rodar os modelos serão confirmadas.
Modelos Climáticos
Para a projeção das condições climáticas atuais e futuras, serão utilizadas as mesmas variáveis bioclimáticas selecionadas após o teste de correlação. Dois cenários para emissões de gases de efeito estufa (RCP 4.5 e RCP 8.5) serão utilizados para explorar a variação em possíveis trajetórias para emissões futuras. As simulações dos cenários RCP’S 4.5 e 8.5 serão feitas para cada espécie de morcego selecionada, sendo realizadas por dois modelos de circulação global (MCG’s): CCSM4 e HADGEM2-ES. A escolha dos MGG’s se deu através do conjunto de multimodelo indicado por Sanderson et al., (2015), onde os autores realizam práticas para reduzir a interdependência dos principais MCG’s em grupos.
As projeções, serão utilizados por dois cenários conhecidos como "representative concentration pathways" (RCP’s) (MEINSHAUSEN et al., 2011). Eles são usados para derivar cenários de emissões de gases de efeito estufa com diferentes políticas climáticas. Trata-se de dois cenários de emissões diferentes e são classificados da seguinte maneira: otimista (RCP. 4.5), e um pessimista (RCP. 8.5), nomeados de acordo com a força radioativa dos GEE e outros agentes (VUUREN et al., 2011). O conjunto de variáveis bioclimáticas apresenta-se consistente com a escala regional (PEARSON; DAWSON, 2003). Todos os procedimentos de amostragem e conversão para raster serão feitos no programa QGis, versão 3.18.2.
Modelagem de Nicho Ecológico
Durante todo o processo de análise e MNE uso da linguagem de programação R versão 4.2.2 e os pacotes tidyverse, raster, kuenm, ellipsenm, spThin e plotly. Todo o código, do presente trabalho, está sendo construído de forma modularizada para melhor compreensão e reprodutibilidade, disponível em: NandodaSilva/modelagem-de-nicho (github.com). Para não haver sobrecarga no HD do computador convencional, todos os modelos serão rodados na workstation do curso de Biotecnologia da Universidade Federal de Pelotas, com acesso remoto via rede virtual privada (VPN, sigla em inglês).
Serão produzidos para cada uma das 6 espécies de quirópteros, mapas contendo a potencial distribuição atual e dois cenários futuros (2070) através de duas vias de concentração representativas (RCP 4.5 e 8.5), usando o software R aplicado os parâmetros básicos sugeridos pelo programa, com 100 replicações pelo método de Bootstrap e usando a aleatorização dos pontos de treino (random seed). Os pontos de ocorrência para cada uma das espécies de morcegos serão separados em dois conjuntos, sendo um para treino (70% dos pontos para rodar o modelo) e outro para teste (30% dos pontos para avaliar o modelo). Os MNE podem ser considerados como o ajuste a uma função entre os pontos de ocorrência de uma espécie e um conjunto multivariado de dados ambientais (PHILLIPS et al., 2006). Como em geral só estão disponíveis dados de presença, essas funções devem representar as características ambientais nos pontos de ocorrência ou o “nicho” da espécie. Para gerar os modelos de nicho ecológico, o programa baseia-se em variáveis climáticas dos locais onde houve registro. A escolha do método leva em consideração as características particulares do estudo, ou seja, a área de interesse e a extensão da área amostrada, sem necessidade de transferência de modelos sobre uma paisagem mais ampla (ELITH et al. 2000, PETERSON et al. 2007). Os modelos de distribuição geográfica potencial gerados no R serão importados e editados usando o programa QGis.
Validação dos Modelos
A qualidade dos modelos gerados será avaliada usando a métrica partial ROC (Receiver Operating Characteristics - curva característica de operação) que relaciona dois parâmetros do modelo: sensibilidade e especificidade (PETERSON et al. 2008). O cálculo da área sob a curva ROC, também conhecida como AUC (Area Under the Curve - Área sob a curva) fornece uma medida única do desempenho do modelo. O AUC varia de zero a um, no qual valores próximos a um (1) indicam alto desempenho, enquanto que valo