Nome do Projeto
Modelagem de atributos físico-hídricos de solos subtropicais usando algoritmos de aprendizado de máquina supervisionado
Ênfase
Pesquisa
Data inicial - Data final
27/03/2023 - 26/03/2027
Unidade de Origem
Coordenador Atual
Área CNPq
Engenharias
Resumo
As propriedades e funções hidráulicas do solo são essenciais para modelar e avaliar os processos do solo como armazenamento de água, transporte de solutos, infiltração, drenagem e balanço hídrico. Dentre as propriedades hidráulicas do solo pode-se citar a condutividade hidráulica saturada do solo (Ksat), que é um parâmetro essencial para a compreensão do movimento da água no solo, porém, a Ksat apresenta uma alta variabilidade espacial, com isso, sua medição no campo pode ser problemática, além de apresentar erros de medição. Assim, surgem os modelos matemáticos para estimar a Ksat a partir de parâmetros físicos do solo de baixo custo e fácil obtenção. Dentre os modelos desenvolvidos, podem-se destacar as funções de pedotransferência (FPTs), o uso de tais funções para a estimativa da Ksat é uma alternativa viável quando as medições são difíceis, caras e/ou demoradas. Como mencionado anteriormente, os insumos para as FPTs podem ser mais facilmente obtidos, porém, há recentemente um foco em novas variáveis ou novas combinações de variáveis para construção de FPTs com maior precisão. Algumas dessas novas variáveis para melhorar o desempenho das FPTs são, por exemplo, dados de espectroscopia do solo. Recentemente, métodos de aprendizado de máquina, como Redes Neurais Artificiais (RNAs), estão sendo usados com mais frequência no desenvolvimento de FPTs. As FPTs obtidas a partir das RNAs podem apresentar melhor estimativas e exatidão em relação aos métodos tradicionais, e ainda o acréscimo de dados de entrada como espectroscopia do solo podem robustecer e aumentar o desempenho de tais FPTs. No entanto, a aplicabilidade dos PTFs desenvolvidos para solos sob climas temperados e tropicais raramente tem sido avaliada para solos subtropicais. Contudo, este trabalho terá por objetivo avaliar o potencial de algoritmos de aprendizado de máquina supervisionado para estimar atributos físico-hídricos de solos subtropicais. Mais especificadamente o objetivo desse trabalho será avaliar o potencial de FPTs já desenvolvidas na literatura, assim como, desenvolver FPTs para estimar atributos físicos-hídricos do solo baseadas em algoritmos de aprendizagem de máquina (AM) para estimar atributos físicos-hídricos de solos subtropicais. Outro objetivo será avaliar o potencial de uso de dados espectrais e atributos físico-hídricos do solo medidos na bacia da Sanga Ellert (Canguçu-RS) no desenvolvimento de FPTs em escala de bacia. O desempenho das FPTs será avaliado pelas medidas estatísticas coeficiente de determinação (R2), Erro Médio (ME) e a Raiz do Erro Quadrado Médio (RMSE). A partir dos resultados espera-se que os algoritmos de aprendizado de máquina supervisionado possam ser usados para o desenvolvimento de FPTs sem perda de qualidade de informação quando comparado com os modelos de regressão múltipla. Ainda espera-se que a inclusão de dados espectrais do solo melhore o desempenho das FPTs na estimativa dos atributos físico-hídricos do solo na bacia da Sanga Ellert (Canguçu-RS).

Objetivo Geral

O projeto visa à avaliação do potencial de algoritmos de aprendizado de máquina supervisionado para estimar atributos físico-hídricos de solos subtropicais. Assim como, avaliar o potencial de uso de dados espectrais na estimativa de atributos físico-hídricos do solo no desenvolvimento de FPTs em escala de bacia.

Justificativa

O conhecimento dos atributos físico-hídricos de solos (AFHS) é uma importante ferramenta para entender a dinâmica da água e o manejo dos solos, uma vez que influenciam no fluxo superficial e no movimento da água no solo. Com isso, é possível dizer que os AFHS são de grande importância no que compete ao apoio na tomada de decisão sobre a melhor maneira de gestão dos recursos hídricos em escala de bacias hidrográficas.
Dentre os AFHS pode-se citar a condutividade hidráulica saturada do solo (Ksat), que pode ser definida pela taxa de infiltração em solos em condição de estado estacionário. A Ksat é um parâmetro essencial para a compreensão do movimento da água no solo, além disso, a mesma controla vários processos hidrológicos, como por exemplo, o escoamento superficial direto, recarga de água subterrânea, erosão do solo, perda de solo e movimento de contaminantes do solo, com isso, determinar valores bem representativos de Ksat e sua distribuição no espaço é muito importante.
Porém, vale destacar a Ksat apresenta uma alta variabilidade espacial, tanto em escala de parcelas experimentais quanto de bacia hidrográfica, com isso, sua medição no campo pode ser problemática, além de apresentar erros de medição. Assim, surgem os modelos matemáticos para estimar a Ksat a partir de parâmetros físicos do solo de baixo custo e fácil obtenção.
Dentre os modelos desenvolvidos, podem-se destacar as funções de pedotransferência (FPTs), tais FPTs são usadas para estimar atributos físico-hídricos do solo de difícil determinação (Ksat, curva de retenção de água no solo, etc) a partir de outros atributos do solo de fácil e baixo custo de determinação, como por exemplo, textura, matéria orgânica e densidade do solo (BOUMA, 1989). Vale destacar que, as FPTs vêm sendo amplamente utilizadas em diversos estudos durante as ultimas décadas, no intuito de minimizar a escassez de informações de certos parâmetros de solo em banco de dados.
Como mencionado anteriormente, os insumos para as FPTs podem ser mais facilmente obtidos, porém, além dessas variáveis como textura do solo, matéria orgânica e densidade do solo há um foco recente em novas variáveis ou novas combinações de variáveis para construção de FPTs com maior precisão. Algumas dessas novas variáveis para melhorar o desempenho das FPTs são, por exemplo, informações detalhadas de textura, vegetação, topografia e dados de espectroscopia do solo (XU, et al., 2017).
Conforme Brown et al. (2006), a espectroscopia do solo pode refletir sinteticamente as características físicas, químicas e biológicas do solo. Vale destacar ainda que, a espectroscopia do solo é sensível à composição mineral, matéria orgânica, umidade e distribuição de tamanho das partículas do solo (GMUR et al., 2012). Essas propriedades do solo mencionadas desempenham papéis importantes nas propriedades hidráulicas do solo, especialmente a matéria orgânica e a textura do solo, com isso, pode ser possível construir uma conexão indireta entre os dados de refletância espectral do solo (DRES) e a Ksat.
As FPTs são geralmente baseadas em equações de regressão, especialmente regressão linear (múltipla), porém, a regressão linear foi substituída por técnicas de regressão não linear por ser mais precisa. Recentemente, métodos de aprendizado de máquina, como Redes Neurais Artificiais (RNAs), estão sendo usados com mais frequência no desenvolvimento de FPTs. As FPTs obtidas a partir das RNAs podem apresentar melhor estimativas e exatidão em relação aos métodos tradicionais, pois as RNAs são caracterizadas como aproximadores universais de funções e possuem a capacidade de aprender e mapear qualquer função não-linear contínua, resolvendo problemas complexos (SOARES et al., 2014).
O principal problema encontrado na utilização de FPTs é que a grande maioria das mesmas serem desenvolvidas em condições específicas de outras regiões ou até mesmo países, com um grande predomínio de geração de FPTs em zonas de clima temperado em relação aos solos de clima tropical. Devido a pouca criação de FPTs em clima tropical é comum à utilização de forma generalizada das FPTs de clima temperado para estimar os atributos do solo, o que acaba, consequentemente, aumentando os erros de estimativa.
Ainda são poucas no Brasil, país com predominância de climas tropical e subtropical, as FPTs utilizadas na determinação da Ksat do solo, gerando assim a necessidade de maiores estudos no âmbito de técnicas que contribuam para obtenção de FPTs especificas para climas como esses, principalmente para o clima subtropical, manifestando os efeitos mais semelhantes à realidade dos solos no país, a partir das propriedades físico-hidráulicas. Assim, este projeto visa à avaliação do potencial de algoritmos de aprendizado de máquina supervisionado para estimar atributos físico-hídricos, como a Ksat, em solos subtropicais, possibilitando, por exemplo, a utilização de modelos hidrológicos na região visando o gerenciamento dos recursos hídricos, e assim, justificando a relevância da presente proposta de projeto de pesquisa.

Metodologia

- Área de estudo
O presente estudo será desenvolvido em diversas áreas localizadas sob clima subtropical, em especifico, na bacia hidrográfica do Arroio Pelotas - RS, bacia hidrográfica Sanga Ellert - RS, bacia hidrográfica do Arroio Fragata – RS, em uma área no município de Cerro Largo – RS, em uma área no município de Três Passos – RS e outra área no município de Umuarama – PR.

Linha de Ação 1 - Obtenção e organização dos dados de solo
Um banco de dados de solos está sendo construído a partir da junção de um grande conjunto de dados secundários obtidos das áreas mencionadas anteriormente. Os atributos do solo obtidos serão: textura (argila, silte e areia), densidade do solo; densidade de partícula, teor de carbono orgânico; teor de matéria orgânica, porosidade total, microporosidade, macroporosidade, Ksat e teores de água do solo. Após a obtenção de tais dados de solo os mesmos serão organizados em planilhas eletrônicas para que possam ser usados da melhor maneira possível nos próximos passos.

Linha de Ação 2 - Análise exploratória dos dados
Todos os conjuntos de dados serão submetidos à análise estatística clássica em que média, desvio padrão, coeficiente de variação, valores mínimo e máximo, assimetria e coeficientes de curtose vão ser calculados. A normalidade de todas as distribuições de dados também será avaliada usando o teste de Kolmogorov-Smirnov(KS) a um nível de probabilidade de 5%. A análise estatística será feita por meio da linguagem de programação Python.

Linha de Ação 3 - FPTs disponíveis na literatura: Serão selecionadas da literatura FPTs para estimar dados específicos de Ksat em cima de todo o banco de dados que será elaborado. Tais FPTs serão escolhidas com base nos seguintes critérios: 1 - De acordo com a localização de origem de suas calibrações de dados de solo; 2 - FPTs que representam condições climáticas subtropicais ou tropicais; e 3 - FPTs que foram equipadas com um grande número e variabilidade de amostras de solo. O desempenho da capacidade preditiva das PTFs examinadas será feito por meio de análises de precisão e acurácia. A precisão será associada a erros aleatórios, quantificados pelo Coeficiente de Determinação (R2). Já a avaliação da acurácia será feita por meio de erros sistemáticos levando em consideração o Erro Médio (EM) e a Raiz do Erro Quadrático Médio (RMSE).

Linha de Ação 4 - Desenvolvimento de FPTs baseados em RNAs: Atraves da utilização do banco de dados elaborado as FPTs que irão predizer o parâmetro Ksat a partir de propriedades básicas do solo serão desenvolvidas em um primeiro momento por meio de modelos de regressão múltipla no intuito de comparar com as FPTs derivadas usando RNAs (desenvolvidas em um segundo momento). Os atributos que serão usados como dados de entrada nas FPTs serão: textura (argila, silte e areia), densidade do solo, densidade de partícula, teor de carbono orgânico, micro e macroporosidade, e outros.
Primeiramente o banco de dados de solos será submetido à análise de correlação no intuito de observar as relações entre todos os atributos estudados. Além disso, essa análise vai permitir a identificação dos melhores preditores para estimar a Ksat na área estudada. O conjunto de treinamento será usado para desenvolver as PTFs através do método de regressão múltipla.
Já durante o treinamento da RNA, o conjunto de dados de treinamento original será subdividido em dois subconjuntos, um subconjunto de treinamento e um subconjunto de validação. Para obter o subconjunto de validação, será usada uma função de divisão de teste da Biblioteca Numpy, de forma que 20% do conjunto de treinamento original serão usados para validação de forma aleatória. O subconjunto de validação será usado para avaliar o modelo de treinamento e controlar o problema de sobreajuste. As avaliações das FPTs serão feitas levando em consideração os índices estatísticos, como coeficiente de determinação (R2), Erro Médio (ME) e a Raiz do Erro Quadrado Médio (RMSE).

Linha de Ação 5 - Desenvolvimento de FPTs baseados em RNAs com o uso de dados de refletância do solo: As FPTs que irão predizer o parâmetro Ksat a partir de propriedades básicas do solo serão derivadas usando RNAs, assim como no capitulo 2. Os atributos que serão usados como dados de entrada nas FPTs baseadas em RNAs também serão os mesmos citados no capitulo 2, porém, será criada também FPTs com o acréscimo de dados de refletância espectral do solo para que com isso seja possível avaliar se o referido dado melhora o desempenho das mesmas. Vale destacar que neste capitulo não será usado todo o banco de dados, somente a área correspondente a bacia hidrográfica Sanga Ellert – RS, pelo fato de somente a mesma possuir em seus banco de dados a refletância do solo nas amostras coletadas.
Seguindo a mesma ideia que vai ser utilizada no capitulo 2, durante o treinamento da RNA, o conjunto de dados de treinamento original será subdividido em dois subconjuntos, um subconjunto de treinamento e um subconjunto de validação. Para obter o subconjunto de validação, será usada uma função de divisão de teste da Biblioteca Numpy, de forma que 20% do conjunto de treinamento original fossem usados para validação de forma aleatória. O subconjunto de validação será usado para avaliar o modelo de treinamento e controlar o problema de sobreajuste.
O desempenho desses FPTs será avaliado levando em consideração índices estatísticos, como coeficiente de determinação (R2), Erro Médio (ME) e a Raiz do Erro Quadrado Médio (RMSE).

Linha de Ação 6 - Relatório Final do projeto
Organização e elaboração do relatório final do projeto.

Indicadores, Metas e Resultados

- Elaboração de um robusto banco de dados físico-hídricos de solos subtropicais;
- Avaliação do potencial de funções de pedotransferência (FPTs) já desenvolvidas na literatura para estimar atributos físicos-hídricos de solos subtropicais, em especial a Ksat;
- Desenvolver FPTs para estimar atributos físicos-hídricos do solo baseadas em algoritmos de aprendizagem de máquina nas diferentes áreas abordadas neste trabalho;
- Avaliar o potencial de uso de dados espectrais e atributos físico-hídricos do solo medidos na bacia da Sanga Ellert (Canguçu-RS) no desenvolvimento de FPTs em escala de bacia.
-Publicação de artigos em periódicos científicos da área e resumos em congressos.

Equipe do Projeto

NomeCH SemanalData inicialData final
DANIELLE DE ALMEIDA BRESSIANI6
DOUGLAS RODRIGO KAISER
FABRICIO DA SILVA TERRA
GABRIEL BORGES DOS SANTOS
LUANA NUNES CENTENO
LUANA NUNES CENTENO
LUCIANA MARINI KOPP6
LUIS CARLOS TIMM14
MAURICIO FORNALSKI SOARES
MIGUEL DAVID FUENTES GUEVARA
OTTONI MARQUES MOURA DE LEON
THIAGO RODRIGUES DA ROSA
TIRZAH MOREIRA SIQUEIRA6
ULISSES BRISOLARA CORRÊA7
VITOR EMANUEL QUEVEDO TAVARES6

Página gerada em 17/04/2024 22:42:14 (consulta levou 0.390461s)