Nome do Projeto
Abordando Limites Tecnológicos na Coleta e Tratamento de Dados na Computação de Borda
Ênfase
Pesquisa
Data inicial - Data final
01/09/2020 - 31/08/2024
Unidade de Origem
Coordenador Atual
Área CNPq
Ciências Exatas e da Terra
Resumo
As técnicas de aprendizado de máquina, bastante dominadas pela comunidade científica, são reconhecidas por permitir que um sistema computacional possa ser treinado para atribuir significado a padrões isolados identificados em um conjunto de dados de entrada. Para dar suporte operacional a tais sistemas, não raro são utilizados computadores paramenta-dos de poderosas arquiteturas manycore (GPGPU – General Purpose Graphics Processing Unit) e também os quase ilimitados recursos oferecidos por nuvens computacionais públicas. No entanto, com a crescente oferta de dispositivos computacionais para computação de borda, um novo leque de possibilidades se abre quando é possível levar até a fonteda informação, muitas vezes em locais desprovidos ao acesso às redes de comunicação,o mesmo tipo de sistema computacional. Neste projeto, este é o aspecto tratado, tendo como objetivo avaliar a operação de técnicas de aprendizado de máquina sobre dispositivos de computação de borda. A hipótese considerada é que é viável implementar sobre recursos computacionais para processamento em borda. No entanto, a diferença de poder de processamento oferecido pelos dispositivos de borda é consideravelmente inferior àquela oferecida pelos recursos de processamento convencionais. Determinar as características desejáveis e possíveis para sistemas voltados ao aprendizado de máquina na computação deborda torna-se imperativo, sendo este o objeto da pesquisa desenvolvida. São três cenários considerados, todos dentro do contexto da produção agrícola: fisiologia vegetal, sistemas hídricos e monitoramento integrado de pragas. Os resultados obtidos virão nortear o desenvolvimento de novos produtos e processos para rentabilizar a produção agrícola.

Objetivo Geral

O objetivo principal deste projeto é: Validar o uso de recursos de processamento para computação de borda para aplicar técnicas de aprendizado de máquina para identificação de eventos.

Os objetivos secundários são os de obter protótipos para Computação em Borda para:
•Um sistema de acompanhamento de variações fisiológicas e identificação de estímulos externos em plantas;
•Um sistema para identificação de anomalias em vazões de rios;
•Um sistema para monitoramento integrado de pragas em culturas.

As metas delineadas para atingir os objetivos, principal e secundário, encontram-se distribuí-das no cronograma e indicarão sucesso nas frentes de desenvolvimento dos três casos de estudo.Para cada um destes casos de estudo, as seguintes metas devem ser atingidas, considerando o ordenamento apresentado:

1. Consolidar, no contexto do projeto, um grupo de pesquisadores interdisciplinares no tema do caso de estudo para discussão e desenvolvimento das atividades;
2. Produzir uma aplicação para cada caso de estudo em ambientes convencionais para pro-cessamento de técnicas de aprendizado de máquina;
3. Obter uma descrição clara e precisa dos cenários em que as soluções serão aplicadas;
4. Obter protótipos definitivos das soluções em ambiente de computação de borda.

Também caracteriza-se como uma meta, a transferência do conhecimento para o setor produtivo para que este possa avaliar o interesse econômico de colocar em produção os resultados obtidos.

Justificativa

As novas tecnologias computacionais, representadas neste projeto pelas arquiteturas manycores e suporte a computação na nuvem, abriram possibilidade do desenvolvimento de novas aplicações da inteligência artificial no contexto da exploração de técnicas de aprendizado de máquina,mais precisamente, aquelas baseadas em aprendizagem profunda (deep learning). Não é raro que pesquisadores e desenvolvedores na área de deep learning explorem GPGPUs (General Purpose Graphics Processing Unit) para operacionalizar a execução de seus complexos algoritmos.A opção por uso de GPGPUs se dá em função de sua supremacia em termos de desempenho para aplicações da área face a arquiteturas convencionais, mesmo que paralelas. Existem GPGPUs em uma larga faixa de preço, não sendo raro que sejam mais caras que o próprio computador que a abriga, podendo mesmo os desenvolvedores optar em utilizar recursos disponibilizados por serviços de nuvens públicas (Google, Azure, Amazon). Neste projeto, o desafio é investigar o potencial de uso da inteligência artificial na computação de borda em sistemas computacionais voltados para a Internet das Coisas (Internet of Things – IoT). Na computação de borda é necessário considerar que equipamentos de processamento (de borda)estarão isolados e terão pouco, ou mesmo nenhum, acesso redes de comunicação: decisões de-vem ser tomadas isoladamente. Também deve ser considerado que, dada as características de isolamento de tais sistemas, tais equipamentos sejam baratos e consumam pouca energia. Na temática deste projeto, o processamento a ser realizado diz respeito a identificação de eventos ou situações por um processo resultante de uma aplicação de aprendizado de máquina, permitindo que a computação seja realizada de forma altamente distribuída, minimizando requisitos de rede. Foram selecionados três campos de aplicação para validar o uso técnicas de inteligência artificial baseadas em aprendizado de máquina na borda: fisiologia vegetal, sistemas hidrológicos e manejo integrado de pragas. Neste projeto, um cenário de solução será projetado e um protótipo validará sua implementação, permitindo avaliar a viabilidade econômica da proposta e o potencial de transferência de conhecimento para o setor produtivo.

Metodologia

O eixo comum que regrupa os três casos de estudo é a aplicação de dispositivos para computação de borda em técnicas que explorem o aprendizado de máquina. Diversos problemas serão comuns às diferentes frentes, como a especificação dos recursos básicos de operação dos dispositivos e a modelagem de uma implementação adaptada a estes dispositivos. Portanto, deverá ser promovida a integração do trabalho entre os membros, havendo um corpo fixo de pesquisadores colaboradores, compostos de alunos em diferentes níveis, responsáveis por oferecer suporte na manipulação dos dispositivos, e outros componentes necessários, para computação de borda.De uma forma geral, projeta-se a seguinte sequência metodológica de ações para atingir os objetivos propostos.

1. Capacitar uma equipe de desenvolvimento com o linguajar e as técnicas das áreas associadas aos casos de estudo.
2. Produzir soluções que apliquem técnicas de aprendizado de máquina, baseados em redes neurais, que permitam identificar eventos em amostras coletadas em equipamentos convencionais, como GPGPUs e na nuvem.
3. Refinar os cenários de computação de borda onde será realizada a implantação definitiva das soluções projetadas.
4. Realizar a implantação do sistema tendo foco o cenário identificado.
5. Confrontar o resultado obtido pelas soluções apresentadas por equipamentos convencionais e nos equipamentos de borda.

Destaca-se que, ao final das Etapas 2 e 4 em cada caso de estudo, deverá ser definido, via discussão entre os pesquisadores envolvidos, do interesse em registro de um processo, software ou condução de uma patente.Entende-se que, em função de particularidades dos diferentes casos de estudo, é possível que a velocidade do avanço do andamento destas ações varie. Caso um grande atraso seja observado em algum caso de estudo, é possível buscar apoio nas soluções encontradas nas outras frentes de desenvolvimento.Por outro lado, não deve-se negligenciar o fato de que a presente proposta reflete a estruturação, na forma de um projeto, de esforços de trabalho em curso e de interesse de colaboração dos pesquisadores envolvidos. As oportunidades da estruturação da colaboração formalizada entre os participantes são vistas como potencializadores da qualidade dos resultados finais.É importante fazer notar que duas das frentes de trabalho citadas neste projeto, aquela referente à fisiologia vegetal e aquela referente ao manejo integrado de pragas, já possuem um histórico associado ao uso de técnicas de deep learning. A experiência pregressa será utilizada para os direcionamentos iniciais de forma a acelerar as ações.

Por fim, cita-se que deverão ser utilizadas ferramentas na nuvem para apoiar o desenvolvimento de um projeto colaborativo. Uma de tais ferramentas será para controlar o andamento das tarefas propriamente dito, baseada em Scrum ou Kanban. A outra será na manutenção de um repositório digital de arquivos, onde a opção deve ser pelo uso de um sistema de gerenciamento, tipo Github, privado ao grupo.

Indicadores, Metas e Resultados

Resultados acadêmicos

Deve se apontar que, por se tratar de um trabalho de pesquisa em meio acadêmico, tem-se por resultado esperado a formação de recursos humanos. Portanto, durante os três anos do projeto é esperado:
- A conclusão de dois trabalhos de conclusão de curso de alunos de graduação;
- A apresentação de duas teses de doutorado.

Espera-se a produção de material de divulgação científica na forma de artigos científicos, a serem submetidos a eventos e periódicos da área da Computação e daquelas relacionadas aos estudos de caso. Espera-se, ao final dos três anos, contar com pelo menos seis publicações com destaque apresentado resultados científicos alcançados.

Resultados materiais

O primeiro conjunto de resultados, a ser atingido na metade do desenvolvimento do projeto,consistem nas três soluções técnicas de aprendizado de máquina para os estudos de casos desenvolvidos. A materialização destes se dará na forma de software e permitirão realizar experimentos para subsidiar a avaliação de resultados e a publicação de artigos científicos.Outro conjunto de resultados é representado pela descrição dos cenários a serem atendidos nos diferentes estudos de caso. Esta descrição consiste no detalhamento da implantação do sistema produzido, apresentando os atores envolvidos, material necessário e ferramental auxiliar,como baterias e redes de comunicação. Também constará neste cenário os pré-requisitos e os limites das soluções apresentadas.Finalmente, o terceiro conjunto de resultados, representa o principal objetivo do trabalho e contém os protótipos para computação em borda para solução dos três casos de estudo descritos neste projeto.

Impactos esperados
O principal impacto esperado é obter três infraestruturas, uma para cada caso de estudo, que permitam a criação de novos e serviços para agricultura que permitam aumento da produção, pela:
•Identificação das necessidades das culturas pela análise das reações das plantas aos elementos do meio ambiente e de suas necessidades de nutrientes;
•Identificação de situações de risco de cheias ou secas em rios que possam servir às comunidades agrícolas;
•Identificação do tipo e volume de insetos em uma cultur.

Os ganhos poderão se apresentar, não apenas na geração de renda de empresas que vierem a aplicar os resultados em seus produtos, mas, principalmente, no aumento da rentabilidade, econsequentemente da renda, de indivíduos atuantes no setor agrícola.

Equipe do Projeto

NomeCH SemanalData inicialData final
Anderson Monteiro da Rocha
GERSON GERALDO HOMRICH CAVALHEIRO8
Marcos Antonio de Oliveira Júnior

Página gerada em 23/04/2024 21:00:28 (consulta levou 0.128363s)