Nome do Projeto
Desenvolvimento de Abordagens de Controle Avançado com Modelos Neurais
Ênfase
Pesquisa
Data inicial - Data final
01/09/2023 - 31/08/2026
Unidade de Origem
Coordenador Atual
Área CNPq
Engenharias
Resumo
Abordagens de controle avançado são utilizadas para o controle de processos complexos, que geralmente são não lineares. Dentre as abordagens de controle avançado, duas das mais aplicadas na indústria são o controle preditivo baseado em modelo e o controle adaptativo. Nestes tipos de abordagens, geralmente é necessário obter um modelo para predição no caso do controle preditivo ou realizar a estimação e ajuste on-line dos parâmetros do sistema de controle. De forma geral, o processo para obtenção do modelo de predição ou estimação e ajuste on-line de parâmetros envolve um processo de modelagem não linear, já que os processos em questão são não lineares. Uma alternativa para esse processo de modelagem é a utilização de redes neurais artificiais recorrentes, as quais podem ser aplicadas para estimação on-line tanto de modelos de predição quanto de parâmetros do sistema de controle. Esse tipo de estratégia de modelagem tem sido explorado na literatura, sendo que diversas arquiteturas de redes recorrentes foram desenvolvidas para utilização em abordagens de controle. Dentre as principais redes neurais recorrentes, destacam-se o uso de redes com memórias de longo prazo (LSTM) e as redes de estado de eco (ESN), arquiteturas que têm sido estudadas e desenvolvidas para utilização como modelo de predição em controladores preditivos, devido à sua capacidade de modelar sistemas não lineares a partir de dados medidos durante a operação do sistema. Essas arquiteturas também têm sido exploradas em abordagens de controle adaptativo, em especial a rede ESN, devido ao seu treinamento computacionalmente eficiente, o que é particularmente atrativo, já que, em abordagens adaptativas, o custo computacional associado ao treinamento do modelo de adaptação é uma das principais limitações à sua aplicação. Dessa forma, neste projeto, são estudadas abordagens para a utilização de redes neurais recorrentes no papel de modelo de predição em controladores preditivos baseados em modelo, e também para a adaptação de parâmetros do sistema de controle em controladores adaptativos, buscando não só o desenvolvimento de novos algoritmos e abordagens, mas também auxiliando na formação de recursos humanos na área de controle de processos.
Objetivo Geral
O objetivo deste projeto é estudar, desenvolver e validar abordagens de controle preditivo baseado em modelo e controle adaptativo, utilizando redes neurais artificiais recorrentes como modelo de predição.
Justificativa
Abordagens de controle avançado, como o controle preditivo baseado em modelo (MPC) vêm recebendo uma boa aceitação na indústria, principalmente por prover uma solução integrada para o controle em malha fechada de sistemas com variáveis acopladas, dinâmicas complexas e sujeitas a restrições [1]. O sucesso desse tipo de abordagem depende da disponibilidade de um modelo do processo preciso, cuja obtenção é, em muitos casos, a tarefa mais desafiadora para o projeto de um MPC [2]. De forma geral, as abordagens mais aplicadas são as baseadas em representações com modelos de predição lineares, como o controle preditivo generalizado (GPC) [3], e o controle por matriz dinâmica (DMC) [4]. Tais abordagens possuem grande aplicação em processos da indústria petroquímica, porém, vêm sendo adotadas, com o passar do tempo, em outros domínios de aplicação [5].
A utilização de modelos de predição não lineares, que resultam em um problema de controle preditivo não linear (NMPC), ainda não é tão comum, porém, pode ser especialmente útil em certas ocasiões, como em processos altamente não lineares. Processos moderadamente não lineares, os quais enfrentam amplas mudanças em sua região de operação, além dos limites nos quais a linearização local é aceitável, consistindo também em exemplos em que o NMPC apresenta grande potencial de aplicação. Por fim, processos em que o controlador opera próximo a condições singulares, por exemplo, a mudança no sinal do ganho ou multiplicidade na entrada, são casos em que o uso de abordagens NMPC pode trazer benefícios claros frente à aplicação de controladores lineares [6].
Abordagens adaptativas podem ser adotadas, de forma a facilitar o processo de obtenção e atualização do modelo não linear de processo utilizado na abordagem NMPC. Ao utilizar um modelo não linear adaptativo, é possível projetar um controlador MPC sem a necessidade de obtenção direta do modelo não linear do processo, já que a etapa de identificação é integrada ao algoritmo de controle [7,8,9].
A obtenção de um modelo não linear para utilização em uma abordagem NMPC, seja ele adaptativo ou não, é, de forma geral, desafiadora. Uma opção comum consiste na utilização de modelos fenomenológicos, baseados nas equações fundamentais do processo, cujos parâmetros podem ser estimados on-line em abordagens adaptativas. Essa alternativa é interessante por resultar em um modelo globalmente válido, característica desejada para o controle. Porém, a dificuldade associada à dedução de tais modelos consiste em um grande problema. Modelos empíricos são uma alternativa aos modelos fenomenológicos, transformando dados acerca da entrada e saída de um processo em uma relação entre a entrada e a saída, que pode ser usada para predizer comportamentos futuros. Em modelos empíricos, não é possível concluir acerca da capacidade de extrapolação do modelo, o que pode ser tornar uma limitação em determinadas aplicações [10,11].
Uma forma para obtenção de modelos não lineares empíricos, a qual vem recebendo crescente atenção na literatura, consiste no uso de redes neurais artificiais (RNA). Diversas arquiteturas de RNA recorrentes já foram exploradas em abordagens de NMPC, com destaque para a rede perceptron de múltiplas camadas recorrente (RMLP), a qual pode ser interpretada como um modelo não linear autorregressivo com entrada exógena (NARX) [12,13].
A formulação e aplicação de algoritmos NMPC adaptativos com modelos baseados em RNA recorrentes ainda são incipientes. Muito se deve à complexidade computacional associada ao treinamento desses modelos, já que arquiteturas convencionais de RNA são treinadas com algoritmos baseados no método da retropropagação do erro. Tal método apresenta, geralmente, altos tempos de cômputo, sem apresentar garantias de otimalidade e tempo máximo de cômputo, fazendo com que a aplicação de tais arquiteturas em abordagens adaptativas envolve diversos complicadores [14,15].
Alternativas para o treinamento eficiente de RNAs recorrentes são encontradas na literatura. Essas arquitetura se baseiam em paradigmas de aprendizado distintos, como o da computação de reservatório. A ideia compartilhada pelas arquiteturas de RNAs desse paradigma consiste em eliminar muitos dos problemas encontrados no treinamento de arquiteturas recorrentes convencionais, como a alta complexidade computacional, por meio de abordagens em que a parte não linear dinâmica do modelo não é ajustada durante o treinamento, sendo gerada a partir de distribuições pré-definidas em uma etapa anterior ao treinamento do modelo. As principais arquiteturas que se aproveitam desse paradigma são a rede de estado de eco (ESN), proposta por [16], e a máquina de estado líquido (LSM), proposta por [17].
Outro tipo de arquitetura que vem recebendo atenção recentemente por conta da eficiência de seu processo de treinamento é o que emprega redes baseadas em arquiteturas MLP, porém com estruturas especiais nas quais apenas partes do modelo são treináveis. Exemplos de arquiteturas desse tipo são as redes RVFL [18] e as máquinas de aprendizado extremo (ELM) [19]. Essas arquiteturas compartilham algumas semelhanças, sendo formadas por camadas de neurônios totalmente conectadas, cujos parâmetros são fixos e gerados previamente à etapa de treinamento, associadas a uma camada de saída cujos parâmetros são treináveis [20,21].
Além do treinamento on-line dos modelos baseados em RNA, a utilização delas como modelo de predição em abordagens NMPC também é um desafio. O principal deles, o qual surge diretamente da não linearidade do processo, consiste na solução on-line de um problema de programação não linear (NLP), ao menos em parte, o qual não é convexo e requer algoritmos complexos para resolução. A solução on-line de um NLP demanda um custo computacional elevado sem que haja garantia de otimalidade e tempo de convergência do algoritmo [6,22].
Métodos para evitar a necessidade de resolução de um NLP em uma abordagem NMPC são encontrados na literatura. Uma forma comum consiste em obter uma versão em que parte da formulação NMPC utiliza de versões linearizadas do modelo não linear, fazendo com que o problema de otimização resultante seja de programação quadrática (QP). Em geral, tais métodos apresentam um compromisso entre a fidelidade da aproximação do modelo de predição comparado ao modelo não linear, o custo computacional para obtenção das predições e o associado à resolução do problema de otimização. Esse tipo de abordagem é referenciado na literatura como abordagem MPC não linear prática ou computacionalmente eficiente [23,14].
Nesse contexto, o presente projeto pretende avaliar a utilização de arquiteturas de redes neurais recorrentes que apresentem treinamento eficiente computacionalmente para a formulação de controladores preditivos baseados em modelo, abordando estratégias em que o modelo é identificado por meio de identificação de sistemas e estratégias adaptativas. O objetivo do estudo é desenvolver algoritmos para estimação on-line dos parâmetros das RNAs recorrentes, de forma a possibilitar a obtenção de um modelo de predição não linear, o qual servirá de base para o desenvolvimento de estratégias de NMPC. Serão explorados neste estudo aspectos relacionados à qualidade dos modelos não lineares identificados on-line, à qualidade do controle em malha fechada, e também os aspectos associados à aplicação industrial de tais técnicas, como garantias de robustez, estabilidade e tempo máximo de cômputo.
A utilização de modelos de predição não lineares, que resultam em um problema de controle preditivo não linear (NMPC), ainda não é tão comum, porém, pode ser especialmente útil em certas ocasiões, como em processos altamente não lineares. Processos moderadamente não lineares, os quais enfrentam amplas mudanças em sua região de operação, além dos limites nos quais a linearização local é aceitável, consistindo também em exemplos em que o NMPC apresenta grande potencial de aplicação. Por fim, processos em que o controlador opera próximo a condições singulares, por exemplo, a mudança no sinal do ganho ou multiplicidade na entrada, são casos em que o uso de abordagens NMPC pode trazer benefícios claros frente à aplicação de controladores lineares [6].
Abordagens adaptativas podem ser adotadas, de forma a facilitar o processo de obtenção e atualização do modelo não linear de processo utilizado na abordagem NMPC. Ao utilizar um modelo não linear adaptativo, é possível projetar um controlador MPC sem a necessidade de obtenção direta do modelo não linear do processo, já que a etapa de identificação é integrada ao algoritmo de controle [7,8,9].
A obtenção de um modelo não linear para utilização em uma abordagem NMPC, seja ele adaptativo ou não, é, de forma geral, desafiadora. Uma opção comum consiste na utilização de modelos fenomenológicos, baseados nas equações fundamentais do processo, cujos parâmetros podem ser estimados on-line em abordagens adaptativas. Essa alternativa é interessante por resultar em um modelo globalmente válido, característica desejada para o controle. Porém, a dificuldade associada à dedução de tais modelos consiste em um grande problema. Modelos empíricos são uma alternativa aos modelos fenomenológicos, transformando dados acerca da entrada e saída de um processo em uma relação entre a entrada e a saída, que pode ser usada para predizer comportamentos futuros. Em modelos empíricos, não é possível concluir acerca da capacidade de extrapolação do modelo, o que pode ser tornar uma limitação em determinadas aplicações [10,11].
Uma forma para obtenção de modelos não lineares empíricos, a qual vem recebendo crescente atenção na literatura, consiste no uso de redes neurais artificiais (RNA). Diversas arquiteturas de RNA recorrentes já foram exploradas em abordagens de NMPC, com destaque para a rede perceptron de múltiplas camadas recorrente (RMLP), a qual pode ser interpretada como um modelo não linear autorregressivo com entrada exógena (NARX) [12,13].
A formulação e aplicação de algoritmos NMPC adaptativos com modelos baseados em RNA recorrentes ainda são incipientes. Muito se deve à complexidade computacional associada ao treinamento desses modelos, já que arquiteturas convencionais de RNA são treinadas com algoritmos baseados no método da retropropagação do erro. Tal método apresenta, geralmente, altos tempos de cômputo, sem apresentar garantias de otimalidade e tempo máximo de cômputo, fazendo com que a aplicação de tais arquiteturas em abordagens adaptativas envolve diversos complicadores [14,15].
Alternativas para o treinamento eficiente de RNAs recorrentes são encontradas na literatura. Essas arquitetura se baseiam em paradigmas de aprendizado distintos, como o da computação de reservatório. A ideia compartilhada pelas arquiteturas de RNAs desse paradigma consiste em eliminar muitos dos problemas encontrados no treinamento de arquiteturas recorrentes convencionais, como a alta complexidade computacional, por meio de abordagens em que a parte não linear dinâmica do modelo não é ajustada durante o treinamento, sendo gerada a partir de distribuições pré-definidas em uma etapa anterior ao treinamento do modelo. As principais arquiteturas que se aproveitam desse paradigma são a rede de estado de eco (ESN), proposta por [16], e a máquina de estado líquido (LSM), proposta por [17].
Outro tipo de arquitetura que vem recebendo atenção recentemente por conta da eficiência de seu processo de treinamento é o que emprega redes baseadas em arquiteturas MLP, porém com estruturas especiais nas quais apenas partes do modelo são treináveis. Exemplos de arquiteturas desse tipo são as redes RVFL [18] e as máquinas de aprendizado extremo (ELM) [19]. Essas arquiteturas compartilham algumas semelhanças, sendo formadas por camadas de neurônios totalmente conectadas, cujos parâmetros são fixos e gerados previamente à etapa de treinamento, associadas a uma camada de saída cujos parâmetros são treináveis [20,21].
Além do treinamento on-line dos modelos baseados em RNA, a utilização delas como modelo de predição em abordagens NMPC também é um desafio. O principal deles, o qual surge diretamente da não linearidade do processo, consiste na solução on-line de um problema de programação não linear (NLP), ao menos em parte, o qual não é convexo e requer algoritmos complexos para resolução. A solução on-line de um NLP demanda um custo computacional elevado sem que haja garantia de otimalidade e tempo de convergência do algoritmo [6,22].
Métodos para evitar a necessidade de resolução de um NLP em uma abordagem NMPC são encontrados na literatura. Uma forma comum consiste em obter uma versão em que parte da formulação NMPC utiliza de versões linearizadas do modelo não linear, fazendo com que o problema de otimização resultante seja de programação quadrática (QP). Em geral, tais métodos apresentam um compromisso entre a fidelidade da aproximação do modelo de predição comparado ao modelo não linear, o custo computacional para obtenção das predições e o associado à resolução do problema de otimização. Esse tipo de abordagem é referenciado na literatura como abordagem MPC não linear prática ou computacionalmente eficiente [23,14].
Nesse contexto, o presente projeto pretende avaliar a utilização de arquiteturas de redes neurais recorrentes que apresentem treinamento eficiente computacionalmente para a formulação de controladores preditivos baseados em modelo, abordando estratégias em que o modelo é identificado por meio de identificação de sistemas e estratégias adaptativas. O objetivo do estudo é desenvolver algoritmos para estimação on-line dos parâmetros das RNAs recorrentes, de forma a possibilitar a obtenção de um modelo de predição não linear, o qual servirá de base para o desenvolvimento de estratégias de NMPC. Serão explorados neste estudo aspectos relacionados à qualidade dos modelos não lineares identificados on-line, à qualidade do controle em malha fechada, e também os aspectos associados à aplicação industrial de tais técnicas, como garantias de robustez, estabilidade e tempo máximo de cômputo.
Metodologia
O desenvolvimento do projeto unificado envolverá as seguintes etapas:
I. Pesquisa na literatura de abordagens para identificação de sistemas dinâmicos não lineares utilizando redes neurais artificiais recorrentes e sobre estratégias de controle avançado baseadas em tais modelos.
Nesta etapa de revisão da literatura, serão pesquisadas as abordagens já existentes para obtenção de modelos utilizando arquiteturas de redes neurais recorrentes. No contexto dos controladores avançados, serão pesquisadas abordagens que integrem redes neurais recorrentes na estrutura do controlador, em especial como modelo de predição em estratégias preditivas.
II. Desenvolvimento de ambientes de simulação para avaliação da estimação e controle
Serão estudados e desenvolvidos cenários de simulação, considerando processos tipicamente utilizados para a avaliação do desempenho de modelos e controladores não lineares. Serão escolhidos processos estáveis em malha aberta, com comportamentos não lineares significativos na faixa de operação considerada e que apresentem relevância na literatura para a comparação de diferentes técnicas de controle não linear.
III. Desenvolvimento e simulação de técnicas para treinamento on-line das arquiteturas de RNA recorrentes avaliadas
Serão desenvolvidas arquiteturas de RNA recorrentes para identificação de processos não lineares, baseadas em redes de estado de eco, redes LSTM e máquinas de aprendizado extremo. Nesta etapa serão propostas técnicas tanto para obtenção dos modelos a partir de dados previamente obtidos da operação do processo, e também por meio da estimação on-line dos parâmetros treináveis dos modelos.
IV. Desenvolvimento de algoritmos de controle avançado baseados em modelos neurais
Para o desenvolvimento de algoritmos de controle preditivo não linear e controle adaptativo, os modelos de predição baseados nas estruturas de RNA recorrentes serão formulados utilizando uma estrutura na qual parte da predição será realizada utilizando o modelo não linear completo, enquanto uma segunda porção da predição será obtida utilizando uma aproximação linear local do modelo não linear. Para obtenção da aproximação linear local serão avaliados métodos baseados na linearização utilizando a aproximação da série de Taylor de primeira ordem e, também, métodos de linearização numérica, por meio da obtenção da resposta ao degrau local do modelo não linear.
V. Desenvolvimento de bancadas protótipo para avaliação de controladores
Para a avaliação da aplicação real de técnicas de controle avançado, serão desenvolvidas bancadas protótipo que permitam a emulação da operação de processos lineares e não lineares. Com tais bancadas, será possível desenvolver cenários para avaliação do funcionamento e da aplicação prática das abordagens de controle estudadas.
I. Pesquisa na literatura de abordagens para identificação de sistemas dinâmicos não lineares utilizando redes neurais artificiais recorrentes e sobre estratégias de controle avançado baseadas em tais modelos.
Nesta etapa de revisão da literatura, serão pesquisadas as abordagens já existentes para obtenção de modelos utilizando arquiteturas de redes neurais recorrentes. No contexto dos controladores avançados, serão pesquisadas abordagens que integrem redes neurais recorrentes na estrutura do controlador, em especial como modelo de predição em estratégias preditivas.
II. Desenvolvimento de ambientes de simulação para avaliação da estimação e controle
Serão estudados e desenvolvidos cenários de simulação, considerando processos tipicamente utilizados para a avaliação do desempenho de modelos e controladores não lineares. Serão escolhidos processos estáveis em malha aberta, com comportamentos não lineares significativos na faixa de operação considerada e que apresentem relevância na literatura para a comparação de diferentes técnicas de controle não linear.
III. Desenvolvimento e simulação de técnicas para treinamento on-line das arquiteturas de RNA recorrentes avaliadas
Serão desenvolvidas arquiteturas de RNA recorrentes para identificação de processos não lineares, baseadas em redes de estado de eco, redes LSTM e máquinas de aprendizado extremo. Nesta etapa serão propostas técnicas tanto para obtenção dos modelos a partir de dados previamente obtidos da operação do processo, e também por meio da estimação on-line dos parâmetros treináveis dos modelos.
IV. Desenvolvimento de algoritmos de controle avançado baseados em modelos neurais
Para o desenvolvimento de algoritmos de controle preditivo não linear e controle adaptativo, os modelos de predição baseados nas estruturas de RNA recorrentes serão formulados utilizando uma estrutura na qual parte da predição será realizada utilizando o modelo não linear completo, enquanto uma segunda porção da predição será obtida utilizando uma aproximação linear local do modelo não linear. Para obtenção da aproximação linear local serão avaliados métodos baseados na linearização utilizando a aproximação da série de Taylor de primeira ordem e, também, métodos de linearização numérica, por meio da obtenção da resposta ao degrau local do modelo não linear.
V. Desenvolvimento de bancadas protótipo para avaliação de controladores
Para a avaliação da aplicação real de técnicas de controle avançado, serão desenvolvidas bancadas protótipo que permitam a emulação da operação de processos lineares e não lineares. Com tais bancadas, será possível desenvolver cenários para avaliação do funcionamento e da aplicação prática das abordagens de controle estudadas.
Indicadores, Metas e Resultados
A partir da execução deste projeto unificado têm-se como indicadores, metas e resultados esperados:
I. Desenvolver algoritmos de controle preditivo baseado em modelo, considerando arquiteturas de redes neurais recorrentes como modelo de predição;
II. Implementar em software algoritmos de identificação de sistemas e controle avançado;
III. Validar as abordagens propostas por meio de simulações considerando processos tipicamente explorados na literatura;
IV. Criar bancadas didáticas para desenvolvimento e testes de controladores, de forma a permitir o teste de novas abordagens de controle em processos físicos e de forma a apoiar o desenvolvimento de atividades de ensino;
V. Formar recursos humanos capacitados para o desenvolvimento de abordagens de identificação de sistemas e controle de processos.
I. Desenvolver algoritmos de controle preditivo baseado em modelo, considerando arquiteturas de redes neurais recorrentes como modelo de predição;
II. Implementar em software algoritmos de identificação de sistemas e controle avançado;
III. Validar as abordagens propostas por meio de simulações considerando processos tipicamente explorados na literatura;
IV. Criar bancadas didáticas para desenvolvimento e testes de controladores, de forma a permitir o teste de novas abordagens de controle em processos físicos e de forma a apoiar o desenvolvimento de atividades de ensino;
V. Formar recursos humanos capacitados para o desenvolvimento de abordagens de identificação de sistemas e controle de processos.
Equipe do Projeto
Nome | CH Semanal | Data inicial | Data final |
---|---|---|---|
BERNARDO BARANCELLI SCHWEDERSKY | 22 | ||
CLAUDIO DE OLIVEIRA DUARTE | |||
Iuri Schwartz Eichholz | |||
JOAO PEDRO CASSEL VALENTE | |||
KEVIN FEREIRA DA SILVA | |||
LUIZ EDUARDO PRESTES KOLOSQUE |