Diagnóstico da Doença de Alzheimer utilizando Deep Learning em Imagens Médicas

Nome do Projeto

Ênfase

Pesquisa

Data inicial - Data final

20/01/2020 - 31/12/2021

Unidade de Origem

Centro de Desenvolvimento Tecnológico

Coordenador Atual

BRUNO ZATT

Área CNPq

Ciências Exatas e da Terra

Resumo

Nos últimos anos, grandes avanços na tecnologia de biomarcadores foram feitos. Em termos gerais, existem duas grandes modalidades de biomarcadores: I) biomarcadores de fluido: pequenas moléculas ou proteínas que podem ser mensuradas em fluidos biológicos (sangue, plasma, líquido cefalorraquidiano, saliva e urina); e II) biomarcadores de imagem: técnicas de última geração que podem indicar alterações anatômicas – como MRI) e a tomografia computadoriza (CT) – e funcionais – como a ressonância magnética funcional (fMRI) e PET. Atualmente, na DA, alguns eventos fisiopatológicos clássicos podem ser medidos pela utilização destas modalidades de biomarcadores . A associação entre biomarcadores e algoritmos de reconhecimento de padrões refinados, como técnicas de aprendizado de máquina e IA, é uma estratégia que oferece potencial para identificar indivíduos em risco de desenvolver a DA. Essas técnicas visam a solução de problemas de otimização para classificar padrões, geralmente descritos por vetores de características. Nesse campo, as aplicações tradicionais decidem por características que se assemelham à compreensão humana dos dados, como o uso de descritores estatísticos e de textura para a análise de “sinais” biomédicos. Tais estratégias alcançaram diversos avanços nas últimas duas décadas, com o desenvolvimento de sistemas inteligentes capazes de identificar e classificar anomalias não visíveis aos olhos humanos. O desenvolvimento de métodos de aprendizagem profunda (do inglês, deep learning), juntamente com o uso de clusters computacionais, tem desafiado os métodos tradicionais de aprendizado de máquina. Usando múltiplas camadas de processamento, redes neurais convolucionais são capazes de aprender representações de características abstratas (não diretamente compreensíveis por humanos) e têm alcançado resultados de classificação de ponta usando dados biomédicos. Combinando imagens médicas, com informações anatômicas e funcionais, como MRI e PET-FDG, com múltiplas variáveis derivadas de biomarcadores de fluidos, informações clínicas e demográficas, é possível treinar e validar algoritmos inovadores de IA potencialmente capazes de identificar indivíduos na fase pré-clínica assintomática em risco de progredir para a fase sintomática da DA. Com base no exposto, nós hipotetizamos que um método de aprendizagem profunda poderá permitir o diagnóstico precoce da DA em estágios pré-clínicos. Sendo assim este projeto visa desenvolver um método inovador de classificação para a identificação de assinaturas biológicas da DA.

Objetivo Geral

O objetivo geral deste trabalho é estudar a doença de Alzheimer e suas características a fim desenvolver um método baseado na utilização de técnicas de Deep Learning para diagnosticar e prever a progressão do estado clínico de pacientes com essas doenças.
Além disso, serão estudados os diversos tipos de imagens médicas para aplicação de técnicas de Deep Learning com o propósito de extrair padrões que auxiliem no diagnóstico de indivíduos com doenças neurodegenerativas.

Justificativa

Nas últimas décadas, as pesquisas médicas, as descobertas científicas e as melhorias na educação e nas condições de vida no cenário mundial causaram uma redução significativa nas chances de desenvolvimento de pandemias causadas por agentes patogênicos infecciosos (G7, 2017). Desta forma, o crescimento populacional nas últimas décadas veio também acompanhado de um aumento progressivo do número de idosos. Em países desenvolvidos, a expectativa de vida já atinge valores acima dos 80 anos. No Japão, por exemplo, em 2015, a expectativa de vida era de 83,7 anos (WHO, 2015).

Hoje, as principais causas de morte de pessoas idosas nos Estados Unidos e na Europa ainda são as doenças cardiovasculares e o câncer (CDC, 2017; EUROSTAT, 2017). No entanto, as causas de morte por essas doenças tem decrescido anualmente (ALZHEIMER’S ASSOCIATION, 2017). O avanço na diminuição da mortalidade relacionada a estas duas doenças contribuiu ainda mais com o crescimento no número de cidadãos idosos e provocou um aumento sem precedentes de pessoas afetadas por doenças neurodegenerativas (GOOCH; PRACHT; BORENSTEIN, 2017), como a Doença de Alzheimer (DA) e a doença de Parkinson (DP), que são fortemente relacionadas com a questão da idade avançada de seus portadores e estão entre as dez principais doenças sem cura conhecida que terminam em morte (WHO, 2017b).

Doenças neurodegenerativas são classificadas como uma série de condições que afetam principalmente as células residentes do cérebro, os neurônios. Além disso, essas doenças são condições incuráveis e debilitantes que resultam em degeneração progressiva, o que reflete em disfunção motora ou cognitiva progressiva (JPND, 2017).

O aumento da frequência de distúrbios neurodegenerativos atualmente incuráveis fará com que haja um grande impacto em indivíduos, famílias e sociedades, a menos que sejam descobertos meios efetivos para reduzir a incidência e a progressão dessas doenças (G7, 2017). Tendo isso em vista, o diagnóstico precoce, juntamente com um pré-tratamento, poderia proporcionar oportunidades para prevenir e/ou atrasar as alterações comportamentais, neuroquímicas e neuroanatômicas associadas a distúrbios neurodegenerativos (ZIMMER, 2015).
Considerando apenas a DA, que é o transtorno neurodegenerativo mais incidente, em 2015, cerca de 48 milhões de pessoas em todo o mundo portavam a doença (WHO, 2017a). Além disso, atualmente 1% dos idosos entre os 65 e 70 anos desenvolve a doença, mas a prevalência aumenta exponencialmente com a idade, sendo de 6% aos 70, 30% aos 80 anos e mais de 60% após os 90 anos (BERMEJO-PAREJA et al., 2008).

Ao considerar a DP, que é o segundo transtorno neurodegenerativo mais comum relacionado à idade, entre sete milhões e 10 milhões de pessoas em todo o mundo têm a doença (NAQVI, 2017). A chance de adquirir a doença aumenta significativamente com o envelhecimento, sendo que aos 40 anos de idade, 41 em cada 100.000 habitantes desenvolvem Parkinson. Aos 80 anos ou mais, são 1.900 portadores para cada 100.000 habitantes (NAQVI, 2017).

Para realizar o diagnóstico destas doenças, geralmente é feita uma avaliação clínica composta por vários tipos de testes, como exames de imagem e exames clínicos, uma vez que ainda não existe um exame único que permita identificar essas doenças. Dentre os exames realizados, os principais são os testes neuropsicológicos, testes de imagem mental, como MRI (ressonância magnética) e PET (tomografia por emissão de positrões), testes genéticos, testes de fluido espinal e outros.

Não obstante, o custo anual total relacionado a doenças neurológicas para a sociedade chega a valores elevados. Nos Estados Unidos, apenas no ano de 2014, esse valor atingiu 789 bilhões de dólares e é esperado que esse custo aumente nos próximos anos, dado que a população idosa segue em crescimento (GOOCH; PRACHT; BORENSTEIN, 2017). Devido ao forte impacto pessoal e econômico das doenças neurodegenerativas, uma expansão significativa da pesquisa na área é vital para sustentar um esforço mundial contra o crescente fardo causado por estas doenças cerebrais (G7, 2017).

No entanto, à medida que pesquisas relacionadas com doenças neurodegenerativas avançam, surgem muitas semelhanças que relacionam essas doenças umas às outras em um nível sub-celular. Desta forma, descobrir essas semelhanças e diferenças oferece esperança de avanços terapêuticos que possam melhorar muitas doenças ao mesmo tempo (RUBINSZTEIN, 2006).

Neste cenário, a computação se mostra uma grande aliada para auxiliar no diagnóstico de pacientes com essas doenças, uma vez que técnicas de inteligência artificial (IA), como Deep Learning, tem sido cada vez mais aplicadas em reconhecimento de padrões na área médica, especialmente em imagens médicas (LEE et al., 2017).

De fato, trabalhos recentes vêm utilizando técnicas de IA visando melhorar a acurácia do diagnóstico de doenças neurodegenerativas, como a DA. Por exemplo, em (ORTIZ et al., 2016), é proposto um conjunto de arquiteturas de Deep Learning para o diagnóstico precoce da DA. Já em (MATHOTAARACHCHI et al., 2017), foi proposto um método probabilístico baseado em aprendizado de máquina (ML, do inglês Machine Learning) aplicado sobre imagens de PET com radiofármacos que identificam deposição de placas de amiloide, projetado para avaliar a progressão para demência em um período de 24 meses. Em (AYDIN; ASLAN, 2017), são utilizados cinco algoritmos de ML diferentes para fazer a classificação entre pacientes controle e pacientes com doenças neurodegenerativas (esclerose lateral amiotrófica, doença de Huntington e doença de Parkinson). Esses trabalhos, no entanto, se dividem em dois grandes grupos: (i) diagnóstico de uma doença específica, ou (ii) classificação de pacientes com transtorno neurodegenerativo. Portanto, são necessárias alternativas que sejam capazes de classificar esses pacientes que apresentam transtorno neurodegenerativo, juntamente com o diagnóstico de sua neuropatologia.

Levando em consideração a importância da saúde mental das pessoas, e que o diagnóstico precoce é de extrema importância para que haja tempo suficiente para que ações sejam tomadas para retardar, atenuar, ou evitar o avanço destas doenças, no escopo do doutorado, serão exploradas técnicas de IA com o objetivo de extrair padrões que auxiliem no diagnóstico de indivíduos com doenças neurodegenerativas (i.e. DA e DP), para posterior uso no desenvolvimento de um método de diagnóstico que permita não apenas informar se um indivíduo está manifestando algum transtorno neurodegenerativo, mas mostrar com precisão qual é a doença que está em fase inicial de desenvolvimento. Além disso, considerando os altos custos envolvidos nos exames médicos, serão definidos quais são os exames ideias a serem utilizados, ou seja, aqueles que apresentam a melhor relação entre precisão do diagnóstico da doença e acessibilidade para grande parte da população.

Metodologia

Inicialmente, será realizado um estudo aprofundado sobre a doença de Alzheimer. Juntamente com este estudo, serão investigadas as principais características, patofisiologia, neuropatologia, biomarcadores, sintomas, fatores de risco e estágios dessa doença, a fim de melhor compreender o funcionamento da doença.

Após, serão exploradas as bases de dados disponíveis no repositório do Laboratory of Neuro Imaging (LONI, https://ida.loni.usc.edu/), a fim de correlacionar os dados ali disponíveis com o estudo feito sobre as doenças. Dentre os dados disponíveis para as bases de dados no LONI, temos dados de bioespécime, dados clínicos, imagens de CT (tomografia computadorizada), imagens de MRI, imagens de PET, imagens de SPECT (tomografia computadorizada por emissão de fóton único) e outros. No LONI, estão disponíveis bases de dados para autismo, doença de Alzheimer, doença de Parkinson, entre outras. Além disso, os pacientes são monitorados longitudinalmente, permitindo que a evolução da doença em cada um deles possa ser monitorada. Também, serão buscadas novas possibilidades de bases de dados a serem exploradas, aumentando assim, a quantidade de indivíduos utilizados no estudo.

Em um primeiro momento, acredita-se que o problema pode ser definido como um problema de classificação, uma vez que é desejado, a partir do biomarcadores e imagens médicas, determinar qual é o diagnóstico atual e futuro do paciente. Portanto, propomos modelar o problema com o uso de técnicas de IA. Técnicas como máquina de vetores de suporte, árvores de decisão (e.g. Random Forest), redes neurais e regressão logística foram aplicadas em contextos semelhantes (e.g. ZHANG et al. (2008), GIL; JOHNSSON (2009) e MUSLIMOVIĆ et al. (2005)) e são candidatas a serem utilizadas neste trabalho. No escopo das imagens médicas, como MRI e PET, serão aplicadas técnicas de deep learning, tais como redes neurais convolucionais e redes neurais recorrentes, para a descoberta de padrões nestes exames, conforme sugere o estudo (LEE et al., 2017). Este estudo oferece perspectivas sobre a história, desenvolvimento e aplicações da tecnologia de aprendizagem profunda, particularmente no que se refere às suas aplicações em imagens médicas. Essas técnicas serão comparadas utilizando as métricas de desempenho clássicas: acurácia, precisão/recall, F-score, área sob a curva ROC e erro quadrado médio. Com essas métricas, será possível escolher as melhores técnicas para serem aplicadas na solução do problema.

Além disso, no escopo dos exames médicos que não são relacionados com imagem (dados demográficos, exames de sangue, urina e fluido cerebrospinal, dados clínicos e afins), será feito um estudo com os biomarcadores disponíveis, a fim de selecionar os atributos mais relevantes para serem utilizados na construção dos modelos. Para isso, serão utilizados métodos como taxa de ganho de informação, coeficiente de Gini, teste de qui-quadrado e ReliefF.

Ainda neste cenário, será explorada a técnica de ensemble, que consiste no uso conjunto de vários algoritmos de aprendizagem de máquina na tentativa de se obter um melhor desempenho preditivo quando comparado a utilizar uma só técnica isoladamente. Esses modelos geralmente permitem que exista uma estrutura muito mais flexível, uma vez que eles combinam várias hipóteses para formar uma hipótese melhor.

Para a modelagem e avaliação destas técnicas, será utilizada a ferramenta RapidMiner Studio (https://rapidminer.com/). O RapidMiner Studio é um poderoso ambiente de modelagem visual que possibilita a criação de fluxos de trabalho analíticos preditivos. Além disso, esta ferramenta possui centenas de algoritmos pré-definidos para pré-processamento de dados e aprendizagem de máquina. Com o RapidMiner, serão feitos melhores ajustes nos parâmetros dos algoritmos, a fim de se obter melhores resultados.

Com o ajuste nos algoritmos, será possível escolher as técnicas que possibilitam atingir melhores resultados. Então, será proposto um método que utilize um conjunto com uma ou mais técnicas de IA que permita classificar em que estágio da doença o paciente se encontra, baseado nos dados que forem inseridos no sistema. Esse método deverá se preocupar, principalmente, em informar se o paciente é definido como um paciente estável (que provavelmente não desenvolverá uma doença neuropsicológica) ou um paciente de risco (alta probabilidade de desenvolver alguma doença).

Para a prototipação dos modelos de deep learning, será utilizada o Keras (https://keras.io/), que é uma API de redes neurais de alto nível, escrita em Python, e permite utilizar as bibliotecas TensorFlow, CNTK ou Theano. O Keras foi desenvolvido com foco em uma prototipagem fácil e rápida e suporta redes neurais convolucionais e recorrentes, bem como combinações das duas. Além disso, tem suporte à aceleração em GPUs.

Após a modelagem do método proposto, serão realizados testes com o intuito de validar o método implementado. Para isso, será utilizado o método de cross-validation com 10-fold, aplicado sobre as bases de dados disponíveis para uso. Então, será feita uma análise dos resultados obtidos pelo método proposto, que deve ser capaz de classificar com uma taxa de acerto alta se o paciente é potencialmente estável ou tem risco de desenvolver alguma doença neurodegenerativa.

Indicadores, Metas e Resultados

1. Avançar na compreensão da relevância de biomarcadores para o acompanhamento temporal e topográfico da progressão da DA;
2. Desvendar novos mecanismos envolvidos na fisiopatologia da DA;
3. Validar um modelo de IA capaz de identificar pacientes em alto risco de desenvolver a Doença de Alzheimer;
4. Publicar em periódicos da área. Em 24 meses, espera-se produzir, pelos menos, 2 publicações Qualis A1 (CAPES);
5. Difundir os resultados obtidos deste projeto para pesquisadores e agentes de saúde (da rede pública) e para familiares de pacientes;
6. Contribuir para formação de, pelo menos, 2 mestres e 1 doutor no tema deste projeto.

Equipe do Projeto

Nome	CH Semanal	Data inicial	Data final
BRUNO ZATT	4
Eduardo Rigon Zimmer
GUILHERME POVALA
LUCAS SEIDY RIBEIRO DOS SANTOS IKENOUE