Nome do Projeto
Aprendizado de Máquina Aplicado à Detecção de Sintomas Depressivos em Indivíduos
Ênfase
Pesquisa
Data inicial - Data final
17/05/2021 - 29/12/2023
Unidade de Origem
Coordenador Atual
Área CNPq
Ciências Exatas e da Terra
Resumo
Transtornos depressivos são um problema crescente no mundo. A identificação precoce de manifestações destes transtornos pode habilitar tratamentos mais eficazes, potencialmente reduzindo o avanço de outros sintomas. Indivíduos hoje geram grandes quantidades de dados no dia-a-dia, por meio do uso de dispositivos eletrônicos como computadores e celulares. Há evidências de que várias destas informações podem ser utilizadas como preditoras de sintomas de transtornos depressivos, abrindo espaço para o desenvolvimento de dispositivos e algoritmos capazes de interpretar estes dados e identificar sintomas de forma autônoma. Neste projeto, propõe-se a avaliação de algoritmos de aprendizado de máquina, em particular redes neurais profundas, para criar modelos capazes de realizar a detecção de sintomas depressivos a partir de sinais multimodais capturados por por dispositivos e interações com dispositivos por indivíduos.

Objetivo Geral

Este projeto tem como objetivo avaliar modelos de aprendizado de máquina aplicados à detecção de transtornos depressivos a partir de dados multimodais. São objetivos específicos:
- Coletar e curar base de dados existentes que contenham um ou mais diagnósticos relacionados a transtornos depressivos e duas ou mais variáveis preditoras que possam ser facilmente capturadas por meio digital;
- Selecionar modelos de aprendizado de máquina adequados para aplicação ao tipo de problema especificado;
- Avaliar os modelos selecionados com as bases de dados, segundo diferentes métricas relevantes ao problema;
- Discutir a aplicabilidade e escalabilidade dos métodos propostos.

Justificativa

Transtornos depressivos são um problema crescente no mundo [1]. A identificação precoce de manifestações destes transtornos pode habilitar tratamentos mais eficazes, potencialmente reduzindo o avanço de outros sintomas.

Atualmente o diagnóstico e avaliação de sintomas é tipicamente feito por avaliação clínica, como as feitas por psiquiatras ou psicólogos, usualmente com auxílio de questionários padronizados para avaliar a ocorrência de sintomas ligados à depressão. Porém, as interações com profissionais podem ocorrer muito tarde no processo, pois a identificação de sintomas depende da observação destes por não-especialistas (como o próprio indivíduo sofrendo do transtorno), ou de forma infrequente devido ao custo ou disponibilidade de profissionais. O efeito é uma esparsidade nas medições e avaliações de sintomas para a grande maioria de indivíduos, ocorrendo em momentos discretos de tempo e com grande intervalo entre medidas.

Por outro lado, indivíduos hoje geram grandes quantidades de dados no dia-a-dia, por meio do uso de dispositivos eletrônicos como computadores e celulares. Estes dispositivos capturam, ou podem registrar, uma grande variedade de informações como níveis de atividade física, mensagens de texto, uso de aplicativos, conversas por voz etc. Muitas destas informações são passivas, não exigindo interação por parte do indivíduo. É o caso de medidas de atividade física por acelerômetros, batimento cardíacos, geolocalização etc. Medidas passivas são particularmente interessantes por não serem intrusivas, não exigirem atenção do indivíduo e poderem ser coletadas de forma continuada [2, 3].

Há evidências de que várias destas informações podem ser utilizadas como preditoras de sintomas de transtornos depressivos [4,5,6]., abrindo espaço para o desenvolvimento de dispositivos e algoritmos capazes de interpretar estes dados e identificar sintomas de forma autônoma. Esta possibilidade é atrativa por pelo menos dois motivos: (i) permitiria um acompanhamento de pacientes, por parte de profissionais clínicos, de forma continuada, com alta densidade de informações e (ii) tornaria possível a geração de alertas em situações críticas para encaminhamento a um profissional.

Um desafio em utilizar estes dados está na multimodalidade das informações geradas. Estas podem ser de diversos tipos como texto, áudio, imagens e sinais elétricos. Uma possível solução para este problema é utilizar modelos de Aprendizado de Máquina [7]. Esta área estuda e desenvolve modelos computacionais que se ajustam a dados para realizar determinadas tarefas. Em particular, modelos preditivos supervisionados podem ser utilizados para modelar a relação entre entradas e saídas -- no problema em questão, modelar sinais capturados de um indivíduo e mapear para um ou mais sintomas. Para tanto, dados históricos podem ser utilizados para ajustar uma função de mapeamento entre estas variáveis. Modelos de aprendizado de máquina incluem árvores de decisão e redes neurais artificiais.

Diversos destes modelos podem lidar com entradas de diferentes, enquanto outros modelos podem ser utilizados para realizar transformações nas entradas de forma a homogeneizá-las por meio da criação de uma representação intermediária para uso posterior. Em particular, redes neurais profundas [8] têm sido utilizadas com sucesso para criar tais representações para imagens, áudios, textos e sinais temporais.

Assim, justifica-se este projeto pela oportunidade de explorar a aplicação de modelos recentes de aprendizado de máquina no problema de detecção de sintomas depressivos, bem como a proposição de novas metodologias.

[1] Organization WH. Preventing suicide: A global imperative. World Health Organization; 2014.

[2] Insel TR. Digital phenotyping: technology for a new science of behavior. Jama.
2017;318(13):1215–6.

[3] Campbell AT, Eisenman SB, Lane ND, Miluzzo E, Peterson RA, Lu H, et al. The rise
of people-centric sensing. IEEE Internet Comput. 2008;12(4):12–21.

[4] Harari GM, Lane ND, Wang R, Crosier BS, Campbell AT, Gosling SD. Using
smartphones to collect behavioral data in psychological science: Opportunities, practical
considerations, and challenges. Perspect Psychol Sci. 2016;11(6):838–54.

[5] Doryab A, Min JK, Wiese J, Zimmerman J, Hong J. Detection of behavior change in
people with depression. In: Workshops at the Twenty-Eighth AAAI Conference on Artificial
Intelligence. 2014.

[6] Weigold A, Weigold IK, Russell EJ. Examination of the equivalence of self-report
survey-based paper-and-pencil and internet data collection methods. Psychol Methods.
2013;18(1):53.


[7] Baltrušaitis T, Ahuja C, Morency LP. Multimodal machine learning: A survey and taxonomy. IEEE transactions on pattern analysis and machine intelligence. 2018 Jan 25;41(2):423-43.

[8] Goodfellow I, Bengio Y, Courville A, Bengio Y. Deep learning. Cambridge: MIT press; 2016 Nov 18.

Metodologia

A abordagem geral para atingir o objetivo consiste em utilizar bases de dados pré-disponibilizadas por terceiros que possuam relação com o problema e, então, selecionar, propor, aplicar e avaliar modelos de aprendizado de máquina aplicados a estas bases de dados.

Para atingir o primeiro objetivo específico, que visa coletar e curar base de dados existentes, estabelecemos duas abordagens. Primeiro, um catálogo será criado de bases de dados disponibilizadas por pesquisadores que são comumente utilizadas pela comunidade acadêmica. O principal critério de inclusão é que uma base possua multimodalidade: pelo menos mais de um tipo de dado deve compor o conjunto de variáveis independentes. Assim, por exemplo, exclui-se bases que apenas incluem textos. Estas bases estabelecerão benchmarks principais contra as quais as abordagens a serem utilizadas e desenvolvidas serão comparadas.

A segunda abordagem diz respeito à utilização de novas bases de dados. Em particular, o presente projeto alinha-se com o projeto IDEA-Tech, liderado pelo pesquisador Dr. Christian Kieling, da Universidade Federal do Rio Grande do Sul, que está coletando dados multimodais de adolescentes em conjunto com avaliações clássicas por meio de formulários. Estes novos dados permitirão a aplicação dos modelos a um problema inédito. Observa-se que o presente projeto não se envolve diretamente com os adolescentes e apenas receberá os dados anonimizados para utilização.

O segundo objetivo específico visa selecionar modelos de aprendizado de máquina adequados ao problema. Para tanto, iremos extrair da literatura modelos que possuam características que permitam a aplicação nos dados obtidos na etapa anterior de seleção de bases de dados. Modelos de aprendizado de máquina tipicamente possuem restrições no tipo de dado de entrada como no de saída e, portanto, torna-se necessária a seleção de acordo com os dados obtidos e/ou a possibilidade de transformação dos dados.

A avaliação dos modelos se dará segundo métricas comumente utilizadas na literatura de aprendizado de máquina. Para problemas de classificação, utilizar-se-á métricas como ROC-AUC, Acurácia, Precisão e Revocação. Em problemas de regressão, métricas como erro médio quadrático, erro médio absoluto e coeficiente de correlação serão utilizadas. Os diferentes modelos e métodos de treinamento, aplicados a uma mesma base de dados, serão avaliados segundo estas métricas para identificar melhores práticas. Os resultados dos melhores modelos serão inspecionados para identificar padrões nos erros que permitam melhorias no modelo ou processo de treinamento -- por exemplo, por meio da inspeção qualitativa de falsos positivos e falsos negativos. Eventuais melhorias serão reintroduzidas no passo anterior, reiniciando o processo de aplicação e avaliação.

Por fim, a escalabilidade e aplicabilidade dos modelos obtidos será discutida com profissionais da área de saúde mental, em particular os ligados ao projeto IDEA-Tech, para gerar uma discussão da utilidade prática dos modelos e seu uso no contexto deste projeto.

Indicadores, Metas e Resultados

O principal resultado esperado é o de estabelecer um conjunto de boas práticas para uso de modelos de aprendizado de máquina na tarefa de identificação de sintomas depressivos a partir de dados multimodais. Este conjunto estabelecerá os melhores modelos até o momento, os melhores processos de treinamento e métodos de uso dos dados. Fará também uma discussão da aplicabilidade destes modelos tanto no contexto de pesquisa acadêmica na área de saúde mental como no contexto de aplicação como adjuvante nas práticas clínicas.

Espera-se ainda a publicação de artigos científicos tanto na área de Computação como na área de Saúde Mental, de forma a dialogar com ambas as áreas relevantes ao projeto.

Equipe do Projeto

NomeCH SemanalData inicialData final
CHRISTIAN KIELING
RAMÁSIO FERREIRA DE MELO
RICARDO MATSUMURA DE ARAUJO34
VICTOR COSENZA VIEIRA DA SILVA

Página gerada em 26/04/2024 02:30:32 (consulta levou 0.221598s)