Nome do Projeto
Avaliação do pressuposto INSIDE em estudos de randomização mendeliana
Ênfase
Pesquisa
Data inicial - Data final
14/03/2022 - 10/03/2023
Unidade de Origem
Coordenador Atual
Área CNPq
Multidisciplinar
Resumo
Randomização Mendeliana (RM) é uma metodologia que vem sendo cada vez mais utilizada para fortalecer o processo de inferência causal em estudos observacionais. O pressuposto conhecido por INSIDE (INstrument Strength Independent of Direct Effet assumption) é uma das principais condições necessárias para que estimadores de RM forneçam resultados válidos. Neste projeto, através de argumentos teóricos e simulações, a utilidade de testes estatísticos de heteroscedasticidade (ou seja, variância não-constante) para empiricamente avaliar a plausibilidade deste pressuposto.
Objetivo Geral
Estudar se testes estatísticos de heterogeneidade são úteis para avaliar empiricamente a plausibilidade do pressuposto INSIDE em estudos de RM.
Justificativa
Um dos grandes desafios para inferência causal em estudos epidemiológicos observacionais é a possibilidade de confundimento residual, que existe pois a exposição (e.g., fator de risco) não é alocado aleatoriamente. Uma forma de obter inferências válidas nestes casos são as análises de VI. Uma forma de análise de VI que tem sido aplicada cada vez mais nos últimos anos é conhecida por RM, na qual variantes genéticas são utilizadas como VIs. Com o advento e crescente desenvolvimento desta metodologia, juntamente com a disponibilidade cada vez maior de dados genéticos em estudos epidemiológicos, a RM se tornou uma estratégia frequentemente utilizada para fortalecer o processo de inferência causal.
Apesar de útil, a RM têm seus próprios pressupostos. Um deles é conhecido como restrição de exclusão, que postula que todas as VIs utilzadas na análise (no caso de RM, variantes genéticas) não afetem o desfecho (e.g., uma doença) a não ser por mecanismos totalmente mediados pela exposição (e.g., um fator de risco). Quando múltiplas VIs são utilizadas, é possível utilizar uma versão menos exigente deste pressuposto utilizando um estimador conhecido como MR-Egger. Este estimador fornece estimativas consistentes do efeito causal mesmo que todas as variantes genéticas violem o pressuposto de restrição de exclusão, caso esta violação aconteça de forma específica. Mais precisamente, se os efeitos diretos das VIs sobre o desfecho forem independentes (do ponto de vista estatístico) da associação associação entre as VIs e a exposição, os resultados serão consistentes. Esta versão menos exigente do pressuposto de restrição de exclusão é conhecida como INSIDE.
Além do MR-Egger, outros estimadores comumente utilizados em RM também requerem que esta condição seja atingida. Porém, já foi demonstrado que o pressuposto INSIDE não é empiricamente verificável. De forma geral, em inferência causal (não apenas no contexto de RM ou análise de VI), é impossível atribuir padrões observados nos dados a algum viés ou a relações causais genuínas sem que pressupostos adicionais sejam invocados. Isto é uma consequência do problema fundamental da inferência causal.
Porém, a impossibilidade de atribuir com 100% de certeza que determinado padrão se deve ou não a viés não significa que não seja possível desenvolver ferramentas que permitam avaliar, com algum grau (preferencialmente baixo) de incerteza a plausibilidade de determinado pressuposto. Por exemplo, é possível que um teste indique a presença de alguns casos de determinado viés, mas não de outros. Neste caso, se a hipótese nula for rejeitada, há evidência de viés. Porém, se a hipótese nula não for rejeitada, não significa necessariamente que não exista viés, pois este pode estar acontecendo de forma indetectável pelo método em questão.
O presente projeto se propõe a desenvolver um método parcial de detecção de violações da condição INSIDE para contribuir na avaliação empírica da plausibilidade dos pressupostos necessários para inferência causal válida através de RM.
Apesar de útil, a RM têm seus próprios pressupostos. Um deles é conhecido como restrição de exclusão, que postula que todas as VIs utilzadas na análise (no caso de RM, variantes genéticas) não afetem o desfecho (e.g., uma doença) a não ser por mecanismos totalmente mediados pela exposição (e.g., um fator de risco). Quando múltiplas VIs são utilizadas, é possível utilizar uma versão menos exigente deste pressuposto utilizando um estimador conhecido como MR-Egger. Este estimador fornece estimativas consistentes do efeito causal mesmo que todas as variantes genéticas violem o pressuposto de restrição de exclusão, caso esta violação aconteça de forma específica. Mais precisamente, se os efeitos diretos das VIs sobre o desfecho forem independentes (do ponto de vista estatístico) da associação associação entre as VIs e a exposição, os resultados serão consistentes. Esta versão menos exigente do pressuposto de restrição de exclusão é conhecida como INSIDE.
Além do MR-Egger, outros estimadores comumente utilizados em RM também requerem que esta condição seja atingida. Porém, já foi demonstrado que o pressuposto INSIDE não é empiricamente verificável. De forma geral, em inferência causal (não apenas no contexto de RM ou análise de VI), é impossível atribuir padrões observados nos dados a algum viés ou a relações causais genuínas sem que pressupostos adicionais sejam invocados. Isto é uma consequência do problema fundamental da inferência causal.
Porém, a impossibilidade de atribuir com 100% de certeza que determinado padrão se deve ou não a viés não significa que não seja possível desenvolver ferramentas que permitam avaliar, com algum grau (preferencialmente baixo) de incerteza a plausibilidade de determinado pressuposto. Por exemplo, é possível que um teste indique a presença de alguns casos de determinado viés, mas não de outros. Neste caso, se a hipótese nula for rejeitada, há evidência de viés. Porém, se a hipótese nula não for rejeitada, não significa necessariamente que não exista viés, pois este pode estar acontecendo de forma indetectável pelo método em questão.
O presente projeto se propõe a desenvolver um método parcial de detecção de violações da condição INSIDE para contribuir na avaliação empírica da plausibilidade dos pressupostos necessários para inferência causal válida através de RM.
Metodologia
Uma forma comum de análise de RM quando há múltiplas VIs é utilizando dados sumarizados. Ou seja, estimativas de efeito causal são obtidas comparando coeficientes da associação entre cada variante genética e a exposição (betaX), e os coeficientes da associação entre cada variante genética e o desfecho (betaY). O foco deste projeto será em análises de RM utilizando dados sumarizados, que é o contexto no qual o método MR-Egger pode ser aplicado.
O estudo se divide em três principais eixos:
1) Identificar padrões na presença de: i) violação parcial do pressuposto INSIDE (ou seja, algumas, mas nem todas, as variantes genéticas violam estre pressuposto); ii) violação heterogênea do pressuposto INSIDE (ou seja, todas as variantes violam este pressuposto, mas a direção e/ou magnitude difere entre subgrupos de variantes); iii) violação homogênea do pressuposto INSIDE (ou seja, todas as variantes violam este pressuposto na mesma direção e/ou magnitude). Resultados preliminares indicam que, nos casos i) e ii), existe heteroscedasticidade no gráfico de dispersão em que os coeficientes betaX e betaY são plotados nos eixos horizontal e vertical, respectivamente.
2) Descrever estes padrões matematicamente, baseando-se em modelos paramétricos geradores de dados tipicamente adotados na literatura.
3) Através de estudos de simulação, avaliar se testes estatísticos de heteroscedasticidade detectam violações do pressuposto INSIDE, ao menos nos casos i) e ii).
4) Ilustrar a aplicação prática do método re-analisando dados publicamente disponíveis.
O estudo se divide em três principais eixos:
1) Identificar padrões na presença de: i) violação parcial do pressuposto INSIDE (ou seja, algumas, mas nem todas, as variantes genéticas violam estre pressuposto); ii) violação heterogênea do pressuposto INSIDE (ou seja, todas as variantes violam este pressuposto, mas a direção e/ou magnitude difere entre subgrupos de variantes); iii) violação homogênea do pressuposto INSIDE (ou seja, todas as variantes violam este pressuposto na mesma direção e/ou magnitude). Resultados preliminares indicam que, nos casos i) e ii), existe heteroscedasticidade no gráfico de dispersão em que os coeficientes betaX e betaY são plotados nos eixos horizontal e vertical, respectivamente.
2) Descrever estes padrões matematicamente, baseando-se em modelos paramétricos geradores de dados tipicamente adotados na literatura.
3) Através de estudos de simulação, avaliar se testes estatísticos de heteroscedasticidade detectam violações do pressuposto INSIDE, ao menos nos casos i) e ii).
4) Ilustrar a aplicação prática do método re-analisando dados publicamente disponíveis.
Indicadores, Metas e Resultados
Com base em resultados preliminares, espera-se que testes de heteroscedasticidade permitem detectar violações do pressuposto INSIDE, ao menos em algumas situações. Portanto, não é esperado que o teste seja uma ferramenta infalível para avaliação empírica deste pressuposto, mas sim uma ferramenta complementar útil, a ser utilizada em conjunto com outras estratégias.
A partir dos resultados encontrados, será elaborado um artigo científico contendo os argumentos teóricos, os resultados do estudo de simulação e da re-análise de dados empíricos. Dado o uso cada vez mais frequente de RM, este artigo tem grande potencial de impacto científico, contribuindo para fortalecer o processo de inferência causal através de RM.
A partir dos resultados encontrados, será elaborado um artigo científico contendo os argumentos teóricos, os resultados do estudo de simulação e da re-análise de dados empíricos. Dado o uso cada vez mais frequente de RM, este artigo tem grande potencial de impacto científico, contribuindo para fortalecer o processo de inferência causal através de RM.
Equipe do Projeto
Nome | CH Semanal | Data inicial | Data final |
---|---|---|---|
FERNANDO PIRES HARTWIG | 1 |