Esta tese é um conjunto de estudos sobre a aplicação da ciência de dados a problemas da epidemiologia da dengue. Alavancamos modelos de aprendizado de máquina juntamente com métodos de inferência causal para dois importantes objetivos de saúde pública: (i) prever a prevalência de doenças para antecipar surtos e alocar recursos e (ii) entender os causadores de doenças para desenvolver intervenções preventivas eficazes. Usando dados sobre a prevalência de doenças, condições climáticas e comportamento humano, demonstramos como o aprendizado de máquina pode ser aplicado em três contextos diferentes: (i) para desenvolver previsões precisas de infecções nas cidades brasileiras; (ii) para generalizar as previsões para novas doenças; e (iii) como um passo intermediário para a inferência causal. No Capítulo 2, comparamos algoritmos de aprendizado de máquina para previsão de dengue e avaliamos o valor da seleção de variáveis causais. O algoritmo ideal varia entre o contexto nacional (independente de domínio) e de cidade única (domínio específico). Os modelos de conjuntos de árvores de decisão têm melhor desempenho em escala nacional. A seleção de variáveis causais tem melhor desempenho de acordo com uma das quatro medidas de erro, embora não seja o método ideal em todas as cidades. Esse resultado nos ajuda a entender melhor o custo de modelos informados pelo relacionamento causal entre as variáveis. No Capítulo 3, avaliamos a generalização dos modelos desenvolvidos no capítulo anterior. Com base na hipótese de que doenças podem ter características de séries temporais em comum, testamos a eficácia da transferência de conhecimento de doenças endêmicas para doenças novas, para melhorar as previsões quando existem poucos dados para treinamento. Comparamos algoritmos de transferência de aprendizado baseados em instâncias e em parâmetros, e avaliamos o desempenho em dados empíricos e teóricos. Os resultados sugerem que a transferência de aprendizado oferece o potencial para responder a pandemias, e que o melhor algoritmo depende da semelhança dos pares de doenças. No Capítulo 4, consideramos a contribuição do aprendizado de máquina para a inferência causal, examinando o impacto da pandemia de COVID-19 na dengue no Brasil. Estimamos a diferença entre os casos de dengue esperados e os observados, usando um desenho de estudo de série temporal interrompida. Também separamos os impactos do clima, das mudanças na vigilância devido à pandemia, da suscetibilidade humana e da mobilidade. Descobrimos que há uma variação considerável em todo o país, tanto no impacto geral da pandemia quanto na importância relativa das causas principais. Essa análise ajuda a esclarecer as lacunas de dados causadas pela pandemia de COVID-19 e achar possíveis alvos de intervenção para controlar a dengue no futuro.
scite is a Brooklyn-based organization that helps researchers better discover and understand research articles through Smart Citations–citations that display the context of the citation and describe whether the article provides supporting or contrasting evidence. scite is used by students and researchers from around the world and is funded in part by the National Science Foundation and the National Institute on Drug Abuse of the National Institutes of Health.
customersupport@researchsolutions.com
10624 S. Eastern Ave., Ste. A-614
Henderson, NV 89052, USA
This site is protected by reCAPTCHA and the Google Privacy Policy and Terms of Service apply.
Copyright © 2024 scite LLC. All rights reserved.
Made with 💙 for researchers
Part of the Research Solutions Family.