Para a realização desta tese diversas pessoas e entidades tiveram diferentes níveis de participação. Embora não seja possível enumerá-las todas, gostaria de expressar um agradecimento especial àquelas que contribuíram de forma mais direta e decisiva para o cumprimento deste objetivo.Primeiramente, quero agradecer às minhas orientadoras, pela disponibilidade, sugestões e esclarecimentos prestados durante a realização desta tese.À Fundação Calouste Gulbenkian, pelo financiamento do curso e acompanhamento do meu percurso académico, sem os quais não me seria possível frequentar um programa de Doutoramento em Matemática na Universidade de Aveiro.À minha mãe e irmãs, pelo incentivo e apoio incondicional.Aos colegas e amigos que me acolheram neste país: Muito obrigado! palavras-chave dados censurados, regressão linear, autocorrelação, análise bayesiana, amostrador de Gibbs, ampliação de dados, dados multivariados
ResumoO problema de estimar modelos de regressão linear (RL) para dados censurados com erros autocorrelacionados surge em muitos estudos ambientais e sociais. Além disso, frequentemente, os problemas da vida real requerem a modelação de várias variáveis de resposta em simultâneo. O presente trabalho propõe métodos para estimar modelos de regressão linear para dados censurados no contexto de séries temporais e dados multivariados. Os métodos baseiam-se na criação de conjunto de dados completos através da imputação das observações censuradas, que é a estratégia mais amplamente utilizada quando estamos perante dados omissos ou censurados. No contexto de dados de séries temporais univariadas, utilizou-se uma abordagem bayesiana para estimar modelos de regressão censurados com erros autoregressivos AR(p). Esta abordagem considera o amostrador Gibbs com ampliação de dados (GDA), na qual, em cada iteração, são simulados tanto os parâmetros do modelo como as variáveis latentes. Para o cálculo da distribuição a posteriori, aplicou-se uma transformação adequada da variável latente, o que permitiu a obtenção da função de verosimilhança completa para o modelo. O estudo de simulação realizado mostra que a abordagem proposta produz estimativas com uma elevada precisão mesmo em cenários em que a proporção de observações censuradas é grande. Métodos de diagnóstico e seleção de modelos para dados censurados e autocorrelacionados são propostos e ilustrados num conjunto dados reais. No contexto de dados multivariados, propuseram-se três métodos de estimação baseados na ampliação de dados, nomeadamente, o algoritmo EM (Expectation Maximization), o algoritimo de ampliação de dados usando a abordagem clássica (DA) e o algoritmo GDA. Por meio de estudo de simulação, estudaram-se as propriedades assintóticas das estimativas, concluindo-se que as estimativas produzidas por DA e GDA são consistentes para correlação baixa e moderada. Além disso, desenvolveu-se um procedimento para calcular diferenças parciais de dados multivariados, o que permitiu deduzir a função de verosimilhança e distribuição a posteriori para o modelo de regressão m...