Google

Aviso: Se está a ler esta mensagem, provavelmente, o browser que utiliza não é compatível com os "standards" recomendados pela W3C. Sugerimos vivamente que actualize o seu browser para ter uma melhor experiência de utilização deste "website". Mais informações em webstandards.org.

Warning: If you are reading this message, probably, your browser is not compliant with the standards recommended by the W3C. We suggest that you upgrade your browser to enjoy a better user experience of this website. More informations on webstandards.org.

Trabalho Final de Mestrado

Ano Lectivo: 2018/2019
Aluno: JOÃO MANUEL FRANCO VIEIRA (49286)
Mestrado: Econometria Aplicada e Previsão
Tipo: Dissertação
Título do Trabalho Final de Mestrado: Análise de Modelos de Regressão Binária com Eventos Raros
Sub Título:
Comentário: -
Instituição: -
Homologação: Dia 06/11/2019 às 16:57 por NUNO JOÃO DE OLIVEIRA VALÉRIO

Resumo

Nesta dissertação serão abordadas duas estratégias para lidar com eventos raros em variáveis dependentes binárias: a seleção amostral com base na variável dependente e a aplicação de modelos flexíveis. Enquanto que na primeira estratégia a proporção de eventos raros é inflacionada artificialmente na amostra usada para estimação, na segunda estratégia utilizam-se modelos cuja capacidade de descrição dos dados é potencialmente superior aos modelos binários standard (tipicamente o logit e o probit). Para estudar qual das opções será melhor empiricamente foi realizado um estudo de simulação avaliando vários aspetos destes modelos, como a capacidade preditiva e a dificuldade computacional na sua implementação. Neste estudo observou-se que a estimação dos modelos flexíveis era mais instável, apresentando mais dificuldade na sua implementação. Por outro lado, quando se realiza seleção amostral é necessário ter uma boa dimensão amostral para se notarem os efeitos desta seleção na probabilidade de uma observação pertencer ao conjunto dos uns. Tendo em conta os resultados do estudo de simulação, é recomendado utilizar a seleção amostral com correção, para ter em conta a alteração da probabilidade dos eventos. Recomenda-se, adicionalmente, que a amostra utilizada para a estimação contenha entre 20% a 35% de uns para não se perder informação que possa estar contida no zeros, caso a amostra tenha uma dimensão pequena/média, ou  50% caso se tenha uma amostra com uma grande dimensão. (Português)


In this dissertation we will address two strategies for dealing with rare events that occur in binary dependent variables: sample selection based on the dependent variable and the application of flexible models. While the first strategy changes the proportion of rare events artificially, the second strategy uses models that, potentially, describe the data more properly than the standard binary models (for example, the logit and the probit). In order to study which of the options will be empirically better, a simulation study was conducted, evaluating several aspects of this models, such as predictive ability and computational difficulty in their execution. In this study, the estimation of flexible models was more unstable, presenting more difficulty in their implementation. On the other hand, when sample selection is performed, it is required a large sample size to observe the effects of this selection on the probability of an observation belonging to the set of events. Taking into account the results of our simulation, it is recommended to use sample selection with correction, to account for the change in the probability of an event. In addition, it is recommended that the sample used for estimation contains between 20% to 35%  of occurrences to avoid loosing information that may be contained in the zeros if the sample has a small/medium size, or 50% if a large sample is available.
(Inglês)

Palavras-chave

Choise-Based Sampling, Eventos Raros, Logit, Funções Link, Probit (Português)

Choise-Based Sampling, Logit, Probit, Link Functions, Rare Events (Inglês)

Resumo Alargado

resumo.pdf (78KB)

Trabalho Final de Mestrado

tese final.pdf (1,2MB)

Data da Prova Pública

Data da Prova Pública: 28-11-2019 10:30
Voltar