Google

Aviso: Se está a ler esta mensagem, provavelmente, o browser que utiliza não é compatível com os "standards" recomendados pela W3C. Sugerimos vivamente que actualize o seu browser para ter uma melhor experiência de utilização deste "website". Mais informações em webstandards.org.

Warning: If you are reading this message, probably, your browser is not compliant with the standards recommended by the W3C. We suggest that you upgrade your browser to enjoy a better user experience of this website. More informations on webstandards.org.

Trabalho Final de Mestrado

Ano Lectivo: 2018/2019
Aluno: FRANCISCO FERNANDES CORREIA DO CANTO MONIZ (49623)
Mestrado: Actuarial Science
Tipo: Estágio
Título do Trabalho Final de Mestrado: Healthcare Provider efficiency in Workers' Compensation - An approach with Machine Learning
Sub Título:
Comentário: -
Instituição: Fidelidade - Companhia de Seguros, SA
Homologação: Dia 28/10/2019 às 20:19 por NUNO JOÃO DE OLIVEIRA VALÉRIO

Resumo

O ramo de Acidentes de Trabalho é uma linha de negócio obrigatória e com bastante competitividade.  Nos últimos anos, temos observado um crescimento na popularidade de "Data Science" e esta transformação passa também por atualizar os modelos e processos internos aplicados em seguros.
Após um Acidente de Trabalho, é recomendado ao beneficiário um prestador clínico para acompanhar o seu tratamento.
Usando várias variáveis sociais e patológicas modelamos custos médicos e de transportes, dependendo estes do prestador clínico principal do lesado. Esta metodologia permite que os gestores de sinistros tenham acesso não só à melhor recomendação como também a uma estimativa de custos.
Os modelos de custo esperado e frequência foram desenvolvidos usando o algoritmo "Extreme Gradient Boosting" em vez de modelos mais tradicionais como os GLM. Este é um algoritmo de "Machine Learning" útil para previsão tanto em regressão como em classificação. Para problemas com muitos dados, este algoritmo tende a prever com maior precisão e rapidez.
Para uma utilização eficaz do modelo as variáveis categóricas são codificadas em numéricas através de "target encoding". Isto é, as observações são agrupadas de acordo com os níveis da variável e com o ano de ocorrência, e é calculada a média da variável de resposta para cada nível com as observações dos 3 anos antecedentes.
Por fim, para avaliar o valor acrescentado do modelo desenvolvido, calculamos os custos incorridos caso optássemos pela recomendação em prática. A nova recomendação consegue poupar até 1,7 milhões de euros por ano entre despesas médicas e de transportes.
(Português)

Workers' Compensation is a mandatory and very competitive Line of Business (LoB) for Insurance Companies. Companies cannot raise premiums too much from fear of losing market share, but they also cannot lower them as it needs to be financially viable. With the growing popularity of Data Science models, internal processes are being adapted to more precise and advanced models.
Following a work accident, a healthcare provider is recommended to the injured workers.
It was our main objective in this internship to optimize this recommendation system. Our solution provides an estimate of medical and transportation cost which depends on the healthcare provider. With this project, claim managers can have access to the most efficient healthcare unit, as well as an estimate of the corresponding liability.
Models for the cost were developed using Extreme Gradient Boosting (XGB) as an alternative to the staple, Generalized Linear Models (GLM). By changing the loss function we applied XGB to both regression and classification problems and achieved more precise predictions.
To encode categorical variables in numerical values, we developed an algorithm that groups costs according to each level of a variable for the past 3 years and then computes its average. This encoding technique is similar to target encoding.
To assess the added value of this model, we compute the costs for the current recommendation applied. The new recommendation recognizes cheaper alternatives and predicts savings in total expenses of up to 1,7 million Euros.
(Inglês)

Palavras-chave

Machine  Learning, Regressão, Boosting trees, Sistemas de Recomendação, Atribuição de Pacientes, Acidentes de Trabalho (Português)

Machine Learning, Regression, Boosting trees, Recommendation System, Patient Attribution, Workers' Compensation (Inglês)

Resumo Alargado

O Resumo Alargado ainda não foi submetido.

Trabalho Final de Mestrado

TFM_FRANCISCO_MONIZ.pdf (1,6MB)

Data da Prova Pública

Data da Prova Pública: 05-12-2019 17:30
Voltar