Google

Aviso: Se está a ler esta mensagem, provavelmente, o browser que utiliza não é compatível com os "standards" recomendados pela W3C. Sugerimos vivamente que actualize o seu browser para ter uma melhor experiência de utilização deste "website". Mais informações em webstandards.org.

Warning: If you are reading this message, probably, your browser is not compliant with the standards recommended by the W3C. We suggest that you upgrade your browser to enjoy a better user experience of this website. More informations on webstandards.org.

Trabalho Final de Mestrado

Ano Lectivo: 2019/2020
Aluno: ZHIFENG XU (51019)
Mestrado: Actuarial Science
Tipo: Estágio
Título do Trabalho Final de Mestrado: Best Practice of Risk Modelling in Motor Insurance - Using GLM and Machine Learning Approach
Sub Título:
Comentário: -
Instituição: Liberty Mutual Insurance
Homologação: Dia 04/09/2020 às 15:45 por NUNO JOÃO DE OLIVEIRA VALÉRIO

Resumo

O pricing na atividade seguradora está a tornar-se cada vez mais interessante e desafi- ador pelo facto de a dimensão dos dados a analisar estar a crescer de forma explosiva. Torna-se assim urgente para as seguradoras reconsiderar a forma de lidar com este vol- ume de dados.
Para implementar modelos sofisticados de pricing para produtos de seguro automóvel, aplicámos técnicas de machine learning, incluindo modelos GLM penalizados e métodos de boosting, que ajudam a identificar as características mais importantes de entre uma grande quantidade de variáveis candidatas. Estes métodos também permitem detetar potenciais interações sem testar as inúmeras combinações bidimensionais. Para um uso eficiente desses métodos, é necessário compreender o objetivo do modelo, as hipóteses que o suportam e dominar as metodologias estatísticas.
Embora haja alguma evidência de um maior poder preditivo dos modelos baseados em machine learning quando comparados com os tradicionais GLM, estes últimos beneficiam de uma estrutura, mais conveniente e mais interpretável. O modelo GLM é mais fácil de ex- plicar às partes interessadas o que nos levou a utilizar os GLM na modelação do risco, mas absorvendo os ensinamentos dados pelos modelos de machine learning.
A avaliação dos modelos é realizada pela análise dos resíduos quer na fase de treino quer de validação quer ainda de teste.
Após a revisão pela equipa, aplicam-se alguns ajustes em cada modelo para reforçar a sua significância e a sua robustez. Espera-se que eles tenham alto poder preditivo nos dados fora da amostra e possam, portanto, ser usados no futuro.
(Português)

Insurance pricing nowadays is getting more and more interesting and challenging due to the fact that the dimension of analysable data is evolutionarily exploding. It is an urgent call for insurers to reconsider how to deal with the data more accurately and precisely. To implement pricing sophistication in motor insurance products, we apply cutting edge machine learning techniques including penalized GLM and boosting methods, which help us identify the important features among massive amount of candidate variables, and detect potential interactions without trying the endless two-way combinations manually. In order to sufficiently make use of these methods, we need to deeply understand the research objective, preliminary assumptions and statistical backgrounds.
Although there is some evidence indicating the existence of higher predictive power of machine learning models compared with traditional GLM (Generalized Linear Models), GLM is more convenient and interpretable, especially for multiplicative models. GLM model is easier to be demonstrated to stakeholder, therefore we still achieve our risk models in GLM, but absorbing the insights from our machine learning results.
The evaluation of models is done by progression, it is generally performed by residual analysis of the training or validation dataset, and testing errors for the holdout dataset. After peer review, we apply some adjustment in each model, to get models that are significant and robust. They are expected to have high predictive power in the out-of- sample data, thus can be used in the future.
(Inglês)

Palavras-chave

seguro automóvel, machine learning, modelos sofisticação de pric- ing, modelos GLM penalizados, boosting, GLM, análise dos resíduos, treino, validação, teste (Português)

motor insurance, machine learning, pricing sophistication, penalized GLM, boosting, GLM, residual analysis, training, validation, holdout (Inglês)

Resumo Alargado

O Resumo Alargado ainda não foi submetido.

Trabalho Final de Mestrado

TFM_Zhifeng_Xu_28_Sep_2020.pdf (1,9MB)

Data da Prova Pública

Data da Prova Pública: 28-09-2020 11:00
Voltar