Search button

Machine Learning Frameworks for Retention Models: An Application to a Motor Insurance Portfolio

Aluno: Diana Alexandra Montrond


Resumo
No mercado de seguradoras, prever a retenção é uma etapa importante para definir estratégias de forma a obter mais clientes, tal como, entender possíveis características que possam prever o cancelamento dos clientes atuais. Sendo assim, existe a necessidade de obter modelos mais eficientes e rigorosos para a necessidades do mercado. Este projeto é uma dessas tentativa pois seleciona três modelos diferentes para serem comparados e escolhe o que têm melhor resultados. Os três modelos selecionados são: Um pertence ao Modelos Lineares e Generalizados (GLM), a Regressão Logística, e dois modelos de Machine Learning Algorithms, o Extreme Gradient Boosting (xGBoost) e o Light Gradient Boost (Light GBM). Para avaliar os modelos, classificações como Area Under the Curve (AUC), Receiver Operating Characteristic Curve (ROC Curve) e Exatidão são usados tal como o Teste de McNemar. Este relatório também investiga maneiras de aprofundar o conhecimento da carteira de seguro de automóvel, realizando uma Análise Exploratória dos Dados. Métodos de Feature Enginering foram usados para lidar com problemas de valores omissos e variáveis categóricas. Com objetivo de melhor os dados, foi sugerido dois tipos de métodos para a divisão de treino e teste. Nesta análise foi descoberto que o método mais eficiente de divisão de treino e teste é selecionar aleatoriamente $80\%$ de cada mês para toda a base de dados como conjunto de treino e o restante como conjunto de teste. Também se encontrou o melhor modelo de demanda que é o Light Gradient Boost, com diferenças mínimas do Extreme Gradient Boosting. Os modelos de Machine Learning Algorithms obtiveram resultados mais significativos que a tradicional Regressão Logística. A comparação dos modelos foi bem-sucedida em desvendar as diferenças entre os modelos.


Trabalho final de Mestrado