Aluno: Joana Martins De Sousa
Resumo
Este trabalho final de mestrado tem como propósito a previsão de vendas dos não
clientes através da informação extraída da Google e da base de dados interna da Super
Bock Group. O objeto de estudo foi o canal HORECA e os distritos de Lisboa e Porto.
Neste processo, foi também retirada o máximo de informação possível acerca dos
clientes, como por exemplo a ocupação dos seus estabelecimentos, as características que
influenciam as vendas e como se distribuem os pontos de venda e o respetivo volume nos
dois distritos.
Depois de uma limpeza e agregação dos dados dos clientes, seguiu-se para uma
análise exploratória, onde se concluiu que os estabelecimentos mais comuns são os
restaurantes e a hora de almoço a altura com maior ocupação. Em relação ao volume de
vendas, cerca de 90% dos clientes apresentam valores abaixo dos 5 milhões de litros,
havendo uma pequena quantidade entre os 5 e 28 milhões de litros.
A análise de clusters serviu para identificar as áreas com maior volume de vendas
e acrescentar valor à regressão, sendo que as zonas mais turísticas e históricas evidenciam
um volume superior, associado a um grande padrão de consumo.
A regressão linear permitiu identificar e interpretar features importantes relativas
ao volume de vendas, alternativamente, o modelo GBR alcançou previsões com menor
erro associado. Para os dois modelos foram apresentados os clientes com os maiores
registos de vendas, através do top 20 de previsões de vendas.
Trabalho final de Mestrado