Search button

Utilização de modelos de aprendizagem automática para previsão do preço de Airbnb em Lisboa

Aluno: Dinis Duarte Salgueirinho


Resumo
A economia de partilha surgiu há cerca de vinte anos. Era difícil prever a sua importância para muitos setores, mas, atualmente, está intimamente incorporada no nosso quotidiano. O Airbnb é um excelente exemplo deste fenómeno, uma vez que introduziu um novo modelo de negócio para o sector da hotelaria. Deste modo, prever com precisão uma variável contínua, como o preço, em anúncios do Airbnb tem sido um tema de elevada importância. Este documento analisa uma amostra de 19651 anúncios em Lisboa do InsideAirbnb.com, com o objetivo de criar um modelo de previsão de preços com recurso a técnicas de aprendizagem automática. Inicialmente, é realizada uma limpeza e pré-processamento dos dados, seguida de análises descritivas, prescritivas e exploratórias para compreender a natureza dos dados e identificar atributos importantes para a previsão de preços. Mesmo após a limpeza, valores atípicos são detetados e removidos do conjunto de dados. Por fim, aplicámos modelos que vão desde a regressão linear a modelos de Machine Learning. Desta forma, não só selecionámos o XGBoost como o melhor modelo para a previsão de preços com R2 de 0.6225, mas também identificamos as características que têm significância estatístico para a variável dependente preço.


Trabalho final de Mestrado