Search button

ESTIMATING HOUSE MARKET PRICES: A DATA-DRIVEN APPROACH ON A PORTUGUESE DATA SET

Aluno: Myke Dylan Van Ingen Palma


Resumo
Aquando deste estudo, o mercado imobiliário estava a passar por um aumento de valor sem precedentes, marcado por um consistente crescimento exponencial, com apenas algumas exceções notáveis. Prever o valor de uma propriedade poderia servir como um passo inicial para entender este mercado, beneficiando substancialmente indivíduos interessados em comprar ou vender casa. Este estudo teve como objetivo estimar valores do mercado imobiliário através da aplicação de técnicas de Data Science, utilizando fontes de dados internas e externas associadas a imóveis. De forma a atingir o objetivo acima mencionado, foi realizado um processo meticuloso de seleção e recolha de dados. Para isso uma fonte de dados de imobiliários recente e rica foi utilizada, embora deva ser salientado que, a mesma tinha a algumas limitações. Para garantir uma abordagem consistente e estruturada no desenvolvimento do projeto, foi aplicado o modelo Cross-industry standard process for data mining (CRISP-DM). Tentou-se aprofundar a compreensão do domínio do mercado imobiliário, extraindo informações da literatura existente e do conjunto de dados adquirido. Subsequentemente, os dados foram explorados com recurso a Power BI, possibilitando assim, uma análise minuciosa deste conjunto de dados. Utilizando Python, todos os dados foram agregados e pré-processados de forma a facilitar o desenvolvimento e teste de vários modelos preditivos. Por fim, o modelo que demonstrou maior precisão foi selecionado e integrado numa aplicação web Flask, permitindo interações de utilizadores com o modelo preditivo desenvolvido. Este estudo, que foi focado no mercado imobiliário português, revela que fatores internos e externos exercem uma influência significativa no valor dos imóveis. Verificou-se que variáveis internas como o número de quartos, casas de banho, o tipo de imóvel, dimensão e localização, em conjunto com variáveis externas, como a taxa Euribor e a inflação, têm correlações diretas com os preços das casas. Resultados de testes rigorosos ao modelo corroboraram a literatura existente: o algoritmo Multi-layer Perceptron revelou ser o modelo mais eficaz para estimar o valor de imóveis, apresentando uma taxa de erro notavelmente baixa, variando apenas de 2,3% a um máximo de 16,3% no pior cenário testado. Além disso, observou-se que variáveis de input neste modelo em particular exibiam interdependência, portanto mudanças numa variável influenciavam diretamente o impacto de outras variáveis no resultado do modelo.


Trabalho final de Mestrado