O mercado imobiliário é um dos temas mais complexos da economia. As principais dificuldades de análise provêm das características especiais de imóveis, que não são homogêneas, mas, ao contrário, são compostos por um conjunto de atributos, impedindo a comparação direta das unidades (González, 1997). A Engenharia de avaliações tem a finalidade de tomar decisões acerca de valores, custos, investimentos que envolvam bens de qualquer natureza, dentre elas imóveis.
Segundo González (1997), para que seja feita a avaliação de imóveis, o avaliador deve estar imprescindivelmente bem informado a respeito de aspectos econômicos, uma vez que o valor de um bem é associado pelo valor atribuído pelo mercado onde ele é tratado. O profissional deverá também, além de dominar apetrechos matemáticos, saber a performance do mercado no qual se situa o imóvel a ser avaliado.
Segundo Dantas (2011), a Engenharia de Avaliações é de grande interesse para os diversos agentes do mercado imobiliário, sendo eles: imobiliárias, bancos de crédito imobiliário, compradores ou vendedores de imóveis. E também para empresas seguradoras, o poder judiciário, os fundos de pensão, os incorporadores, os construtores, prefeituras, etc. A Engenharia de Avaliações é uma das mais complexas especialidades, e se faz necessário não apenas os conhecimentos da Engenharia, mas também em outras áreas das ciências exatas da natureza, como também das ciências sociais.
O valor de um imóvel oferecido à venda não será necessariamente o valor final no qual foi negociado. De acordo com a NBR 14653-2, o valor de mercado é a quantia mais provável pela qual se negociaria voluntariamente e conscientemente um bem, numa data de referência, dentro das condições do mercado vigente. Ou seja, o valor do mercado é uma projeção do valor a ser negociado, sendo o resultado de uma modelagem de dados, que provém de coletas de amostras contendo os preços de imóveis semelhantes aos que está sendo negociado.
A metodologia mais adequada para a avaliação de imóveis irá depender das condições mercadológicas, pelas informações coletadas, e pela natureza do trabalho que será desenvolvido. Segundo as diretrizes fixadas na norma NBR14653-1, Avaliação de Bens – Parte 1: Procedimentos gerais - os principais métodos para identificação do valor de um bem, de seus frutos e direitos são:
De acordo com a NBR 14653-2:2011, o método comparativo direto de dados do mercado consiste em obter uma amostra representativa de dados de mercado de imóveis com características, tanto quanto possível, semelhantes às do bem avaliado, usando-se toda a evidência disponível.
O modelo de regressão linear múltipla deve ser adotado quando há uma relação envolvendo mais de duas variáveis (Draper; Smith, 1998). Segundo Dantas (2011), o modelo de regressão linear múltipla deve ser utilizado para explicar a variabilidade dos preços no mercado, uma vez que há uma multiplicidade de fatores que interferem no preço de um bem.
Neste trabalho, foi utilizado a Regressão Linear Múltipla como ferramenta para determinar o valor venal de imóveis urbanos, e posteriormente comparou-se com o real valor que já foi estimado para venda para um apartamento. Foram utilizados os dados amostrais da Caixa Econômica Federal com o auxílio da GIHAB (Gerencia de habitação), onde verificou-se uma proximidade entre o valor estimado para a venda do imóvel.
A escolha do tema para o presente estudo é importante para mostrar o quão pode ser amplo a aplicabilidade dos métodos estatísticos no dia-a-dia, em especial neste caso o método da regressão linear. Ela foi utilizada para estudar a variabilidade dos preços no mercado imobiliário, para posterior previsão do valor venal do imóvel.
Os dados amostrais foram obtidos juntamente à Caixa Econômica Federal, com o auxílio da GIHAB (Gerencia de habitação) da CEF. O imóvel que nos serviu de objeto de estudo é um apartamento que se situa no bairro Santa Mônica na cidade de Uberlândia, sendo que é no 2° andar do prédio com 4 andares; ele nos serviu como base para compararmos o valor que foi vendido e o valor que foi predito de acordo com o modelo escolhido nesse presente trabalho. Todo o trabalho foi realizado com o auxílio do software estatístico R.
A variável dependente y de nosso objeto de estudo é y = Valor unitário do imóvel, que é uma variável quantitativa. As variáveis independentes que a princípio foram escolhidas para análise no modelo de regressão são no total de 16. São elas:
A análise de regressão é um método estatístico que estuda a relação entre duas ou mais variáveis, sendo que a regressão linear simples tem como objetivo estabelecer uma relação funcional somente entre duas variáveis envolvidas, de tal forma que há uma variável dependente y e uma variável independente (ou explicativa), e a regressão linear múltipla estuda a relação entre várias variáveis independentes.
A equação de regressão expressa uma relação entre x (variável independente) e y (variável dependente). A equação típica de uma reta ŷ = mx + b é expressa na forma y = β0 + β1xi + ɛ, sendo que β0 e β1 são parâmetros desconhecidos.
Onde:
y é o valor da variável dependente (resposta)
β0 é o intercepto;
β1 é a inclinação;
xi é o valor da variável independente;
ɛ é o erro associado ao modelo;
Diferente da regressão linear simples, no qual se pretende estudar a relação entre duas variáveis quantitativas, a regressão linear múltipla expressa uma relação linear entre uma variável dependente e várias outras variáveis independentes explicativas (Draper; Smith, 1998). Quando um modelo de regressão múltipla é bem ajustado em relação aos dados amostrais, ele pode ser utilizado como método para previsões.
A notação geral da equação de regressão múltipla estimada é:
ŷ = β0 + β1x1 + β2x2 + ... + βkxk + ɛ,
onde:
k = número de variáveis independentes;
ŷ = valor previsto de y (calculado com o uso da regressão múltipla);
x1, x2, ..., xk são as variáveis independentes;
β0 = intercepto y, ou valor de y quando todas as variáveis previsoras são 0 (valor de parâmetro populacional);
β1, β2, ... βk são os coeficientes das variáveis previsoras x1, x2, ..., xk ;
O método de Stepwise é muito utilizado em regressão linear para a seleção de variáveis. Nele, um teste F é utilizado considerando que os erros tenham distribuição normal. Após cada incorporação de uma variável, há uma etapa em que uma das variáveis já selecionada seja descartada, e o procedimento finaliza quando não há mais variável a ser descartada ou incluída.
A equação de regressão apresenta uma reta que melhor se ajusta aos dados. Para descobrir qual é a melhor reta, utiliza-se o critério das distâncias verticais entre os pontos dos dados originais com a reta de regressão. Essas distâncias são chamadas de resíduos. Em uma amostra de dados (x,y), o resíduo é a diferença entre um valor amostral observado e o valor previsto ao usar a equação de regressão (y - ŷ). A reta irá satisfazer a propriedade dos mínimos quadrados se a soma dos quadrados dos resíduos for a menor possível.
O coeficiente de determinação múltipla representa o coeficiente de determinação múltipla, que é uma medida de quão bem a equação de regressão múltipla se ajusta aos dados amostrais (Triola, 2005). Um ajuste perfeito resultaria em 1 e quanto mais próximo de 1, mais a equação de regressão se ajusta aos dados.
Para Draper & Smith (1998), o coeficiente de determinação ajustado é da forma:
Onde n é o tamanho da amostra e p é a quantidade de parâmetros do modelo.
A análise de variância (ANOVA) é um método utilizado para se testar a hipótese de igualdade entre três ou mais populações, ou seja, verificar se existe uma diferença significativa entre as médias e a influência dos fatores nas variáveis dependentes. A hipótese nula (H0) é que as médias são iguais, e a hipótese alternativa (H1) significa que pelo menos uma das médias difere das outras.
Éimprescindível testar a análise dos resíduos para o modelo a ser ajustado, uma vez que irá refletir em mais qualidade no ajuste e confiabilidade dos testes estatísticos sobre os parâmetros.Para a análise formal dos resíduos, utilizaremos os testes de Shapiro-Wilk para testar a normalidade dos resíduos, Durbin-Watson para independência e Breusch-Pagan para homoscedasticidade. Abaixo, o detalhamento de cada um dos testes a serem aplicados.
i. Normalidade dos resíduos – Shapiro-Wilk
O método de Shapiro-Wilk testa a normalidade dos resíduos, auxiliando assim a análise acerca do ajuste do modelo de regressão. Sua hipótese nula é que a população segue distribuição normal. Caso o p-valor calculado seja menor do que a significância (α), a hipótese nula é rejeitada e conclui-se que há evidências suficientes para afirmar que a população em estudo não segue distribuição normal. Caso contrário, a população seguirá distribuição normal.
ii. Independência dos resíduos – Durbin–Watson
O teste de Durbin–Watson é usado para testar a presença de autocorrelação entre os resíduos de uma análise de regressão. É baseado na suposição de que os erros do modelo são gerados por um processo autoregressivo de primeira ordem. Sua estatística é da´da por:
Sendo que:
Sua hipótese nula é que os resíduos do modelo não apresentam autocorrelação serial de ordem 1. Caso o p-valor calculado seja menor do que a significância (α), a hipótese nula é rejeitada e conclui-se que há evidências suficientes para afirmar que os resíduos são dependentes, ou seja, apresentam autocorrelação serial de ordem 1; Caso contrário, os resíduos são independentes.
iii. Homoscedasticidade dos resíduos – Breusch-Pagan
O teste de Breusch-Pagan é usado para testar a homoscedasticidade dos resíduos do modelo de regressão linear. Sua hipótese nula tem como base de que as variâncias dos erros são iguais, e é indicado para amostras grandes e quando a pressuposição de normalidade é atendida. Sua estatística de teste é da forma:
em que.
Com o auxílio do software R para ajustar o modelo apropriado, considerou-se como variável dependente o valor unitário do imóvel, sendo que as variáveis dependentes foram: localização, n° de pavimentos no prédio, quantidade de elevadores no prédio, padrão de acabamento, conservação, idade estimada das edificações, número de apartamentos por pavimento do bloco, área privativa, andar, estacionamento coberto, estacionamento descoberto, número de quartos, quantidade de suítes, banheiro Social, varanda / sacada, e vista panorâmica.
Durante as análises, percebeu-se que algumas variáveis regressoras precisavam ser transformadas em variáveis qualitativas (dummy), pois ambas ao serem consideradas como quantitativas, estavam interferindo negativamente para o ajuste do modelo. São elas:
Posteriormente, através do método de Stepwise e pela análise de variância, selecionamos as variáveis que eram significativas para o modelo. Com a técnica do stepwise, descartou-se as variáveis número de apartamentos por pavimentos (aptosporpavimentos), andar, quantidade de banheiro social (bansocial) e vista panorâmica (vistapanoramicaf). Pela análise de variância (ANOVA), observou-se que a variável varanda / sacada não era significativa para o modelo ajustado com α = 0,05. Sendo assim, a eliminamos e reajustamos o modelo.
Na tabela 1 a seguir, estão os resultados da análise de variância (teste F) aplicado ao modelo ajustado final. Pode-se perceber que todas as variáveis selecionadas foram significativas ao nível de significância de 5%.
Tabela 1: ANOVA do modelo ajustado.
Coeficientes |
Grau de liberdade (GL) |
SQ |
QM |
F |
P-valor |
localizacaof |
11 |
11269704 |
1024519 |
14,879 |
< 2*10-16 |
npavimentos |
1 |
2280772 |
2280772 |
33,123 |
2,14*10-8 |
padacabamentof |
4 |
1698501 |
424625 |
6,167 |
0,0003191 |
conservacaof |
3 |
3770115 |
1256705 |
18,251 |
2,46*10-10 |
idadeedifc |
1 |
373024 |
373024 |
5,417 |
0,0168578 |
areaprivativa |
1 |
3445573 |
3445573 |
50,04 |
1,16*10-12 |
estcobertof |
3 |
2906118 |
968706 |
14,068 |
1,66*10-9 |
quartosf |
2 |
539379 |
269689 |
3,917 |
0,0207119 |
suitef |
2 |
1195490 |
597745 |
8,681 |
0,0003422 |
Resíduos |
156 |
10206717 |
65428 |
|
|
Na tabela 2, estão os resultados das estatísticas em relação aos pressupostos de normalidade, independência e homoscedasticidade de variâncias dos resíduos, testados pelos testes de Shapiro-wilk, Durbin Watson e Breusch-Pagan, onde ambos foram atendidos a 1% de significância:
Tabela 2 – P-valores e estatística dos testes para pressuposições
Shapiro-Wilk (Normalidade) |
Durbin-Watson (Independência) |
Breusch-Pagan (Homoscedasticidade) |
0,04135 |
0,02289 |
0,1728 |
0,9848 |
1,8162 |
36,0264 |
Na figura 1, está apresentado o gráfico dos resíduos versus valores ajustados da variável resposta valor unitário. Percebe-se graficamente que não há violação do pressuposto de homocedasticidade e independência dos resíduos; nas tabela 2 e 3, averigua-se pelos gráficos que os erros seguem distribuição normal, o que foi testado anteriormente pelos testes das pressuposições.
Figura1 – Gráfico dos resíduos x valores ajustados da variável resposta
Figura 2: Gráfico de Probabilidade Normal dos Resíduos
Figura 3: Histograma dos resíduos
Na tabela 3 estão apresentadas as estatísticas equivalentes ao modelo final para a predição do valor unitário do imóvel.
Com base na tabela 3, o modelo de regressão múltipla estimado para a predição do valor unitário é:
ŷ = β0 + β1x1 + β2x2 + β3x3 + β4x4 + β5x5 + β6x6 + β8x8 + β10x10 + β12x12 + β13x13
Sendo que, as variáveis dummy’s assumirão os respectivos valores de acordo com as características do imóvel (conforme valores estimados na tabela 3). No presente trabalho, calculou-se o valor predito para o imóvel com as seguintes características: localizado no bairro Santa Mônica, com localização classificado como 80, 4 pavimentos no prédio, sem elevador, padrão de acabamento 4, conservação com classificação 6, idade inferior a um ano (zero), área privativa de 44m2,situado no segundo andar, com um estacionamento coberto, 2 quartos, e 1suíte.
ŷ = 3528.683 + 309.313 + 33.561*4 + 92.674*0 - 97.414 + 181.915 - 10.728 - 15.952*44 + 111.903 + 180.664 - 86.653 = R$3240,72
Comparando-se com o valor que foi vendido no mercado, o mesmo foi no preço unitário de R$ 3750,00, ou seja, o valor predito foi próximo ao valor vendido no mercado. Vale ressaltar que deverá ser levado em consideração no ato da venda do imóvel o cenário econômico do país no determinado período.
Observou-se, a partir das estimativas do modelo, que as variáveis padrão de acabamento (dummy 5) e área privativa possivelmente estão associadas a alguma(s) outra(s) variável(s), uma vez que, tanto em relação à variável padrão de acabamento, quanto à área privativa, espera-se que quanto maior o padrão de acabamento, mais valorizado torna-se imóvel, o que é recíproco para a área privativa, ou seja, quanto maior o m2, maior será o valor unitário do mesmo na prática, sendo que isso não condiz com o que foi estimado no modelo. Estudos aprofundados poderão ser realizados para averiguação acerca dessas variáveis.
Em relação às variáveis localização, número de pavimentos no prédio, quantidade de elevadores no prédio, conservação, estacionamento coberto, quantidade de quartos, e quantidade de suítes, ambas contribuem positivamente em relação ao preço unitário do imóvel, ou seja, auxiliam para o aumento do valor. Em contrapartida, a variável idade estimada da edificação contribui de forma negativa para o cálculo do valor unitário, sendo que quanto mais antigo for o imóvel, menor a sua valorização.
Tabela 3: Estimativas do modelo
Parâmetro |
Estimativa |
Erro padrão |
t |
p-valor |
Intercepto |
3,528,683 |
288,585 |
12,228 |
2*10-6 |
localizacaof55 (x1) |
138,149 |
157,279 |
0,878 |
0,381094 |
localizacaof60 (x1) |
-25,499 |
144,003 |
-0,177 |
0,859683 |
localizacaof65 (x1) |
41,575 |
141,203 |
0,294 |
0,768815 |
localizacaof70 (x1) |
107,949 |
149,124 |
0,724 |
0,470216 |
localizacaof75 (x1) |
-202,234 |
149,442 |
-1,353 |
0,177928 |
localizacaof80 (x1) |
309,313 |
143,236 |
2,159 |
0,032342 |
localizacaof85 (x1) |
409,306 |
158,48 |
2,583 |
0,010722 |
localizacaof88 (x1) |
351,033 |
217,096 |
1,617 |
0,107911 |
localizacaof90 (x1) |
741,605 |
152,615 |
4,859 |
2,84*10-6 |
localizacaof95 (x1) |
1,366,845 |
293,765 |
4,653 |
6,94*10-6 |
localizacaof98 (x1) |
1,019,195 |
302,87 |
3,365 |
0,000963 |
npavimentos (x2) |
33,561 |
11,568 |
2,901 |
0,004254 |
qtdeelevadorpredio(x3) |
192,674 |
56,495 |
3,41 |
0,000826 |
padacabamentof2 (x4) |
-303,337 |
226,336 |
-1,34 |
0,182126 |
padacabamentof3 (x4) |
-282,749 |
206,843 |
-1,367 |
0,1736 |
padacabamentof4 (x4) |
-97,414 |
196,3 |
-0,496 |
0,620418 |
padacabamentof5 (x4) |
-462,976 |
235,061 |
-1,97 |
0,050655 |
conservacaof3 (x5) |
-181,824 |
182,886 |
-0,994 |
0,321669 |
conservacaof5 (x5) |
104,539 |
158,725 |
0,659 |
0,511111 |
conservacaof6 (x5) |
181,915 |
164,565 |
1,105 |
0,270676 |
Idadeedifc (x6) |
-10,728 |
5,521 |
-1,943 |
0,053797 |
areaprivativa (x8) |
-15,952 |
1,764 |
-9,042 |
5,71*10-16 |
estcobertof1 (x10) |
111,903 |
52,56 |
2,129 |
0,034819 |
estcobertof2 (x10) |
290,451 |
83,973 |
3,459 |
0,0007 |
estcobertof3 (x10) |
1,662,337 |
279,067 |
5,957 |
1,65*10-8 |
quartosf2 (x12) |
180,664 |
118,263 |
1,528 |
0,128626 |
quartosf3 (x12) |
361,463 |
132,389 |
2,73 |
0,007056 |
suitef1 (x12) |
-86,653 |
54,33 |
-1,595 |
0,112749 |
suitef2 (x12) |
634,832 |
196,531 |
3,23 |
0,001509 |
Neste trabalho foi possível estimar o preço unitário de um imóvel (apartamento) a partir da regressão linear múltipla. Com o andamento do estudo, percebeu-se a necessidade de criar as variáveis dummy pra algumas variáveis para prosseguimento das análises, sendo que foi percebida uma excelente melhora no ajuste do modelo. O modelo de regressão predito apresentou 73,45% da variação total (coeficiente múltiplo de determinação), o que é considerado um bom ajuste em um modelo de regressão linear múltipla. Estudos mais aprofundados poderão ser realizados para que seja averiguado em relação às variáveis que apresentaram problemas nas estimativas, no qual suspeita-se de que ambas estão tendo uma associação com alguma outra variável do modelo.
[1] BAPTISTELA, M. O uso de redes neurais e regressão linear múltipla na engenharia de avaliações: Determinação de valores venais de imóveis urbanos, Curitiba-PR, 2005.
[2] BREUSCH T.S. & PAGAN A.R. (1979), A Simple Test for Heteroscedasticity and Random Coefficient Variation. Econometrica 47, 1287–1294.
[3] CHARNET, R; FREIRE,C.A.D.L; CHARNET, E.M.R; BONVINO, H. Análise de modelos de regressão linear com aplicações. 2. ed. Campinas, SP: Unicamp, 2008.
[4] DANTAS, R. A. Engenharia de avaliações: uma introdução à metodologia científica. 3 ed. São Paulo: Pini, 2011.
[4] DRAPER, N.R.; SMITH, H. Applied regression analysis. 3. ed. New York: John
Wiley e Sons, 1998. 706p.
[6] GONZÁLEZ, M. A. S. A engenharia de avaliações na visão inferencial. 1 ed. São Leopoldo, RS: Unisinos, 1997.
[7] GUJARATI, D. N. Econometria Básica. 3 ed. São Paulo: Markon Books, 2005.
[8] MEYER, R. M. C. Avaliação de imóveis: Uma análise no campo da engenharia legal. 1 ed. Rio de Janeiro: Lumen Juris, 2003.
[9] Nbr-14653-1:2001 – “Avaliação de bens parte 1: Procedimentos gerais.” ABNT
[10] Nbr-14653-2:2011 – “Avaliação de bens parte 2: Imóveis urbanos.” ABNT
[11] TRIOLA, M. F. Introdução à Estatística. 10 ed. Rio de Janeiro: LTC, 2008.