[논문이야기] 부동산 경매시장의 버블 ⑤

통계적으로 검증한 버블 지수, '1등과 2등 간 입찰 가격 차이'
낙찰가율의 로그 모형 통한 부동산 내재 가치 배제
차우 검정 통해 버블 시점 이전, 이후 구분

[논문이야기] 부동산 경매시장의 버블 ④에서 이어집니다.

이전 글에서 필자는 부동산 경매 시장의 정량적 분석을 통해 매매 시장의 버블을 찾아낼 수 있으며, 이는 곧 경매 시장의 ‘1등과 2등 간 입찰 가격 차이’라는 지표를 통해 확인할 수 있을 것이라는 가설을 제시했다. 해당 지표의 절댓값이 크다는 것은 곧 불특정 다수의 시장 참여자의 특정 자산(부동산)에 대한 미래 가치가 오를 것이라는 기대가 큰 상황, 즉 경매 시장의 ‘버블’을 반영할 수 있다는 이유에서다.

이번 글에서는 ‘1등과 2등 간 입찰 가격 차이’가 실제로 경매 시장의 버블 지수로 작동할 수 있는지 통계적으로 검증하는 과정을 풀어본다.

강남구・노원구 데이터 선정 및 독립 변수 선택의 배경

먼저 본 논문은 2014년부터 2022년까지의 강남구 및 노원구의 분기별 거래량 추이를 데이터 활용했음을 밝힌다. 일정 수 이상의 데이터를 필요로 하는 통계 분석을 수행한다는 관점에서, 우리나라 중 거래량 및 입찰 건수가 가장 활발했던 강남구・노원구 지역이 연구에 가장 적합하다고 판단했기 때문이다.

아울러 본 논문은 부동산의 시세나 경매 낙찰가를 예측하는 기존의 연구 방법론인 헤도닉 가격 모형을 일부 차용한다. 즉 선형 회귀 모형을 기본 골자로 활용하되, 종속 변수로는 ‘보정된 낙찰가율'(y)을, 독립 변수로는 유찰 횟수(FB_NUM), 입찰자 수(BD_Num), 1등과 2등 간 입찰 가격 차이(Index_5), M2 통화량(M2)으로 설정해 변수 선택 관점에서 기존 연구와 차별점을 둔다.

위 모델의 종속 변수인 ‘보정된 낙찰가율’에 대해 설명을 덧붙이자면, 법원 감정가(통상 KB시세)를 분모로, 낙찰가격을 분자로 하는 기존 낙찰가율은 분모와 분자 간 약 7~11개월의 시간 차이(부동산 경매 시장의 할인/할증 요인 ① – 경매 낙찰가율 지표의 오류 참고)가 존재한다. 이에 본 논문은 아래 식을 통해 기존 낙찰가율의 분모인 법원 감정가를 ‘낙찰 시점’의 시세로 보정해 주는 과정을 거쳤다.

$S_p$:낙찰시점의 KB시세, $S_{p-t}$:감정시점의 KB시세

추가로 해당 회귀 모델의 독립 변수 선택에 대해 부연하자면, 첫 번째로 ‘유찰 횟수’는 경매 위험 요인을 설명하는 일종의 도구 변수(Instrumental Variable) 역할을 수행한다. 즉 유찰 횟수가 크다는 것은 통상적으로 매매가보다 낙찰가가 높게 형성되어 해당 경매 참여자들이 거래를 포기한 횟수가 크고, 이로 인해 다음 경매에서도 거래가 성사되지 않을 가능성이 높다는 뜻이다. 두 번째로 ‘입찰자 수’는 단어 그대로 해당 경매에 입찰한 사람들의 수를 의미한다. 즉 경매 시장에 시장 과열(버블)이 발생한다면 입찰자의 수도 덩달아 증가할 것이라는 점에서 ‘입찰자 수’는 ‘버블’의 후보 지표로써 이해할 수 있다. 세 번째로 ‘1등과 2등 간 입찰 가격 차이’는 앞서 수 차례 설명했으므로 재론하지 않는다. 마지막으로 ‘M2 통화량’을 모델에 추가한 것은 일반적으로 통화량이 증가하면서 부동산 시세도 급증하는 경향이 있다는 점(이전 글 – 버블이 반복되는 이유는 참고)에서 기인한다.

부동산의 내재 가치 배제 및 차우 검정의 필요성

부동산의 가격을 결정하는 요소는 다양하다. 학군, 일자리, 아파트 층수, 도로 근접성, 연식, 아파트 구조, 교통편의성 등 내재가치 판단에 고려되는 요소는 광범위하고 복잡하다. 따라서 필자는 위 낙찰가율 회귀 모형에 로그를 취해 내재 가치를 소거함으로써 본 논문의 본래 취지인 ‘경매’ 특성에만 집중할 수 있도록 했다. 세부 과정은 아래와 같다.

$V_i$:시세 가격(내재가치 포함), $X_{ik}$:부동산 내재 특성, $Z_{im}$:부동산 경매 특성, $A_i$:감정가격(시세 포함), $B_i$:낙찰가격(부동산 내재 특성 + 부동산 경매 특성)

또한 본 논문은 2014년부터 2022년까지의 기간 동안 ‘버블’ 발생에 따라 구조적 붕괴(structural break)가 발생했을 것임을 가정하고, 이를 확인하기 위해 차우 테스트(Chow-test)를 진행했다. 이는 ‘버블’이라는 시장 과열 시기가 비이성적 투자 심리로 인해 여타 시기 대비 다른 양상을 띌 것이라는 가정에서 기인한다. 이 때 차우 테스트란 시계열 자료에서 전후 데이터 세트에 대한 두 개의 선형 회귀 모델(linear regression model)의 회귀 계수(regression coefficient)를 비교해 ‘구조적인 충격 또는 변화가 있었는지’를 밝혀내는 방법이다.

차우 검정 결과, ‘1등과 2등 간 입찰 가격 차이’ = 버블지수

먼저 전체 기간의 회귀 분석을 진행한다. 앞서 언급했듯 종속 변수는 ‘보정된 낙찰가율'(y)을, 독립 변수로는 유찰 횟수(FB_NUM), 입찰자 수(BD_Num), 1등과 2등 간 입찰 가격 차이(Index_5), M2 통화량(M2)으로 한다.

전체 기간의 회귀 분석 결과 테이블

해당 분석 결과, 위 그림처럼 수정결정계수(Adj.R sqaure)는 0.774, 모든 독립 변수는 통계적으로 유의하게 나타났다. 한 가지 눈에 띄는 대목은 ‘전체 기간’의 회귀 모델에서 Index_5(1등과 2등 간 입찰 가격 차이)의 계수가 0.039로 여타 다른 독립 변수 대비 낙찰가율에 큰 영향을 주지는 않는다는 것이다.

다음으로 차우 검정을 통해 구조적 붕괴 시점을 확인해본다.

226, 321 시점에서의 구조적 붕괴(structural break)가 발생하는 것을 확인할 수 있다(좌)/구조적 붕괴 시점 이전 및 이후의 종속 변수(로그 낙찰가율)의 분포 차이(우)
차우 검정 결과, 226 및 321 시점에서 구조적 붕괴가 발생했음을 확인할 수 있다

위 두 그림을 통해 226(2016년 2분기)에서 구조적 붕괴가 존재했음을 통계적으로 확인할 수 있었다.

이번에는 더 높은 차우 검정값(chow-stat)인 226 시점을 기점으로 구조적 붕괴 이전/이후의 데이터 셋을 구분하여 두 개의 회귀 모델을 만들고, 각 회귀 모델의 결과값을 비교해 Index_5(1등과 2등 간 입찰 가격 차이, 즉 버블지수)가 유의미한 변화가 있는지 살펴본다.

구조적 붕괴 ‘이전’의 회귀 분석 결과 (상), 구조적 붕괴 시점 ‘이후’의 회귀 분석 결과 (하)

결과적으로 구조적 붕괴 이전 데이터 셋에서 Index_5(t-stat=1.67, p-value=0.1)가 유의수준 0.05 기준으로 기각됐으나, 구조적 붕괴 이후 데이터 셋에서 Index_5(t-stat=2.613, p-value=0.01)는 통계적으로 유의하게 나타났다. 이를 정리하면, 현재 가지고 있는 데이터를 차우 검정을 통해 버블 시기 이전과 이후를 분리해냈고, 실제 버블이 발생하는 지점(구조적 붕괴 시점)에 버블 지수(Index_5)가 유의미하게 증가한다는 것이다.

아래는 2014년부터 2022년 말까지 시간의 흐름에 따른 Index_5 계수의 변화를 나타낸 그림이다.

Index_5 회귀 계수의 시간 흐름에 따른 변화

위 그래프를 통해서도 index_5가 구조적 붕괴 시점인 226 근처에서 크게 출렁이기 시작하는 것을 확인할 수 있다. 특히 226 시점 이후 Index_5가 크게 증가하는 것을 확인할 수 있는데, 이는 해당 시점인 2016년 2분기 당시 저금리 기조 속에서 시중 유동자금이 강남 재건축 시장과 신규 분양시장에 몰리면서 부동산 열기가 과열된 상황이 반영된 결과인 것으로 분석할 수 있다.

(본 논문이야기는 2023년 6월 갱신됐음을 밝힙니다)