SIAI Yearbook – 2023

Bohyun Yoo (MBA, 2023)

Estimated reading: 2 minutes 215 views
160X600_GIAI_AIDSNote

최근 부동산 시장이 심상치 않다. 전 세계적으로 긴축 기조가 시작됨에 따라, 전문가들 사이에서는 코로나19 이후 통화 완화 정책으로 엄청난 유동성 수혜를 봤던 국내 부동산 시장의 ‘거품’이 꺼지면서 실물시장 충격에 대비해야 하는 것 아니냐는 우려가 나온다. 작년 말부터 미국을 포함한 주요국 중앙은행을 중심으로 인플레이션을 대비하기 위해 기준금리 인상이 지속되고 있는 가운데, 이에 따라 주택가격이 하락하면서 가계의 순자산 감소 및 부동산 개발업자들의 손실 확대로 이어져 종국적으로는 경기 침체로 확산할 우려가 있다는 것이다.

Ⅰ. 글로벌 유동성과 주택 가격 급등

한편 일각에서는 부동산 시장에서는 ‘거품’을 오히려 역이용해 ‘수익 기회’를 포착하려는 투자자들의 움직임도 존재한다. 예컨대 일부 투자자들은 조만간 부동산 가격이 꺼질 것이라는 예측에 저가 매수로 시세 차익(capital gain)을 기대하기도 하며, 공정 가격에 수렴하지 않았다는 전제하에 차익 거래(arbitrage) 기회를 도모하기도 한다. 즉 ‘위기’를 ‘기회’로 전환하는 셈이다. 따라서 이들에게 현재 시점의 부동산 가격이 본질 가치보다 할인(discount), 또는 할증(premium)돼 있는지 확인하는 작업은 무엇보다도 중요할 것이다.

아울러 주택담보대출을 주 사업으로 영위하는 금융기관 입장에서도 여신 사업의 흥망성쇠를 결정하는데 부동산 시장을 분석적으로 바라보는 작업은 매우 중요할 것이다. 본 연구에서는 부동산 시장, 그중에서도 부동산 경매 시장에서 ‘거품’을 왜 탐색해 내야 하는지, 그리고 어떻게 수학・통계적으로 ‘거품’을 탐색할 수 있는지 살펴본다.

부동산 경매 시장이 중요한 이유

우리나라 부동산 경매 시장에는 다양한 이해 관계자들이 참여하고 있다. 실수요 목적으로 경매 시장을 찾는 개인들, 차익 거래를 노리는 투자자들, 담보 대출을 다루는 금융 기관들과 부실 채권 사업자 등 많은 플레이어가 각기 다른 목적으로 참여하고 있으며, 특히 아파트 경매 시장은 그 관심도에 걸맞게 매매 시장과의 뚜렷한 가격 차이를 보기 어려울 정도로 활성화돼 있다.

이중 금융 기관과 경매 시장은 어떻게 연결돼 있는 것일까. 우리나라는 대출이 실행된 부동산에서 채무 불이행이 발생할 경우 국가에서 관리하는 법원 경매 또는 공매에서 처리하게끔 돼 있고, 금융 기관은 채무 불이행이 발생한 담보물을 경매로 처분하여 대출금을 회수하게 된다.

따라서 금융 기관들이 대출 한도를 결정하는 데 있어 중요한 요소 중 하나는, 채무 불이행이 발생했을 때 경매 시장에서 얼마큼의 원금을 회수할 수 있느냐에 따라 달려있다. 특히 주택담보대출비율(LTV) 제한을 받지 않는 핀테크(P2P lending)와 저축은행, 캐피탈 등의 2금융권은 그 중요성이 더 크다고 볼 수 있다.

또한 대부분의 금융기관의 주택 담보 대출의 비중이 굉장히 큰 편이므로 결국 안전한 한도 내에서 최대한 많은 금액을 대출하는 것이 매출 측면에선 가장 이상적인 형태가 된다. 아울러 주택담보대출 한도를 새롭게 갱신하는 금융 기관의 경우 경매 시장의 동향은 의사 결정 시 매우 중요한 지표가 된다.

가격이 아닌 시장을 보기 위해선

그러나 이를 위해 경매 시장을 살피는 것은 그리 간단치가 않다. 예를 들어 특정 시점에 서울 어느 지역에서 발생한 아파트 경매의 낙찰 가격이 일반 매매 시세보다 할인(또는 할증)되어 낙찰됐을 것이라는 짐작은 누구나 할 수 있다. 약간의 권리 분석을 동반한다면 보수적인 한도 측정은 그리 어려운 일이 아닐 것이다.

그러나 이를 하나의 경매 물건을 보는 미시적 관점이 아니라, 시장 자체의 움직임을 거시적으로 살피고자 한다면 분석의 관점을 바꿔야 한다. 예를 들어 주식 시장에서 삼성전자의 주가 흐름을 보는 것은 어려운 일이 아니다. 지난 1년의 주가 흐름을 분봉 단위까지 확인할 수 있다. 하지만 부동산의 경우 어느 지역 어느 단지의 301동 301호의 경매 건은 매월 발생하지 않는다. 범위를 단지로 확장해도 동일하다. 더 이상 가격 단위로 시장을 바라보는 것은 불가능하다는 것이다. 이 때문에 부동산 시장의 분석은 주식처럼 [시간 – 가격] 단위가 아닌 [시간 – 지역(공간)] 단위로 관점을 바꿔야 한다.

경매 낙찰가율 지표의 오류

일반 매매 시장에 아파트 매매 지수와 같은 시계열 지표가 있듯, 경매 시장에는 낙찰가율이라는 지표가 있다. 이는 매월 해당 지역 법원에서 공표되는 지표로 해당 지역에서 발생한 경매 건들의 낙찰가와 법원 감정가의 비율을 나타낸다. 예컨대 법원 감정가가 10억원이고, 낙찰가가 9억원인 경우의 낙찰가율은 90%가 된다.

일반적으로 법원 감정가는 시세로 간주하므로, 낙찰가율이란 시세 대비 낙찰 가격의 비율을 표현한 것이라고 볼 수 있다. 이때 낙찰가율을 지역에서 발생한 합계 건으로 계산하면 우리는 결국 해당 월에 발생한 경매 건들의 시세 대비 평균적인 낙찰가 비율을 확인할 수 있게 된다.

그러나 이 지표는 대단히 큰 오류를 가지고 있다. 법원 감정가는 경매가 발생한 시점에 책정된 가격이고 낙찰 가격은 낙찰 시점에 발생한 가격이다. 평균적으로 경매에 드는 시간이 7개월~11개월 정도라는 것을 감안했을 때, 그 시간 간격 동안 시세가 급락하거나 급등하게 된다면 지표는 오류를 가질 수밖에 없다. 예를 들어 최근 시세 급등기의 뉴스 등에서 서울의 낙찰가율이 120%를 넘었다는 등의 소식을 종종 들을 수 있었는데, 경매 낙찰 가격이 일반 시세 대비 1.2배나 더 높았다는 건 얼핏 이해하기가 어려울 것이다. 이는 앞서 언급했듯 실제로도 잘못된 정보다.

경매 진행 기간 (평균 7~11개월) 동안 매매 시세가 급등했다고 가정해보자. 입찰자는 낙찰 시점의 매매 시세를 기준으로 입찰을 하고, 법원 감정가는 경매 시작 시점에 고정돼있다. 결국 분모에 해당하는 법원 감정가가 현재 시세 대비 상대적으로 낮아지게 되고 결국 120%라는 일종의 착시 효과가 발생한 셈이다. 즉 낙찰가율을 액면 그대로 해석하는 것은 부동산 관련 의사 결정에 도움이 되지 못하거나 되레 큰 오류를 가져다 줄 수 있다는 것이다.

Ⅱ. 기존 연구의 한계점

그간 진행돼 온 기존 경매 시장 관련 연구 사례들에서도 낙찰가율 지표가 갖는 한계점을 개선하려는 시도가 존재했다. 예컨대 분모에 해당하는 법원 감정가를 매매 지수를 이용해 낙찰 시점으로 교정한 뒤 ‘진정한 낙찰가율’을 추정하는 사례들이 있었다.

그러나 이는 완벽한 해결책으로 보기에는 어렵다는 것이 업계의 공통된 의견이다. 만약 서울 지역의 진정한 낙찰가율을 추정하고 싶다면 해당 기간 서울 지역에서 발생한 모든 경매 건에 대해서 법원 감정가를 교정해야 한다. 법원 감정가와 낙찰 시점은 각 경매 건마다 모두 다르고 그것도 수백 수천 건에 달하는 모든 경매 건에 대해서 연구자가 직접 교정해야 한다. 또한 지역의 범위가 확대될 경우 물리적으로 엄청난 도전이 될 수밖에 없는 데다, 이를 해낸다고 하더라도 교정치는 근사치일 뿐 정확성을 보증하지 못한다.

그렇다고 연구자의 입맛과 편의대로 경매 건을 임의로 추출(sampling)하여 낙찰가율을 재생성한다면 그것은 일종의 표본 편향(sampling bias)을 일으킬 수 있다. 우리나라 남성 평균의 키를 알고 싶은데, 키가 큰 집단에서만 표본을 추출하면 생기는 문제와 동일하다.

지금까지의 내용을 종합하면, 비즈니스 의사 결정에 필요한 것은 가격 데이터가 아니라 시장 관점의 시계열 지표이며, 경매 시장의 시계열 지표인 낙찰가율에는 오류가 존재한다. 또한 법원 감정가 교정과 같은 방법은 실제 비즈니스에서 활용하기 어려운 방식이다.

이러한 문제들은 정확히 필자 또한 실무자로서 겪었던 문제들이기도 하다. 의사 결정을 위해 시계열 분석이 필요한 와중에, 낙찰가율의 고질적 문제로 인해 이를 제대로 활용하기 어려웠던 것이다.

낙찰가격 vs 낙찰가율

여기서 확실히 해둘 점이 있다. 경매 ‘낙찰가격’을 분석하는 것과 ‘낙찰가율’을 분석하는 것은 그 의미와 목적이 분명히 다르다. 이전 글에서 언급했듯 어느 한 경매건의 낙찰 가격에 대한 분석은 전혀 문제가 되지 않는다.

예컨대 아파트로 한정 지어 설명할 경우, 경매 사건의 입찰자는 입찰 시점의 매매 시세를 기준으로 입찰한다. 입찰 시점과 최종 낙찰 시점의 간격을 1~2달 정도라고 한다면, 부동산 자산의 특성을 감안하여 매매 시세가 주식처럼 한 달 사이 큰 폭의 널뛰기를 하지 않는다고 했을 때 낙찰 가격 자체는 낙찰 시점의 1~2달 전 시세에서 큰 변동 범위를 보이지 않는다는 것이다. 또한 초등학교까지의 거리, 층수, 브랜드 같은 매매 시세에 영향을 준다고 흔히 알려진 요인 등은 이미 아파트 매매 시세 자체에 반영돼 있을 확률이 높기 때문에 경매 낙찰가격에서 유의한 변수로 작용할 가능성은 작다고 볼 수 있다.

대부분의 부동산 경매 관련, 특히 아파트 경매 시장에 대한 기존 연구들은 ‘낙찰 가격’ 자체를 얼마나 정교하고 미세하게 예측하느냐와 유의한 요인이 무엇인지에 초점을 두고 있지만, 실제 비지니스에서 가격 예측에 대한 문제는 언급한 대로 큰 논의의 대상이 아니다.

실제로 간단한 회귀 분석(regression)을 수행해 봐도 낙찰 가격과 낙찰 시점의 1~2달 전 KB시세의 R-squared 는 95%가 넘고 비선형 관계를 갖지도 않는다. 또한 미래 시점의 추세 예측이 필요하다면 시계열 분석으로 형태가 바뀌어야 한다.

시간에 따라 변하는 할인/할증

긴 서론 끝에 본론으로 들어가 보자. 경매 시장을 분석하고 싶다. 그러나 시작도 하기 전에 데이터 자체에 큰 오류가 있고, 이를 일일이 교정하는 등의 방법은 적어도 업계에선 한계가 있다. 다른 방법이 필요한 것이다. 그럼 어떤 다른 방법을 쓸 수 있을까? 그 다른 방법을 사용한 분석을 통해 무엇을 알아낼 수 있을까?

이것이 본 연구 핵심 주제이자 배경이다. 실무에서 겪었던 난공불락(?) 이라 여겨지던 비지니스 문제 중 하나를 해결하기 위해 통계학이라는 도구를 사용한 것이다.

아울러 그 도구를 활용해서 시장에서 찾고자 한 것은 바로 매매 시장과 경매 시장의 차이이다. 이때 ‘차이’란 결국 경매 시장이 매매 시장 대비 갖는 할인/할증으로 표현할 수 있고, 나아가 시계열 분석이 꼭 필요한 이유는 할인/할증 요인이 시간(경기나 시장 국면)에 따라 유동적으로 변할 것이기 때문이다.

경매 시장의 할인/할증 요인

주택 경매의 할인/할증 요인에 대한 기존 연구는 꽤 다양한 편이다. 그러나 해외 및 국내 연구는 앞서 서술했듯 시장 관점이 아닌 가격 관점의 분석이 주를 이루고 있어 부동산 자체의 거시적 흐름을 파악하는 데 어려움이 있다. 이를테면 주로 몇 년 동안 발생한 경매 사건들을 취합해 법적 권리 이슈 등의 요소들을 제거하고 난 뒤, 매매 시장 가격과 비교하여 할인/할증이 있었고, 그 원인은 ‘무엇무엇’으로 추정된다는 스토리이다.

또한 해외에서 진행된 연구의 경우 사설 경매가 허용되고 호가제를 주로 채택하고 있어 우리나라에 직접적인 적용이 어렵다는 단점이 있다. 한편 국내 기존 연구의 경우 존재하는 소수 연구 역시 시장 관점의 분석은 전무한 실정이다. 앞서 언급했듯, 할인/할증 요인이 실존한다면 그 요인은 시간(경기 또는 시장 국면)에 따라 변한다고 가정하는 것이 합리적이다.

문제는 ‘데이터 확보’

경매 시장에 매매 시장 대비 할인/할증 요인이 존재한다고 가정해 본다면, 낙찰가율을 아래와 같이 재구성할 수 있을 것이다.

\[ Auction Sale Rate_{t} = \frac{\sum Market Price_{t} \pm Premium_{t}}{\sum Appraisal Price_{t-n}} \]

이번에는 위 낙찰가율의 3가지 요소를 영향 단위로 해석해 선형 회귀식(linear regression model)으로 바꿔보면 아래와 같다.

\[ Auction Sale Rate_{t} = \beta_{0} + \beta_{1} EoM_{t} + \beta_{2} EoA_{t} + \beta_{3} EoP_{t} \]

  • EoM : Effect of Market Price 일반 매매 시장 영향
  • EoA : Effect of Appraisal Price 법원 감정가 영향
  • EoP : Effect of Price Premium 가격 할인/할증 영향

회귀식을 완성하기 위해선 총 3가지 변수에 해당하는 데이터가 필요하고, 이중 매매시세 영향은 한국부동산원에서 제공하는 매매지수로 대체가 가능하다. 이때 매매지수를 낙찰가율과 동일한 형태로 맞추기 위해 로그(log) 차분으로 변형돼야 함을 밝힌다.

그러나 남은 두 변수의 경우 데이터 확보가 현실적으로 어렵다는 문제가 있다. 첫 번째로 법원감정가 연구 데이터로 확보하는 것은 현실적으로 불가능하다. 법원감정가의 영향이란 과거 시점의 ‘법원감정 가격’을 의미하는 것이 아니라, 각 분석의 시점(통상적으로 월 단위)에서 법원 감정가격이 얼마나 영향을 주었는지를 의미한다. 즉 낙찰 시점으로 교정된 법원 감정 가격 데이터가 필요한 것이다. 그러나 이는 최근 10년간 전국의 모든 경매 건에 대해서 비싼 비용을 들여가며 전산화하는 과정을 거치지 않고서는 사실상 불가능하다고 봐야 한다. 두 번째로 할인/할증 영향의 경우 당장 눈에 보이지도 않는 요인을 외부 데이터에서 찾는 것은 불가능하다.

Ⅲ. 푸리에 변환 – 요인 분리·추출

시끌벅적하게 섞인 음성 속에서 어떻게 특정 남자 목소리만을 분리할 수 있을까? 이때 활용되는 것이 ‘푸리에 변환’이다. 푸리에 변환은 입력 신호를 시간 영역에서 주파수 영역으로 전환하여 모든 개별 주파수를 독립적으로 분리해 낸다. 그리고 그 주파수를 다시 신호 시간 영역으로 전환하면 (역 푸리에 변환) 고유의 음성을 찾을 수 있고, 그 음성만 남겨놓고 다른 요소를 0으로 만드는 형태로 노이즈 필터링(제거) 을 할 수 있다.

위와 동일한 맥락으로 낙찰가율을 시끌벅적하게 섞인 입력 신호로 본다면, 그 속에서 낙찰가율을 구성하는 요인들을 독립적으로 분리해 낼 수 있다. 이를 위해 먼저 위 그림과 같이 낙찰가율에서 매매시세 영향을 회귀식으로 제거해 주고 남아있는 잔차항(residual term)에 법원감정가와 할인/할증요인이 숨겨져 있다고 가정해보자. 이후 잔차에 남아있는 수많은 요소 중 가장 큰 영향력(strongest amplitude)을 가진 두 가지 요인이 바로 법원 감정가 및 할인/할증이라고 가정해 볼 수 있고, 이때 푸리에 변환으로 두 가지 독립 신호를 추출할 수 있다.

변수추가 Coef R2 변화 논문이야기 윤보현
Table 1. 변수추가 시, 회귀계수와 $R^2$ 변화

이러한 가정이 실제로 유의함을 통계적으로도 검증할 수 있다. 위 표에서도 확인할 수 있듯, 푸리에로 뽑아낸 두 가지 컴포넌트와 시세 데이터까지 초기에 가정한 회귀식의 3가지 변수만으로 낙찰가율을 회귀한 결과, 수정결정계수(adjusted R-squared) 기준 약 94%가 설명됨을 확인할 수 있다. 다시 말해 경매 시장이 실제로 3가지 변수(매매시세, 법원감정가, 할인/할증)로 설명된다는 것이다. 한편 푸리에 변환 추출 후 남은 잔차의 ACF/PACF plot(아래 그림)에서도 더 이상의 유의한 패턴은 존재하지 않는 것으로 확인됐다.

ACF PACF Plot 논문이야기 윤보현
Figure 1. ACF/PACF Plot (Residual에 유의미한 패턴 없음)

위 푸리에 변환을 통해 필자는 낙찰가율이 시계열 데이터로서 갖는 한계점과 외부 데이터 동원이 힘든 문제점 모두를 해결할 수 있었다. 또한 실제로 남은 두 가지 요인(법원감정가,할인/할증) 을 매매 시세 영향을 제거한 뒤의 잔차에서 추출할 수 있었다.

한편 주식, 채권 시장 등의 일반적 자산 시장 데이터에 푸리에 변환을 사용하는 것은 위험한 일임을 밝힌다. 푸리에 변환은 일정한 주기를 갖는 형태에만 사용할 수 있기 때문이다. 반면 낙찰가율 데이터는 집 값 시세나 매매 지수와 같이 지수 형태로 상승하는 데이터가 아니라, 경기 및 시장 국면에 따라 80~120% 사이의 움직임을 반복하는 주기성(cyclic) 데이터에 해당하므로 위 과정을 오류 없이 수행할 수 있었던 것이다.

법원감정가 추출

푸리에 변환을 통해 추출한 두 가지 요인이 실제로 법원감정가와 할인/할증 요인인지는 아직까진 연구자 가정에 의한 추정일 뿐이다. 따라서 해당 두가지 요인이 실제 법원감정가와 할인/할증 요인으로 연결되는지 정확하게 검증할 필요가 있다. 먼저 법원감정가의 경우 기존의 개별 경매 사례 (약 2,600건)을 통해 아래 두 가지를 분석했다.

  • 법원 감정 시점과 낙찰 시점의 평균적인 시간 간격
  • 법원 감정 시점에서 KB시세 (매매시세)와의 관계

법원감정 시점과 낙찰 시점의 시간 간격은 25% ~ 75% 범위 내에서 약 7개월 ~11개월의 간격을 갖는 것으로 확인됐고, 법원감정 시점에서 법원감정가-KB시세 상호 간의 관계는 Beta 계수 1.03 으로 거의 차이가 없는 것으로 나타났다. 필자는 두 가지 분석 결과를 종합해서 다음과 같은 결론을 얻을 수 있었다.

  • 법원감정가와 매매 시세는 Lag 관계가 있다. (lag = 시간 간격)
  • 매매 시세의 lag 변수가 법원감정가를 대체할 수 있다.

회귀 분석 결과 매매 지수의 lag 변수와 법원 감정가는 약 54%의 설명력을 갖는 바, 푸리에 변환으로 추출한 법원감정가 컴포넌트는 실제 법원감정가로서 기능을 할 수 있다는 것을 검증할 수 있었고, 두 번째로 lag 변수와 법원감정가 컴포넌트 중 각각 낙찰가율을 얼마나 잘 설명하는지를 대조했을 때 법원감정가 컴포넌트(50%)가 lag 변수(20%)보다 더 우월한 설명력을 보인다는 것을 확인할 수 있었다.

할인/할증 추출

이번에는 본 연구의 핵심인 할인/할증 컴포넌트에 대한 검증을 두 가지 측면에서 진행해 본다. 첫 번째로 푸리에 변환으로 추출한 할인/할증 컴포넌트가 그 기능을 할 수 있는지, 두 번째는 그 할인/할증 컴포넌트의 정체가 무엇인지다.

검증을 위해 할인/할증 컴포넌트가 일종의 on/off 효과를 낼 수 있도록 시그모이드(sigmoid) 함수 처리를 했고 (0/1) on/off에 따라 낙찰가율 데이터를 평균과 분산이 다른 두 개의 분포로 나뉠 수 있다는 것을 확인하여 그 기능을 할 수 있다는 것을 아래 그림과 같이 검증했다.

낙찰가율과 시그널
Figure 2. Auction Sale Rate : 낙찰가율, SIG2 = 할인/할증 컴포넌트 (by 푸리에)

또한 이 컴포넌트의 정체가 무엇인지 통계청 등지에서 동원할 수 있는 많은 데이터와 대조를 시도하였으나 비슷한 움직임을 갖는 데이터는 찾을 수 없었다. 이에 대한 이유는 생각보다 간단했다.

낙찰가율 차분값 논문이야기 윤보현
Figure 3. 낙찰가율의 전월/전전월 차분값 (= v1,v2) vs 할인/할증 컴포넌트 (= SIG 2)

경매 시장은 매매 시장 대비 종속적인 위치를 갖는다. 우리가 알고 있는 거시 경제 변수들은 매매 시세(집값)을 구성하는 요인일 가능성이 크고, 매매 시세 영향은 이미 회귀식에서 제거된 상태이기 때문에 결국 남은 변수들은 매매 시세와 독립적인 경매 시장만의 변수일 가능성이 높은 것이다. 결국 그렇게 찾아낸 비슷한 움직임을 갖는 변수는 위 그림에 해당하는 낙찰가율의 전월, 전전월 차분 값이다.

Ⅳ. 할인/할증의 정체는

지금까지의 분석 결과를 정리해 보면 다음과 같다. 낙찰가율에서 매매 시세와 법원 감정가 영향을 제외하고 난 뒤의 요인이 할인/할증 요인인데, 이러한 할인/할증 요인은 전월과 전전월의 차분값(변동성)과 비슷한 움직임을 보인다.

또한 위 논의를 바꿔 말하면 다음과 같다. 과거 차분값(변동성)이 두 가지 요인인 ‘매매시세’ 및 ‘법원 감정가’로 미처 설명되지 않는 부분을 추가로 설명하고 있음을 고려하면, 경매 시장에는 할인/할증 요인이 존재하되 그 원인은 변동성(과거 낙찰가율의 차분값)이라는 것이다. 후술하겠지만, 필자는 이러한 할인/할증 컴포넌트가 일종의 추세를 설명할 수 있는 요인이라는 판단하에 ‘모멘텀 팩터’로 명명했다.

모멘텀 팩터의 ‘군집 특성’

칼만 필터에서의 상태공간(state-space)에서는 회귀 계수(beta)가 시간에 따라 변한다는 것을 바탕으로 한다. 이때 시간에 따라 변하는 회귀 계수의 움직임을 추적하면 시간대별로 해당 변수가 종속 변수에 ‘얼마만큼’의 영향을 미치는지에 대한 ‘민감성'(Sensitivity)을 확인할 수 있다.

우리가 흔히 수행하는 회귀분석의 최소자승법(Ordinary Least Square, OLS)는 회귀 계수(beta)가 고정돼 있다고 가정한다. 그러나 필자는 ‘모멘텀 팩터’의 특성을 더 자세히 분석하기 위해 회귀 계수가 시간에 따라 변화하는지 확인하기 위해 칼만 필터(Kalman-Filter)를 활용했다.

분석 결과, 아래 그림과 같이 특정 구간에서 모멘텀 팩터의 회귀 계수가 매매 시세 회귀 계수를 초과하는 것을 확인할 수 있다. 그리고 이 초과하는 구간을 확인해보면 모멘텀 팩터는 일종의 군집 현상을 갖는 것을 볼 수 있다.

매매시세 VS 할인할증 논문이야기 윤보현
Figure 4. 매매시세 VS 할인/할증
민감성 초과구간 논문이야기 윤보현
Figure 5. 시변계수(Time varying coefficient) (매매시세 vs 할인/할증) (상) , 민감성 초과구간 Plot (하)
모멘텀 팩터의 진정한 의미

앞서 살펴본 ‘모멘텀 팩터의 민감성이 매매 시세를 초과하는 구간’에 대해 조금 더 깊게 생각해볼 필요가 있다. 모멘텀 팩터는 할인/할증을 설명하는 요인이다. 따라서 낙찰가율을 구성하는 할인/할증 요인이 평소보다 더 민감하게 작용했다는 것은, 매매 시장과 경매 시장이 평소 가지고 있던 ‘평균적인 관계’에 금이 갔다는 뜻으로도 해석할 수 있다.

‘평균적인 관계에 금이 갔다’라는 것은 구체적으로 무엇을 의미하는 걸까? 매매 시장과 경매 시장이 평소 만약 10이라는 이격을 유지하는 관계라고 가정해 보자. 평균적 관계에 금이 간 상황은 이 이격이 5로 줄어들었거나 15로 증가한 것을 의미한다. 위의 대표적인 상황은 부동산 시장이 과열됐거나 과냉된 상황, 혹은 그런 상황이 만들어지기 직전 정도가 될 것이다. 다시 말해 너도나도 집을 구매하려는 시기엔 자연스럽게 ‘평균 관계를 깨뜨리는’ 과열이 생길 수 있고, 이를 경매 시장의 ‘인기도’라고 해석할 수 있다.

그러나 위의 해석에 있어 한 가지 유의해야 할 사항이 있다. 위 분석 결과에서 나타나듯 일반적으로 매매 시장이 하락하면 경매 시장 또한 덩달아 하락한다. 이는 경매 낙찰가율의 변화를 견인하는데 가장 큰 영향력을 행사하는 요인이 ‘매매시세’임을 감안하면 당연한 현상이다. 즉 시장에 하락이나 상승이 발생했을 때, 모멘텀 요인이 작동하지 않더라도 매매 시장 영향에 따라 경매 시장도 오르고 내릴 수 있다는 것이다. 다시 말해 ‘모멘텀 팩터의 발동’이 반드시 시세 상승/하락을 의미하지는 않는다는 것이다.

한편 할인/할증 요인은 결국 매매 시세의 영향 + ‘@’로 정의된다. 이때 할인/할증 요인의 민감성 분석 결과는 ‘@’이 ‘평균 이상의 과도한 움직임’을 보일 때를 움직인다. 필자는 이러한 할인/할증 요인이 시장 심리 또는 추세 변화를 감지하는 역할을 수행할 수 있을 것이라 판단해 ‘모멘텀 팩터’라고 명명한 것이고, 실제 위 그림에서 보다시피 모멘텀 팩터의 군집 기간을 전후로 시장 추세가 변한 것을 확인할 수 있다.

또한 모멘텀 팩터가 평균 이상의 과도한 움직임을 보일 때, 이를 ‘버블 징후’ 또는 ‘냉각 징후’로도 생각할 수 있다는 점을 조심스럽게 제시한다. 이에 대한 탐구는 본 [논문이야기]의 범주를 초과하므로 더 이상의 논의는 하지 않으나, 이에 대한 추가 연구로서의 가치는 충분할 것으로 보인다.

V. 기술보다는 논리에 초점

위 주제로 논문을 쓰게 된 이유는 실제로 전공이 부동산이거나 전문 분야라서는 아니다. 최근 몇 년간의 업무 대부분은 데이터 기반 의사 결정을 할 수 있도록 기존 시스템을 하나씩 바꿔나가는 것이었고, 그 중 하나가 대출 심사였으며, 또다시 그중 하나가 부동산 관련된 것이었다.

데이터 사이언스에 대한 정의가 개개인 마다 다르다는 것은 잘 알고 있다. 하지만 필자의 경우 데이터 사이언스 분야는 비지니스 문제 해결을 위한 도구로써 최상의 조건을 가질 수 있었다. 이에 따라 논문의 주제도 실무에서 난공불락이라 여겨졌던 주제를 택했고, 그 해결을 위해 학교에서 습득한 지식을 적극 활용하고자 했다.

필자가 본 논문을 통해 어필하고 싶은 부분은 기술적 측면이 아닌 논리적 측면이다. 실제 논문에서 사용된 기술은 회귀분석(Regression), 푸리에 변환(Fourier transformation), 칼만 필터(Kalman Filter) 정도로, 이공계 대학원 이상 레벨의 특별히 어려운 테크닉은 사용되지 않았다. 물론 해석이 중요한 금융 데이터에서 ML/DL 등의 비선형 패턴 매칭(Non-linear pattern matching)을 무분별하게 사용할 수 없다는 인센티브도 존재했으나, 필자에게 있어서 기술은 문제에 걸맞은 방법이 필요했을 뿐, 그 이상은 필요 없었다. 그보다 더 중요한 건, 어떻게 이 문제를 논리적으로 해결해 나가고 풀어나갈 것이냐에 달려있었다.

도구로서 작용할 때 이상적이라고 했던 것은 바로 이 지점을 언급한 것이다. 적어도 비지니스 문제 해결을 위해서는 논리가 우선이고 기술은 도구라고 생각한다. 이 것이 나만의 이상적인 형태이고, 그래서 논문의 컨셉을 불필요함이 없이 간결하면서도 논리적으로는 탄탄함을 추구하는 그런 형태를 유지하고 싶었다.

비지니스와 연구 사이의 이격

논문의 주제를 탐색할 무렵, 필자는 ‘어떤 문제를 해결해 볼까’는 마음가짐으로 리서치를 진행했던 것으로 기억한다. 문제 해결에 집착 아닌 집착을 하게 된 이유는, 짧은 경험에서 비롯된 편견이겠으나 비지니스와 연구 세계에 좁혀지지 않는 이격이 있다고 봤기 때문이다.

필자는 실무자로서, 아직 대부분의 분야에서 의사 결정의 대부분은 데이터보단 사람의 주관에 기대는 경향이 크다고 생각한다. 더불어 대부분의 업계에서 데이터 분석 시스템 도입의 실패를 겪고 있는 것으로 알고 있고, 필자 또한 이를 피부로 느끼던 점들이 많았다. 분야마다 사정은 각기 다르겠지만, 적어도 필자가 속한 분야는 오랜 관행의 이유도 있고, 무엇보다 이유 중 하나는 연구와 비지니스 간 괴리가 컸기 때문으로 생각했었다.

필자가 업계에서 바라볼 때, 수많은 연구 결과는 ‘실제 사용 가능성’을 배제한 채 연구 자체에만 치중하고 있다는 느낌을 지울 수 없었다. 반면 필자가 학계에서 바라본 비지니스는 통제 불가능한 변수들이 뒤섞인 현실 세계의 복잡성은 둘째치고, 사람의 주관에 의해 행해지는 것은 너무 많다는 것을 느꼈다.

비지니스와 연구 사이의 브릿지

따라서 본 논문의 진짜 의도는 미약하게나마 비지니스와 연구라는 두 개의 세계를 연결하는 것이었다. 데이터 분석이라는 것을 비지니스 문제 해결에 적극 사용하는 ‘컨셉러’가 되고 싶었던 것이다. 이에 따라 필자는 본 논문이 연구와 비지니스 그 중간 어디쯤 자리 잡고 있다고 생각한다. 또한 필자는 본 논문을 쓰는 과정에서 연구로서 호기심에 경도되지 않기 위한 내적 갈등이 굉장히 치열했으며, 이를 이겨내고 연구를 최대한 ‘현실 사용 가능성’에 맞추기 위해 큰 노력을 기울였음을 밝힌다.

논문의 결과와 퀄리티는 논문을 평가하시는 분 또는 실제 산업에서 증명될 것이지 필자가 정하는 것은 아닐 것이다. 그러나 앞으로도 또 다른 필자의 결과물들은 언제나 연구와 비지니스 그 중간 어디쯤에 위치하게 될 것 같다. 두 세계의 다리를 잇는 일은 정말 매력적인 일이 아닐 수 없다.

Share this Doc

Bohyun Yoo (MBA, 2023)

Or copy link

CONTENTS